百萬年薪職位,千億美元賽道,AIGC大爆發(fā)我能怎么賺錢?
新智元報道
編輯:Aeneas 好困【新智元導(dǎo)讀】AIGC火爆出圈,攪動了全球市場。有機構(gòu)預(yù)測,2030年的市場規(guī)模將達到1100億美元。而反應(yīng)快的玩家,已經(jīng)在布局這個賽道了。
整個2022年,AIGC火成了現(xiàn)象級的詞匯。到了今年,更是有人靠著AIGC拿到了百萬年薪。
除此之外,小扎在自家平臺上官宣,Meta將組建頂級AI團隊,All in AIGC。馬斯克那邊也傳出消息,據(jù)說正忙著DeepMind挖一位叫Igor Babuschkin的大佬,成立AI實驗室,開發(fā)ChatGPT的「替代品」。大廠紛紛入局,AIGC實火。而它背后,是一個幾年后千億美元的市場。
萬物皆可AIGC
去年,紅杉資本就在研究報告中指出,到2030年,文本、代碼、圖像、視頻、3D、游戲都可以通過AIGC生成,并且達到專業(yè)開發(fā)人員和設(shè)計師的水平。到了今年,我們眼睜睜地見證了這一預(yù)測逐漸成真。比爾蓋茨說,聊天機器人等AI新技術(shù)的出現(xiàn),意義不亞于個人電腦和互聯(lián)網(wǎng)的誕生。美國銀行認為,到2030年,AI利用數(shù)據(jù)的能力會使世界經(jīng)濟增長高達15.7萬億美元,而全球的人工智能市場到2026年可能達到9000億美元。根據(jù)商業(yè)咨詢機構(gòu)Acumen Research And Consulting預(yù)測,若考慮下一代互聯(lián)網(wǎng)對內(nèi)容需求的迅速提升,2030年AIGC市場規(guī)模將達到1100億美元。
那么,AIGC的商業(yè)落地何以成為可能?
其實,靠的都是底層技術(shù)的突破。最開始,傳統(tǒng)的AI繪畫采用的是GAN,但結(jié)果輸出效果不敢恭維。直到2021年,OpenAI團隊開源了深度學習模型CLIP,以及7月出現(xiàn)的Diffusion,AI產(chǎn)生圖片和文字的效果才有了大的飛躍。
2022年4月,OpenAI發(fā)布的DALL-E 2生成的人像和圖片已經(jīng)效果驚人,而到了8月,Stability AI發(fā)布的Stable Diffusion模型,更是取得了質(zhì)的突破,AIGC的作品,已經(jīng)完全可以媲美專業(yè)畫師。
擊敗人類獲得藝術(shù)大獎的AIGC作品《太空歌劇院》
而在AI生成視頻方面,Meta、谷歌已經(jīng)紛紛發(fā)布了模型。
去年9月,Meta發(fā)布了AI生成視頻工具Make-A-Video,具有文字轉(zhuǎn)視頻、圖片轉(zhuǎn)視頻、視頻生成視頻三大功能。
谷歌也緊隨其后,發(fā)布了Imagen Video和Phenaki。其中Phenaki可以通過文字生成一段情節(jié)完整、連貫的視頻。
B站up主「秋之雪華」發(fā)布的《夏末彌夢》,是全球首個由AI繪制、AI配音的動畫,一經(jīng)發(fā)布就震撼了廣大網(wǎng)友。
來源:秋之雪華
AIGC商業(yè)化的潛力如此之大,但究竟有哪些落地場景呢?
從融資角度來看,目前AIGC有3個商業(yè)化的方向:
第一個方向是通過AI生成文字,比如自動寫郵件和文案。
第二個方向是利用AI生成繪畫,主要技術(shù)是結(jié)合多模態(tài)神經(jīng)語言模型CLIP和圖像擴散模型Diffusion,僅需提供一些關(guān)鍵字描述即可。
第三個方向是AIGC的底層技術(shù)模型開發(fā),Stable AI是這個方向的頂流之一。
而這些方向,都可以指向豐富的應(yīng)用場景,其中非常有代表性的領(lǐng)域,就是游戲、電商、廣告?zhèn)髅健S螒?div style="height:15px;">
開發(fā)游戲周期長、成本高,通常需要花費幾年時間和上千萬資金,好在AIGC可以極大提高游戲的開發(fā)效率。具體來說,游戲中的劇本、人物、頭像、道具、場景、配音、動作、特效、主程序未來都可以透過AIGC產(chǎn)生。
AIGC技術(shù)
在游戲中的應(yīng)用
AI生成文字
劇情設(shè)計、游戲劇本、情節(jié)敘事
AI生成圖像
人物、頭像、道具設(shè)計
AI生成音頻
人物配音、音效、音樂
AI生成影片
游戲動畫、人物動作、特效
AI生成3D
人物3D模型、游戲場景
AI生成代碼
地圖編輯器、游戲代碼
AIGC技術(shù)在游戲中的應(yīng)用AIGC的加入,讓游戲開發(fā)者的所需的時間和成本大幅降低。根據(jù)競核對一位開發(fā)者的采訪,現(xiàn)在為一張圖片生成概念圖的時間,已經(jīng)從3周下降到了1個小時,減少了120比1?,F(xiàn)在,他們只需要畫出動畫的輪廓,然后由成本較低的AI「畫師」大軍完成耗時的工作,為動畫膠片上色、填充線條即可。甚至,已經(jīng)有游戲開發(fā)商開始讓玩家通過AIGC自己創(chuàng)建頭像。玩家只需要自己描述,就能生成頭像的圖片。在關(guān)卡設(shè)計上,AIGC工具可以瞬間生成一個1920年艷舞時代的紐約的世界,或者是神秘的刀鋒戰(zhàn)士式的未來,或者是托爾金式的幻想世界。
根據(jù)AIGC在文字和圖像方向的推進速度,以上應(yīng)用在五到十年之內(nèi)應(yīng)該可以實現(xiàn)?,F(xiàn)在,已經(jīng)有不少游戲大廠開始著手開發(fā)AI作畫、NLP等大模型了;而中大型游戲廠商則積極接入已有大模型,為游戲生成流程打造專屬的小模型。電商
當前,隨著數(shù)字技術(shù)的發(fā)展和應(yīng)用、消費模式的轉(zhuǎn)變和升級,沉浸式購物體驗將逐漸成為電商領(lǐng)域發(fā)展的新方向。AIGC正可用于商品三維模型、虛擬人主播乃至虛擬貨場的構(gòu)建,通過和AR、VR等新技術(shù)的結(jié)合,實現(xiàn)視聽等多感官交互的沉浸式購物體驗。比如,基于商品在不同角度下拍攝的圖像,利用視覺算法,就可以生成商品的三維模型和紋理,讓客戶可以在線上進行虛擬觀看、試穿等行為。根據(jù)電商平臺數(shù)據(jù)顯示,三維購物的轉(zhuǎn)化率平均值約為70%,較行業(yè)平均水平提升了九倍左右。
廣告?zhèn)髅?div style="height:15px;">
另外,AIGC作為新型的內(nèi)容生產(chǎn)方式,可以為媒體的內(nèi)容生產(chǎn)全面賦能。比如AI可以基于算法自動編寫新聞,幫助媒體更快、更智能化地生產(chǎn)內(nèi)容;AI還可以通過視頻字幕生成、視頻錦集、視頻拆條、視頻超分等智能化剪輯工具,幫助我們實現(xiàn)智能視頻剪輯。而在新聞播報中,已經(jīng)出現(xiàn)了越來越多的AI合成主播,新華社、中央廣播電視總臺、人民日報社等媒都推出了「新小微」、「小C」等虛擬新聞主持人。
AI手語主播在與央視新聞主播朱廣權(quán)進行互動在傳媒領(lǐng)域,AI繪畫、AI合成視頻、AI文字創(chuàng)作等工具,都將大大提高創(chuàng)意素材的生成效率??梢钥吹剑珹IGC產(chǎn)業(yè)生態(tài)的加速,會帶我們走向「模型即服務(wù)」的未來。目前,AIGC的應(yīng)用主要在三大層——基礎(chǔ)層、中間層、應(yīng)用層。基礎(chǔ)層主要是由預(yù)訓練模型的技術(shù)投入,主要代表為上游基礎(chǔ)設(shè)施提供方如Open AI、Stability AI等;
中間層是垂直化、場景化、個性化的模型和應(yīng)用工具;
應(yīng)用層即面向C端的用戶的文字、圖片、音視頻等內(nèi)容生成服務(wù)等。
初創(chuàng)公司的三大挑戰(zhàn)
可以說,AI繪畫、AI聊天等AI服務(wù)能力強大的背后,離不開預(yù)訓練大模型的支持。然而,大模型就意味著更高計算資源以及高效的平臺進行訓練和推理。據(jù)報道,ChatGPT的訓練使用了成百上千張GPU卡,單次訓練成本450萬美金,整體訓練成本高達1200萬美金。甚至,對于那些想要入局的新玩家來說,更是有三個挑戰(zhàn)不得不去面對:前期投入大
數(shù)據(jù)、算力、算法是驅(qū)動AIGC發(fā)展的三駕馬車,要實現(xiàn)AIGC的發(fā)展,這三者缺一不可,但每一項的發(fā)展,都需要企業(yè)投入大量的資金,尤其是前期的硬件投資更是占企業(yè)投入資金的大多數(shù)。算力要求高
從AI生成圖片到AI生成視頻要用到大量數(shù)據(jù)訓練模型,對算力要求呈指數(shù)級的提升,同時也需要快速高效的方式來處理數(shù)據(jù)集。缺乏成熟的算法模型
市場上模型過多,缺乏被廣泛驗證的成熟模型,模型的好壞及算法調(diào)優(yōu)的經(jīng)驗決定了產(chǎn)出內(nèi)容的質(zhì)量。即便是以AI繪畫走紅全球的新晉獨角獸公司Stability AI,也是如此。
2022年8月,由Stability AI推出的開源AI模型Stable Diffusion,可以說是AI圖像生成發(fā)展過程中的一個里程碑。借助這一模型,任何人只需要提供一段文字描述,就有機會創(chuàng)作出任意風格的繪畫作品。不僅如此,對于開發(fā)者來說,Stable Diffusion的運行速度也非??欤⑶矣匈Y源和內(nèi)存的要求也很低。然而,想要訓練這類機器學習基礎(chǔ)模型,卻不那么容易。因為你不僅需要一個具有數(shù)千張顯卡的高性能計算集群,而且還需要能有效利用該集群的軟件。據(jù)報道,Stable Diffusion這樣的模型訓練起來也非常困難,需要使用超過5400個NVIDIA A100 GPU訓練,共花費15萬個GPU小時,僅訓練模型就花了60萬美元。
為了解決這一問題,Stability AI在2022年11月的時候正式宣布,選擇亞馬遜云科技作為首選云計算供應(yīng)商。在Amazon SageMaker(AWS的端到端機器學習服務(wù))及其模型并行庫的加持下,Stability AI的模型訓練時間和成本減少了58%。與此同時,通過使用SageMaker托管的基礎(chǔ)設(shè)施和優(yōu)化庫,Stability AI能夠使其模型訓練具有更高韌性和性能。這些優(yōu)化和性能改進適用于具有數(shù)百或數(shù)千億參數(shù)的模型。
無獨有偶,美國明星AI創(chuàng)企Hugging Face,最近也將自己的開源工具集成進了Amazon SageMaker。如此一來,不僅可以幫助Hugging Face加速構(gòu)建生成式AI應(yīng)用的大型語言模型和大型視覺模型的訓練、微調(diào)和部署,而且也讓云計算客戶可以針對特定用例進一步優(yōu)化其模型的性能,同時降低成本。綜上所述,我們不難看出,AIGC大模型的訓練和推理,往往是需要強大的「AI軟件工具和平臺」的支持的。
為何做出如此選擇?
在這場熱潮中,亞馬遜云科技從未缺席。據(jù)了解,亞馬遜云科技目前已經(jīng)聯(lián)合了相當多的行業(yè)客戶,共同探索AIGC的落地場景,并嘗試打造可商業(yè)化和可復(fù)制的行業(yè)應(yīng)用案例。作為全球最大的公有云供應(yīng)商,亞馬遜云科技于2017年在re:Invent全球大會上推出了全球首個用于機器學習的集成開發(fā)環(huán)境(IDE)Amazon SageMaker。借助這項完全托管的機器學習服務(wù),開發(fā)人員、數(shù)據(jù)科學家、還是商業(yè)分析師都能夠快速、輕松地準備數(shù)據(jù),并在規(guī)模上構(gòu)建、訓練和部署高質(zhì)量的機器學習模型,然后直接將模型部署到生產(chǎn)就緒托管環(huán)境中,大大降低了機器學習的使用門檻。在IDC評估的8家供應(yīng)商中,亞馬遜云科技憑借其機器學習旗艦產(chǎn)品Amazon SageMaker強大的功能、不斷提升的交付能力以及在保持開源方面的領(lǐng)先優(yōu)勢,被IDC列入「領(lǐng)導(dǎo)者」陣營,并居于圖中最高最遠位置。
來源:IDC具體來說,亞馬遜云科技具有以下優(yōu)勢:計算資源豐富
戶無需前期硬件投入,即可隨時使用。自研芯片性價比高
自研的AI加速芯片WS Trainium和AWS Inferential ML,在提供高性能解決方案的同時,還可為用戶節(jié)省高達50%的訓練成本,以及70%的推理成本。超大規(guī)模工作負載時成本最優(yōu)
用戶可以在Amazon SageMaker中使用托管式Amazon EC2 Spot實例輕松訓練機器學習模型。與按需實例相比,使用托管的Spot實例可以將成本優(yōu)化高達90%。擁有廣泛驗證的算法模型
Amazon SageMaker JumpStart提供了350多種內(nèi)置算法、預(yù)訓練模型和預(yù)構(gòu)建的解決方案模板。不僅有著Stable Diffusion和Bloom這兩種最先進的模型,同時還提供如TensorFlow、PyTorch、Hugging Face和MXNet等SOTA的開源模型,并且可以實現(xiàn)一鍵部署。
大會報名
為了幫助大家更深入了解和探索AIGC,揭秘AIGC的概念及火爆出圈背后的驅(qū)動力,了解AIGC的商業(yè)化落地機遇及關(guān)鍵趨勢洞察,以及探索AIGC在游戲、廣告、電商等領(lǐng)域的創(chuàng)新實踐。亞馬遜云科技將于2023年3月9號14:00-18: 00舉辦「AIGC創(chuàng)新實踐在線大會」,以AIGC+游戲解鎖新場景,AIGC+電商提供新體驗,AIGC+廣告媒體創(chuàng)造新內(nèi)容入手,分享行業(yè)應(yīng)用場景及最佳實踐。