先祝各位開工大吉、萬(wàn)事興龍!
秉著讓子彈飛一會(huì)兒的想法,開工第一天才來(lái)聊Sora, 一個(gè)直觀感受是,這一波在國(guó)內(nèi)AI、科技圈的熱度遠(yuǎn)不如去年初GPT3.5的問(wèn)世。
但仍不得不說(shuō),Sora的表現(xiàn)堪稱驚艷,國(guó)內(nèi)大模型要追趕上也仍需時(shí)日,只是動(dòng)不動(dòng)又說(shuō)很快要顛覆、掀起驚濤駭浪、又大幅拉開中美差距之類的,對(duì)促進(jìn)認(rèn)知沒有意義。
看了官方發(fā)布的幾十個(gè)視頻和論文中譯版及專業(yè)解讀,也看了一些算法專家的分析,文生視頻和文生文是有較大不同,但總離不開基礎(chǔ)理論、算法模型、數(shù)據(jù)源和工程化等幾方面的迭代。
Sora的出現(xiàn),基礎(chǔ)理論并沒有重大創(chuàng)新,算法模型是基于現(xiàn)有幾種的混合應(yīng)用,數(shù)據(jù)源和質(zhì)量沒有披露,工程化細(xì)節(jié)也沒有解密,當(dāng)然這也是最具壁壘的部分。
工程化能力是近幾年被高頻提及的詞,簡(jiǎn)單講一種新材料可以在實(shí)驗(yàn)室的反復(fù)試錯(cuò)條件下獲得極小部分顆粒,但要形成年產(chǎn)萬(wàn)噸的材料,則需建造一個(gè)占地百畝的化工園區(qū),大到一套高達(dá)數(shù)十米的裂解裝置,小到里面零零散散的精密元件,以及運(yùn)營(yíng)數(shù)據(jù)背后高度關(guān)聯(lián)的一套套監(jiān)測(cè)、控制軟件。萬(wàn)分之一的細(xì)節(jié)不足都可能影響產(chǎn)品品質(zhì)、生產(chǎn)效率乃至安全風(fēng)險(xiǎn)。
大模型領(lǐng)域的工程化能力自然不會(huì)涉及那么多大型裝備、安裝調(diào)試、工藝流程和更為復(fù)雜的項(xiàng)目管理,但一個(gè)不一樣的壁壘在于,這需要算法、機(jī)器視覺等領(lǐng)域極高的人才門檻和鉆研深度,不是單純的人才密度。
從Sora的論文發(fā)布可以看出,核心研究團(tuán)隊(duì)就那么幾個(gè)人,并且核心作者還是剛畢業(yè)的幾個(gè)博士甚至本科學(xué)歷。國(guó)內(nèi)top10的計(jì)算機(jī)專業(yè)院校,每年也畢業(yè)數(shù)以千計(jì)的計(jì)算機(jī)博士,更別說(shuō)算上碩士、本科學(xué)歷,但為什么這些人可能都去不了達(dá)摩院,更別說(shuō)被OpenAI以一兩百萬(wàn)美金年薪的應(yīng)屆生招進(jìn)去,是的,比P10薪資還高得多。
這就是為什么在國(guó)外誕生Pika, 在國(guó)內(nèi)有Minimax, Moonshot的一個(gè)根本原因。有頂尖學(xué)歷的人才不少,但其中具備較高的產(chǎn)品思維能力、優(yōu)秀的創(chuàng)造性問(wèn)題解決能力以及極強(qiáng)的熱愛精神的,少之又少。這幾個(gè)條件缺一個(gè),都沒辦法用驚人的速度在工程化的道路上解決數(shù)以百計(jì)的熬人挑戰(zhàn)。
就我認(rèn)識(shí)的AIGC領(lǐng)域創(chuàng)業(yè)者、技術(shù)大拿都有個(gè)特質(zhì),為解決一個(gè)大問(wèn)題可以連續(xù)一周通宵,平均每天睡3小時(shí),其實(shí)是夠睡的,因?yàn)槿嗽跇O度亢奮情況下根本沒睡意??v觀人類的科研歷史已經(jīng)反復(fù)證明,哪怕是頂尖聰明的科學(xué)家,也只有一定時(shí)期內(nèi)處于高度亢奮狀態(tài),才可能突破5%以外的人類智力極限,尤其普遍發(fā)生在35歲前。
但另一面還得強(qiáng)調(diào)門檻,這批作者幾乎都是全美頂尖計(jì)算機(jī)專業(yè)院校的尖子生,這種人才放到全世界,每年的產(chǎn)量恐怕也就上百人,其實(shí)是極為稀缺的。先得識(shí)別出這樣的尖子生,還得給予去大廠5-10倍的應(yīng)屆生年薪,然后這批人還得滿足以上幾個(gè)特質(zhì),并且最終還得背靠極其燒錢的基礎(chǔ)設(shè)施能力,這是OpenAI對(duì)抗大廠的一個(gè)關(guān)鍵壁壘,不在于堆人。
所以總有人問(wèn),我們趕上別人需要多久?重點(diǎn)不在于多久,而在于別人為什么總能比你領(lǐng)先?把這個(gè)背后的一整套邏輯看清晰,那么我們要解答的就不是多久,而是怎么去打造這樣的創(chuàng)新環(huán)境和激勵(lì)機(jī)制。
其實(shí)國(guó)內(nèi)大廠早就對(duì)此有深刻的反思,畢竟也是一批次頂尖人才,雖然待在大廠發(fā)揮不了實(shí)力,但不代表看不懂別人為什么能干出來(lái)。不僅反思,也做了應(yīng)對(duì)方案。譬如阿里,雖然堆了自研團(tuán)隊(duì),人數(shù)很多,但既不夠出挑,也不夠賣命。達(dá)摩院的一些大牛走得也差不多了。所以還得買個(gè)保險(xiǎn),必須同時(shí)下注(投資)外部的獨(dú)立創(chuàng)業(yè)團(tuán)隊(duì)。
這里有個(gè)細(xì)節(jié),有人鼓吹說(shuō)大廠全靠接GPT4接口的說(shuō)法,不認(rèn)同。國(guó)內(nèi)搞大模型的5家大廠和5家獨(dú)立團(tuán)隊(duì),如果有1-2家完全靠接GPT4接口,或許是可信的,但把國(guó)內(nèi)top大模型說(shuō)的如此一文不值,不符合邏輯。
這幾個(gè)大廠,如果過(guò)去整整一年,整個(gè)大模型團(tuán)隊(duì)的產(chǎn)出都靠接別人的,首先,這token量無(wú)比之大,OpenAI對(duì)單賬戶是有明確限制且2023年新賬號(hào)一度暫停申請(qǐng),這種規(guī)模的使用量,怎么可能撐住一年?其次,你是字節(jié)、阿里、百度的大模型一號(hào)位,這種大規(guī)模用量的套殼操作,你敢?
充其量不過(guò)是小規(guī)模使用下,學(xué)習(xí)友商的一種策略。哪個(gè)企業(yè)追趕對(duì)手,不把對(duì)手的產(chǎn)品大卸八塊、反復(fù)研究的?至于基于別家的開源大模型,除了李開復(fù)的團(tuán)隊(duì)說(shuō)的不明不白的,已經(jīng)被圈內(nèi)吐槽吃相難看了,還有哪幾家沒說(shuō)清楚的?用開源不丟人,關(guān)鍵得說(shuō)清楚。
所以不必問(wèn)追趕還需多久,只需想想,OpenAI的競(jìng)爭(zhēng)優(yōu)勢(shì),我們?cè)趺磸浹a(bǔ)。META首席科學(xué)家、AI大神Lecun最近還就中國(guó)的學(xué)術(shù)環(huán)境發(fā)表評(píng)論,他說(shuō)咱們的目標(biāo)導(dǎo)向有點(diǎn)問(wèn)題、激勵(lì)機(jī)制不是太完善,翻譯過(guò)來(lái)就是,唯利是圖、氛圍糟糕。
不僅在AI領(lǐng)域,硬科技走到深水區(qū)后也是如此,絕大部分院士級(jí)的硬科技項(xiàng)目,哪個(gè)教授每天只睡3小時(shí),然后把剩余時(shí)間100%投入創(chuàng)業(yè)的?我看到的都是,教授既不從高校離職,也沒全情投入,所謂研發(fā)就是包給研究生干苦力,自己占大股。
做得出來(lái)是自己的,做不出來(lái)繼續(xù)享受學(xué)術(shù)圈的座上賓,一個(gè)不拉。真搞不出來(lái),普通投資人敢動(dòng)院士一根毫毛?這就是咱們?cè)摲此嫉?,這種基礎(chǔ)科學(xué)的學(xué)術(shù)環(huán)境下,怎么可能在源頭保持競(jìng)爭(zhēng)力?所以真正好人才,一半都去國(guó)外了。
接下來(lái)進(jìn)入正題,Sora足夠驚艷毫無(wú)疑問(wèn),但關(guān)鍵問(wèn)題仍需探討。
首先,Sora團(tuán)隊(duì)并沒有明確的說(shuō),已經(jīng)能實(shí)現(xiàn)基于成熟的世界因果關(guān)系模型,而是巧妙地用了世界模擬器這種描述,但共生關(guān)系和復(fù)雜世界運(yùn)行背后的連續(xù)因果關(guān)系是兩個(gè)層次。頂尖學(xué)術(shù)圈是很嚴(yán)謹(jǐn)?shù)?,即便奧特曼是資本運(yùn)作和營(yíng)銷大師,也不會(huì)隨便亂說(shuō)。
就在Sora發(fā)布后的2-3天,Lecun在世界政府峰會(huì)上就差指名道姓點(diǎn)出自己對(duì)Sora的不看好,指出這并不是真正的世界模型,并且仍會(huì)面臨GPT4的巨大瓶頸。同樣的,這樣的學(xué)術(shù)大神也是愛惜自己名聲的,如果真牛逼,人家不會(huì)吝嗇,更不會(huì)如此堅(jiān)定的不看好。
涌現(xiàn)這個(gè)詞也被用爛了。去年GPT剛出現(xiàn)涌現(xiàn)能力時(shí),說(shuō)實(shí)話哪怕大神也得掂量幾分,坐等后續(xù),結(jié)果呢?伴隨而來(lái)的是海量、持續(xù)、難以解決的幻覺、精度問(wèn)題,到今天依然無(wú)法解決。
文生文、文生圖片到底在全世界顛覆了什么產(chǎn)業(yè)?好像放眼全球也沒看到哪個(gè)能解決過(guò)去長(zhǎng)期人類痛點(diǎn)的全球規(guī)模化的商業(yè)應(yīng)用,有么?2C的沒有,2B的更沒有。GPT4用周鴻祎的說(shuō)法,影響力已經(jīng)從原子彈變成茶葉蛋。
放到文生視頻,目前只是測(cè)試階段,還未放開。既然GPT4至今仍無(wú)法解決幻覺嚴(yán)重問(wèn)題,換到文生視頻工具上,任何復(fù)雜視頻的生成也無(wú)不牽涉到物理世界數(shù)以萬(wàn)級(jí)的因果關(guān)系和邏輯推理,現(xiàn)在還只是幾只貓、幾條船翻來(lái)覆去繞,大規(guī)模開放使用后,有沒有可能在修復(fù)當(dāng)前bug的同時(shí),也出現(xiàn)越來(lái)越多且難以消除的幻覺以及corner case問(wèn)題?
一旦放開使用,有沒有可能出現(xiàn)數(shù)以百萬(wàn)個(gè)邏輯漏洞百出的視頻全世界滿天飛?然后和當(dāng)初GPT橫空出世一樣,全世界用好玩的心態(tài)玩一遍,最后發(fā)現(xiàn)大規(guī)模商業(yè)化并不容易。
馬斯克這兩天還對(duì)Sora進(jìn)行了補(bǔ)刀,他說(shuō)這個(gè)能力特斯拉一年前就有了并已經(jīng)在用,F(xiàn)SD的訓(xùn)練視頻也有文生視頻,對(duì)真實(shí)道路的視頻模擬也達(dá)到了高顆粒度的物理世界還原,只是都是些房子、車子、路橋、雜貨鋪?zhàn)雍蛠?lái)來(lái)往往的行人,發(fā)出來(lái)也很無(wú)趣。
所以有人說(shuō)馬斯克退出OpenAI董事會(huì)肯定相當(dāng)后悔,那是你想多了。這個(gè)人過(guò)去20年把世界上不可想象的極難、偉大任務(wù)都完成了,領(lǐng)導(dǎo)世界頂尖的AI團(tuán)隊(duì),自己還有2,500億美金的身價(jià)。今天只要馬斯克覺得值得優(yōu)先干的事,他為什么不干?同理,他面對(duì)全世界的自信滿滿,你覺得是逗著玩?
奧特曼應(yīng)該找馬斯克好好聊下:兄弟,沒必要老懟我,怎么說(shuō)也有OpenAI創(chuàng)業(yè)緣分,再說(shuō),不為OpenAI考慮,也得為50萬(wàn)億美元的美股市場(chǎng)考慮下,OpenAI搞不成沒關(guān)系,美股怎么辦?世界經(jīng)濟(jì)怎么辦?
依然用開頭的話來(lái)總結(jié):Sora很驚艷,國(guó)內(nèi)追趕尚需時(shí)日,問(wèn)題咱們自己也清楚,問(wèn)多久趕上不如問(wèn)我們差在哪?同時(shí),Sora自身仍充滿挑戰(zhàn),較大可能走到GPT4的大瓶頸,全球級(jí)的學(xué)術(shù)大神、產(chǎn)研巨佬均不看好或不屑一顧。
最近說(shuō)點(diǎn)看了一堆文章都沒分析卻不得不分析的論證。
Sora的文生視頻之驚艷,確實(shí)讓人想到是不是在電影、短視頻、游戲、后期制作、廣告等領(lǐng)域有最直接的應(yīng)用價(jià)值。大部分人只是直覺認(rèn)為行,卻不深入思考為什么能行。
當(dāng)論證一項(xiàng)新的應(yīng)用技術(shù)怎么顛覆傳統(tǒng)產(chǎn)業(yè)時(shí),最起碼要搞明白傳統(tǒng)產(chǎn)業(yè)是怎么運(yùn)行的,比如究竟什么是創(chuàng)意內(nèi)容、什么是短視頻、什么是流量分發(fā)、什么是電影工業(yè)和廣告。
先做個(gè)假設(shè),即使Sora很成熟,成本和使用門檻也足夠低,且99%情況下沒bug,那Sora的文生視頻工具,到底能撬動(dòng)多大的市場(chǎng)?我們粗略把內(nèi)容分成長(zhǎng)視頻、短視頻,以及不同精美程度下的各類內(nèi)容題材。
首先就內(nèi)容創(chuàng)意領(lǐng)域。很多人不知道,每年各種小電影、微電影、網(wǎng)絡(luò)電影乃至動(dòng)輒幾千萬(wàn)投入的院線電影加起來(lái)有幾萬(wàn)部,并且大部分還是專業(yè)人士進(jìn)行編導(dǎo)的,最終能到院線排片的就幾百部,能出圈的就十幾部。
國(guó)內(nèi)全職的編導(dǎo)從業(yè)者就有幾十萬(wàn)人,細(xì)分到文藝、喜劇、懸疑、科幻等不同內(nèi)容題材,里面既有陽(yáng)春白雪,也有精神垃圾,應(yīng)有盡有,憑什么人家靠吃飯的家伙都只能勉強(qiáng)過(guò)活,而所謂有創(chuàng)意天賦的人,加上好的生產(chǎn)工具就能超越這幾十萬(wàn)專業(yè)人士?
好內(nèi)容離不開傳播平臺(tái),再講內(nèi)容分發(fā)。
照理說(shuō)有短視頻平臺(tái)的加持,這每年幾萬(wàn)部電影不應(yīng)該有出圈機(jī)會(huì)么?實(shí)際上哪個(gè)導(dǎo)演、編劇是靠短視頻產(chǎn)生了可持續(xù)的商業(yè)模式的?如果短視頻上能跑通長(zhǎng)視頻,那愛優(yōu)騰早就倒閉了,這是一個(gè)基本的互聯(lián)網(wǎng)產(chǎn)品思維,也是為什么抖音上最火的電影都是精華剪輯風(fēng)格,即便嚴(yán)重侵犯了版權(quán)。
短視頻平臺(tái)走不通的話,那制作一批精美的長(zhǎng)視頻內(nèi)容,走院線、愛優(yōu)騰渠道呢?那更是異想天開。群眾的審美是有限的、院線的檔期是有限的、明星的稀缺是有限的、資本的力量是無(wú)限的,寧浩加上劉德華都搞不定的市場(chǎng),豈是內(nèi)容優(yōu)劣決定的?
一部全程靠宣傳減肥的電影,獲得了1億罵聲和1億叫好,也獲得了幾十億票房,賈玲無(wú)疑是極其成功的商業(yè)片導(dǎo)演,但成功背后是為什么?真實(shí)的傳統(tǒng)電影市場(chǎng)及其產(chǎn)業(yè)鏈,遠(yuǎn)比隨便YY復(fù)雜的多,豈是一個(gè)有滿腹創(chuàng)意的普通人,加上一套神級(jí)制作工具,能掀翻的?
說(shuō)完長(zhǎng)視頻,再說(shuō)短視頻內(nèi)容。抖音早年能一騎絕塵,靠的那些搞笑、生活視頻,并沒有多大的制作成本,放到今天也就上千到幾千塊的單個(gè)視頻成本,但是,視頻腳本的邏輯性以及人物演繹張力背后的一連串細(xì)微因果關(guān)系,并不簡(jiǎn)單。本來(lái)就上千的制作成本,用了Sora恐怕還得反復(fù)微調(diào),那Sora到底能起到什么顛覆作用?
這是簡(jiǎn)單內(nèi)容的短視頻生成,那如果是自動(dòng)生成精致、酷炫的短視頻內(nèi)容呢?我挺愛刷那些好萊塢科幻電影集錦的,但至今重復(fù)刷到的概率也很低,就這批好萊塢水準(zhǔn)的內(nèi)容供給量也已經(jīng)夠夠了。抖音是要啥有啥,和源源不斷的內(nèi)容供給相比,流量才是稀缺且寶貴的,這是平臺(tái)的命根子。
即便再有5倍量的靠Sora生成的科幻微電影,憑什么流量要給你,而不是直接用正兒八經(jīng)重金投入的大片剪輯?短視頻內(nèi)容從題材來(lái)看是兩極化的,用戶既需要精神垃圾,也需要大片視覺和陽(yáng)春白雪,無(wú)論哪種在供給側(cè)都不是稀缺,而是有些過(guò)剩了。憑什么在流量還要分給直播和商城板塊時(shí),還要溢價(jià)招募新的AI內(nèi)容創(chuàng)作者?挺講不通的,這不是生意邏輯。
再插一下關(guān)于科幻電影、3D游戲及其背后的后期制作軟件市場(chǎng),這應(yīng)該是Sora在克服一系列技術(shù)挑戰(zhàn)后,能產(chǎn)生直接商業(yè)化影響的領(lǐng)域。
科幻電影制作比3D游戲制作需要用到更多軟件,剪輯、合成、跟蹤、模型、特效幾個(gè)環(huán)節(jié)經(jīng)常用到的軟件包括Nuke, Houdini, Adobe Premiere & AE, 游戲制作常用軟件就更知名,包括市值200億美金的Unity和Unreal。
但這屬于AI在2B市場(chǎng)的應(yīng)用,和2C領(lǐng)域是完全不同的商業(yè)競(jìng)爭(zhēng)邏輯。即便Sora成功了,能不能長(zhǎng)期形成絕對(duì)壁壘,確保其他友商的水平永遠(yuǎn)差得遠(yuǎn)?如果不是,那最終結(jié)果無(wú)一例外是把產(chǎn)品價(jià)格打下來(lái)、市場(chǎng)規(guī)模打下來(lái)。
因此,假設(shè)Sora能讓好萊塢大片、重度3D游戲的后期制作成本和周期大幅下降,但這并沒有根本性改變電影、游戲行業(yè)的格局,也不能左右院線的排片、明星的檔期、發(fā)行的渠道、資本的偏好。倒是把后期制作軟件市場(chǎng)干萎縮了。
最后說(shuō)廣告制作,這更沒什么可講。隨便問(wèn)下你身邊在廣告公司干過(guò)的人,算一算該公司一年?duì)I收里,用于廣告制作的成本是多少,廣告制作的成本結(jié)構(gòu)又是怎樣的。
當(dāng)我們說(shuō)一則大片廣告花了1億預(yù)算時(shí),大部分是流量投放成本,制作一般在幾百萬(wàn),盡管不算低,但其中大頭并不是廣告公司賺的,是給廣告導(dǎo)演賺走了,創(chuàng)意賺不了幾個(gè)錢。
當(dāng)Sora足夠好用時(shí),能影響的也不過(guò)是這批賺的盆滿缽滿的廣告導(dǎo)演的報(bào)價(jià)從幾百萬(wàn)砍到幾十萬(wàn),這又能給廣告行業(yè)帶來(lái)多大沖擊呢?本身就是個(gè)苦命的行當(dāng),錢都給流量平臺(tái)拿走了,還能怎么顛覆?
當(dāng)然,還會(huì)有其他場(chǎng)景的商業(yè)化應(yīng)用可能性,不一一舉證,說(shuō)這些的目的無(wú)非是覺得每次誰(shuí)放大招,能看的文章不是一味夸上天,各種馬上要顛覆,就是東搬西抄,稍微有點(diǎn)獨(dú)立、深度、辯證思考和價(jià)值判斷的分析少之又少。
說(shuō)錯(cuò)也沒關(guān)系,就像我們上一篇衛(wèi)星文章,洋洋灑灑幾千字,但犯了一個(gè)比較大的論點(diǎn)錯(cuò)誤被人指出,后面會(huì)重新論證。AI投資圈已經(jīng)夠慘了,大家還是切實(shí)際一些,反倒能發(fā)現(xiàn)一些新出路、創(chuàng)造一些新機(jī)會(huì)。
最后補(bǔ)充一點(diǎn),目前生成式AI領(lǐng)域還沒迎來(lái)真正的競(jìng)爭(zhēng),大家都在試錯(cuò)和探索階段,仍要時(shí)刻關(guān)注類似META/Google等大廠的切實(shí)進(jìn)展,盡管大廠有大廠的組織效率問(wèn)題,但畢竟僅這兩家就超過(guò)1,200億美金的利潤(rùn),誰(shuí)知道這些大廠有沒有暗地里兩條腿走路呢?只是當(dāng)下犯不著和一家擅長(zhǎng)營(yíng)銷、營(yíng)收還在十幾億的初創(chuàng)企業(yè)干架。
還得留意一點(diǎn),OpenAI這個(gè)神奇公司,去年上演了全球驚嘆的宮斗戲后,首席科學(xué)家Ilya已經(jīng)很久沒發(fā)聲,這次Sora發(fā)布也就他沒出聲。此外,另一位初創(chuàng)成員、技術(shù)大牛Andrej Karpathy恰巧在Sora發(fā)布前宣布離職,他之前是特斯拉自動(dòng)駕駛的負(fù)責(zé)人,對(duì)FSD的發(fā)展起到關(guān)鍵作用。
他們出去后會(huì)做什么?聯(lián)合做點(diǎn)事還是一起去特斯拉幫襯?這么看,OpenAI接下來(lái)除技術(shù)突破外,好戲應(yīng)該也免不了,拭目以待。
聯(lián)系客服