從我預(yù)見(jiàn)的四大發(fā)展趨勢(shì)，看未來(lái)大模型引發(fā)工業(yè)革命的兩條路徑

“

??全世界不會(huì)只有OpenAI一個(gè)大模型，大模型的成本還將進(jìn)一步的降低，使得科技平權(quán)能真正地普惠給每一個(gè)人、每一個(gè)企業(yè)和政府機(jī)構(gòu)，真正的實(shí)現(xiàn)大模型的工業(yè)革命。

??專、小、廉、強(qiáng)正在成為大模型的四大發(fā)展趨勢(shì)。

最近大模型行業(yè)發(fā)生了4件事情，代表了我預(yù)言的四大方向和趨勢(shì)。

第一，Llama3.1發(fā)布最強(qiáng)開(kāi)源模型，超過(guò)了GPT-4、谷歌的Gemini等閉源模型，這說(shuō)明開(kāi)源已經(jīng)開(kāi)始和閉源并駕齊驅(qū)。

第二，Llama3.1發(fā)布不到一天，歐洲的Mistral Large2開(kāi)源模型也發(fā)布了，而且號(hào)稱在幾個(gè)指標(biāo)上都超過(guò)了Llama3.1，同樣也超過(guò)了GPT-4o 。Mistral 開(kāi)源模型的大小連Llama3.1的1/3都不到，它使用的是MOE架構(gòu)，就是一個(gè)大模型，由多個(gè)專家模型組合而成。這說(shuō)明通過(guò)多個(gè)專家模型的聯(lián)合工作，它的能力超過(guò)了規(guī)模比它大很多的大模型，這是第二個(gè)趨勢(shì)，就是專。

第三，GPT-4o上了一個(gè)mini版本，模型更小、性能更強(qiáng)，所以價(jià)格大幅度降低、性價(jià)比超高。跟當(dāng)年的GPT-3相比，兩年內(nèi)模型的成本已經(jīng)降低了99%，這個(gè)模型的能力是從哪里來(lái)的？它實(shí)際上應(yīng)該是對(duì)GPT-4o的能力進(jìn)行了蒸餾和壓縮，使得能力上可以和GPT4相匹敵，但是因?yàn)槟Ｐ偷囊?guī)?？s小了，所以成本就降低了。

這證明了我的第三個(gè)觀點(diǎn)——模型并不是越大越好，還要把模型的成本降下來(lái)，才能真正實(shí)現(xiàn)讓人們更廣泛地接觸AI。如果我們希望AI惠及世界每一個(gè)角落、每個(gè)行業(yè)、每個(gè)應(yīng)用程序，我們就必須讓AI變得更便宜，所以這個(gè)趨勢(shì)代表的是便宜和低成本。

第四件事是蘋(píng)果剛剛發(fā)布了一個(gè)DCLM-7B版本的大模型，把模型權(quán)重訓(xùn)練的數(shù)據(jù)集和訓(xùn)練代碼全都開(kāi)源了，在性能測(cè)試中和Llama3一樣，但計(jì)算量只有Llama3 8B的1/6，這個(gè)模型之所以小，是為了能在筆記本、iPad等終端設(shè)備本地運(yùn)行。看起來(lái)PC和手機(jī)上的端側(cè)大模型要正式開(kāi)戰(zhàn)了。

我們綜合這四個(gè)趨勢(shì)來(lái)看，可以做一個(gè)總結(jié)，就像我這半年的預(yù)言一直鼓吹的那樣，要引發(fā)大模型的工業(yè)革命，必須要讓它從原子彈變成茶葉蛋，把它拉下神壇，如果都像OpenAI那樣搞越做越大的模型，卷越來(lái)越大的算力，誰(shuí)也做不起，最后掙錢(qián)的只有英偉達(dá)。

事實(shí)上這幾個(gè)趨勢(shì)——專、小、廉、強(qiáng)正在成為大模型的四大發(fā)展趨勢(shì)，包括OpenAI都開(kāi)始做小規(guī)模的大模型，降低大模型的使用門(mén)檻，加速工業(yè)革命的到來(lái)。加速工業(yè)革命絕不是做一個(gè)大模型，讓全世界人干什么都用，而是兩條路徑。

一個(gè)是模型進(jìn)入千家萬(wàn)戶，離用戶越來(lái)越近。大模型越做越小、功能越來(lái)越強(qiáng)，上電腦、上手機(jī)、上車(chē)、上機(jī)器人，變得無(wú)處不在。

另一條路就是大模型走入百行千業(yè)。和傳統(tǒng)制造業(yè)、傳統(tǒng)企業(yè)的業(yè)務(wù)緊密地結(jié)合，這個(gè)需要把大模型參數(shù)做小，功能做專、變成專家模型，同時(shí)提高企業(yè)的知識(shí)密度和知識(shí)含量，讓模型的能力不會(huì)因?yàn)樾《档?，反而因?yàn)橛辛烁鼘I(yè)的企業(yè)高純度數(shù)據(jù)、知識(shí)而變得功能更加強(qiáng)大。

同時(shí)在面向消費(fèi)者的公有大模型方面，也出現(xiàn)了把模型做小，把成本降低的趨勢(shì)。這樣使得很多第三方開(kāi)發(fā)者和普通用戶，能夠以普惠的價(jià)格獲得大模型使用的基本體驗(yàn)，實(shí)現(xiàn)大模型的科技平權(quán)。

從各個(gè)方面來(lái)講，我們可以樂(lè)觀地看到大模型的成本還將進(jìn)一步的降低，使得科技平權(quán)能真正的普惠給每一個(gè)人、每一個(gè)企業(yè)和政府機(jī)構(gòu)，真正的實(shí)現(xiàn)大模型的工業(yè)革命。

最后補(bǔ)充一點(diǎn)，扎克伯格最近見(jiàn)了彭博社的記者，在專訪中扎克伯格也表達(dá)了他對(duì)開(kāi)源的信心和對(duì)開(kāi)源生態(tài)的信仰。

他有一個(gè)觀點(diǎn)也支持我的看法，就是全世界不會(huì)只有OpenAI一個(gè)大模型，每個(gè)企業(yè)、每個(gè)政府機(jī)構(gòu)都會(huì)擁有自己大小不一樣的、各種各樣定制的專業(yè)大模型，所以他們發(fā)布的Llama3.1 4000億參數(shù)這個(gè)版本，不僅僅可以讓人免費(fèi)的使用GPT-4同樣的能力，還可以作為一個(gè)教師模型，把它的能力蒸餾提純到客戶自己的小模型上，成為眾多專業(yè)小模型的母體。

中國(guó)要搞自己的大模型發(fā)展之路，我覺(jué)得應(yīng)該扣緊這四個(gè)趨勢(shì)和方向，而不要被OpenAI牽著鼻子轉(zhuǎn)。事實(shí)上OpenAI今天也在痛苦的反思和轉(zhuǎn)型，因?yàn)槿斯ぶ悄苤返降自趺醋?，大家都在摸石頭過(guò)河。

开心六月综合激情婷婷|欧美精品成人动漫二区|国产中文字幕综合色|亚洲人在线成视频