源碼資本在2017年碼會(huì)上宣布,前金山CEO張宏江博士加盟源碼資本任投資合伙人。張宏江博士在2017年碼會(huì)上分享了重磅觀點(diǎn)“AI的本質(zhì)與機(jī)遇”。
張宏江博士曾為前微軟亞太研發(fā)集團(tuán)首席技術(shù)官、微軟亞洲工程院院長(zhǎng)、金山軟件CEO,是世界多媒體研究領(lǐng)域一流的科學(xué)家,是計(jì)算機(jī)視頻檢索研究領(lǐng)域的“開(kāi)山鼻祖”,獲得過(guò)IEEE(美國(guó)電氣和電子工程協(xié)會(huì))和ACM(美國(guó)計(jì)算機(jī)協(xié)會(huì))兩大計(jì)算機(jī)專(zhuān)業(yè)協(xié)會(huì)頒發(fā)的重大獎(jiǎng)項(xiàng),是第一位也是迄今為止唯一同時(shí)獲此殊榮的華人科學(xué)家。
張宏江博士在2017年碼會(huì)的演講全文:
今天,我們從AlphaGo講起。我們的議題包括這一波AI潮流的原因是什么,機(jī)器學(xué)習(xí)的驅(qū)動(dòng)燃料——大數(shù)據(jù)的發(fā)展,深度學(xué)習(xí)的基本原理,AI技術(shù)的發(fā)展給我們的日常生活,給我們的創(chuàng)意以及工作帶來(lái)什么樣的影響。最后是投資AI領(lǐng)域有什么樣的機(jī)會(huì)以及陷阱,尤其是陷阱我會(huì)多講。
1
從AlphaGo說(shuō)起AI潮流:算法 計(jì)算力 大數(shù)據(jù)
典型的深度學(xué)習(xí)算法就是深層的神經(jīng)網(wǎng)絡(luò);
AlphaGo在一場(chǎng)比賽中消耗的能量是人的300倍;
數(shù)據(jù)爆炸在過(guò)去十年改變了我們的生活。
這一波人工智能的熱潮其實(shí)是從去年AlphaGo與圍棋大師李石世對(duì)決開(kāi)始的;雖然我從來(lái)不會(huì)下圍棋,但我下了賭注賭AlphaGo會(huì)贏。
為什么我會(huì)下這個(gè)賭注?我們讀過(guò)關(guān)于AlphaGo的文章,其實(shí)它是一個(gè)典型的深度學(xué)習(xí)的系統(tǒng),它用了深度的神經(jīng)網(wǎng)絡(luò),還用了深度學(xué)習(xí)里面的強(qiáng)化學(xué)習(xí),半監(jiān)督學(xué)習(xí),還用了蒙特卡洛搜索的方法。
整體來(lái)說(shuō)是經(jīng)典的技術(shù)和新的機(jī)器學(xué)習(xí)算法結(jié)合在一塊,從而能夠提高算法的性能,使它的學(xué)習(xí)能力更強(qiáng)。通過(guò)增加深度學(xué)習(xí)網(wǎng)絡(luò)的隱層神經(jīng)元數(shù)目從而建立起很好的學(xué)習(xí)能力,吸收知識(shí)的能力。這是算法上。
其實(shí)在這個(gè)背后還有非常重要的兩條,這是過(guò)去幾十年計(jì)算機(jī)發(fā)展帶來(lái)的結(jié)果。
第一條,互聯(lián)網(wǎng)過(guò)去20年的發(fā)展帶來(lái)了大數(shù)據(jù),而且是高質(zhì)量的大數(shù)據(jù)。以AlphaGo為例,在它跟李世石對(duì)局之前已經(jīng)跟人類(lèi)六到九段的棋手對(duì)決過(guò)一萬(wàn)六千多次,這個(gè)中間他獲得了超過(guò)3000萬(wàn)的布局點(diǎn),這個(gè)對(duì)于它的能力提高非常重要。它跟自己下棋的過(guò)程中又獲得了3000多萬(wàn)個(gè)布局點(diǎn),同時(shí)形成它的決策網(wǎng)絡(luò)。這是我今天講的重點(diǎn),就是高質(zhì)量大數(shù)據(jù)這一塊。
第二條,高性能的計(jì)算資源。如果我們看一下最終AlphaGo拿出來(lái)跟李世石對(duì)局系統(tǒng)用了1920個(gè)CPUs,超過(guò)280個(gè)GPUs。這是什么意思?我們知道一個(gè)衡量圍棋大師的標(biāo)準(zhǔn)是一到九段,而更細(xì)的平級(jí)是用ELO這個(gè)數(shù)。
用了1920個(gè)CPU,280個(gè)GPU以后AlphaGo的能力,ELO數(shù),從一開(kāi)始兩千多到了三千多,我們看李世石的數(shù)字是3500個(gè),其實(shí)已經(jīng)相當(dāng)接近了。正是因?yàn)橛辛烁哔|(zhì)量的大數(shù)據(jù),有了高性能的計(jì)算資源,有了新的學(xué)習(xí)方法,使得AlphaGo能夠輕松地戰(zhàn)勝了圍棋大師。而且我們說(shuō)到一點(diǎn)是,當(dāng)李世石艱苦贏了第四局之后,這個(gè)時(shí)候AlphaGo當(dāng)天晚上又自己跟自己下了一百萬(wàn)次。
為什么這次AI的浪潮跟前兩次不太一樣?今天我們談的AI其實(shí)談的是大數(shù)據(jù)小的新的算法。計(jì)算資源這些年發(fā)展下來(lái),隨著摩爾定律的指引,計(jì)算性能增加是快速的成指數(shù)的增加,同時(shí)計(jì)算的成本也是隨著指數(shù)往下走的,計(jì)算資源越來(lái)越強(qiáng),價(jià)格越來(lái)越便宜,從而我們可以廉價(jià)地利用大量計(jì)算資源。
過(guò)去十年的另外一個(gè)根本性的變化,就是如果你自己不想買(mǎi)計(jì)算設(shè)備,你可以用云計(jì)算。我們看云那一塊,大數(shù)據(jù)的處理能力在云計(jì)算的平臺(tái)上已經(jīng)以標(biāo)準(zhǔn)云服務(wù)的方式提供給大家,大家可以很方便低成本地使用。這是另外一個(gè)在計(jì)算方面的進(jìn)步,根本改變了在機(jī)器學(xué)習(xí)只是在大公司來(lái)做的狀態(tài),今天小公司可以用云計(jì)算來(lái)做了。
回頭來(lái)講數(shù)據(jù),這是我特別喜歡的題目。在AlphaGo之前,我就一直跟大家講大數(shù)據(jù),當(dāng)然心里面是想推廣金山云。但是大數(shù)據(jù)確實(shí)在過(guò)去十年內(nèi)改變我們的工作、改變了我們的生活,改變了我們的思考。
IDC有過(guò)一個(gè)報(bào)告指出,在2013年的人類(lèi)產(chǎn)生數(shù)據(jù)是4.4個(gè)ZB,到了2020年的話這個(gè)數(shù)字將會(huì)增加到44個(gè)ZB,增加10倍,年增長(zhǎng)率是40%。今天每4小時(shí)沃爾馬用戶產(chǎn)生數(shù)據(jù)超過(guò)2.5PB,每天Twitter產(chǎn)生推文有5億條,今天今日頭條的用戶請(qǐng)求超過(guò)60億次,每天頭條處理數(shù)據(jù)量超過(guò)6.3PB,這是每天人們產(chǎn)生的數(shù)據(jù)。假如說(shuō)這些數(shù)據(jù)又有很好的跟蹤和標(biāo)注,這些數(shù)據(jù)可以驅(qū)動(dòng)人工智能,驅(qū)動(dòng)人工智能的算法。
2
大數(shù)據(jù):機(jī)器學(xué)習(xí)的驅(qū)動(dòng)燃料
人臉數(shù)據(jù)庫(kù)的進(jìn)步大大提高了計(jì)算精度;
Jim Grey的科研四范式:從觀察、實(shí)驗(yàn)到計(jì)算模型,到數(shù)據(jù)推動(dòng)的模型;
大數(shù)據(jù)正在成為企業(yè)AI的標(biāo)配。
講一個(gè)人臉識(shí)別的例子。
今天大家覺(jué)得人臉識(shí)別已經(jīng)過(guò)關(guān)了,一系列的公司在人臉識(shí)別上做的比人的識(shí)別率還要高。這個(gè)功能在手機(jī)上也已經(jīng)做的非常好。之前一個(gè)人拍了很多照片,開(kāi)始找這些照片的時(shí)候就發(fā)現(xiàn)比較麻煩了,但現(xiàn)在你想找某一個(gè)人,可能需要記住什么時(shí)候照的照片。但更方便的是記住了和哪些人照的照片,通過(guò)識(shí)別人臉能使得找照片變得非常容易。這種功能是我們20多年前的夢(mèng)想,今天在手機(jī)上就可以做成了。
這是我手機(jī)上的一個(gè)屏幕,我自己的照片,我太太的照片,小孩的照片都在這兒。以前我工作的老板雷軍照片也在上面。我一點(diǎn),所有雷軍照片全都出來(lái)了。我想看某一個(gè)具體的照片,這是雷軍和戴爾電腦創(chuàng)始人Michael Dell的合影,還有和Dell團(tuán)隊(duì)的其他人的合影。我們看到手機(jī)把這些人名字自動(dòng)標(biāo)出來(lái)了,這個(gè)人是誰(shuí),那個(gè)人是誰(shuí),以后他所有的照片進(jìn)來(lái)就全部能夠識(shí)別了。這個(gè)在今天的品牌手機(jī)上都提供了這種功能。
我20年前在惠普實(shí)驗(yàn)室申請(qǐng)過(guò)一個(gè)美國(guó)專(zhuān)利。這個(gè)專(zhuān)利的內(nèi)容恰恰就是我剛才所說(shuō)的那個(gè)整個(gè)流程:拍了新的照片以后把它的數(shù)據(jù)庫(kù)照片進(jìn)行比較,從而識(shí)別出這個(gè)人是誰(shuí)。在20年前我們很清楚移動(dòng)設(shè)備計(jì)算能力有限,我們覺(jué)得這個(gè)處理的能力應(yīng)該是分布式的計(jì)算,今天我們叫做云。20年過(guò)去,現(xiàn)在恰恰把20年前的事情變成現(xiàn)實(shí),這個(gè)中間可以說(shuō)是算法的進(jìn)步,也可以說(shuō)是計(jì)算資源的進(jìn)步。
我實(shí)際上想跟大家說(shuō)是人臉數(shù)據(jù)庫(kù)的進(jìn)步。
在20年前做人臉的時(shí)候,我們手里面拿到幾百個(gè)標(biāo)準(zhǔn)的照片,今天我們拿到上億張的照片。最早90年代的時(shí)候你只有幾百個(gè)人,幾百?gòu)堈掌臄?shù)據(jù)庫(kù),90年代末2000年的時(shí)候到了上千張、上萬(wàn)張照片,從而可以看到識(shí)別率的提高。到了工業(yè)時(shí)代,也就是5、6年前谷歌、Facebook分別用深度學(xué)習(xí)的方法做人臉識(shí)別,做訓(xùn)練的數(shù)據(jù)量比以前增加了非常多,使識(shí)別精度增加。
當(dāng)用戶的數(shù)據(jù)大量增長(zhǎng)的時(shí)候,同一個(gè)算法的識(shí)別的精度也在快速的成長(zhǎng)。而且當(dāng)我用的計(jì)算量,CPU用得多的時(shí)候。性能也有快速的提高。所以這再次證明了剛才的觀點(diǎn),數(shù)據(jù)本身可能比算法還要重要?;蛘哒f(shuō)沒(méi)有這么多數(shù)據(jù)的時(shí)候根本不可能想象深度的神經(jīng)網(wǎng)絡(luò)。
再難的事情到了中國(guó)人手里面就有改善,世界上沒(méi)有任何一個(gè)地方像中國(guó)有如此多的攝像頭,如此多的頭像和身份證的照片,就形成了中國(guó)的優(yōu)勢(shì)。今天不是兩億張照片,是幾十億張的照片,上億被標(biāo)注的人。只有有了大量數(shù)據(jù)之后你才可以用深度神經(jīng)網(wǎng)絡(luò),才可以把這些內(nèi)容、這些信息提取出來(lái)。
今天人臉識(shí)別的這些公司已經(jīng)遠(yuǎn)遠(yuǎn)超過(guò)了人眼識(shí)別率,而且在世界上走在前列。當(dāng)你在一張照片跟數(shù)據(jù)庫(kù)進(jìn)行比較這個(gè)人是不是你的時(shí)候,這種精度已經(jīng)到了萬(wàn)率級(jí)的誤差。基本上用攝像頭以及算法,在中國(guó)最好什么壞事都不要做,哪怕在你的汽車(chē)?yán)锩?,在加油站的時(shí)候拍了一張你的手放在不該放的地方,很快就會(huì)被傳播出來(lái),識(shí)別精度如此之準(zhǔn)確的。
一年多以前微軟亞洲研究院的孫劍帶領(lǐng)著團(tuán)隊(duì)用了152層的神經(jīng)網(wǎng)絡(luò)作出了超過(guò)人類(lèi)的圖象識(shí)別精度的算法。再次想跟大家驗(yàn)證的是,當(dāng)我們模型復(fù)雜度剛剛開(kāi)始增加,從8層到152層的時(shí)候,我們看到計(jì)算量增加,看到持續(xù)的訓(xùn)練數(shù)據(jù)的增加。在2012年8層神經(jīng)網(wǎng)絡(luò)的時(shí)候,相應(yīng)的神經(jīng)元超過(guò)65萬(wàn)個(gè),連接超過(guò)6億。152層網(wǎng)絡(luò)的時(shí)候神經(jīng)元到了2200萬(wàn),因?yàn)橛行碌乃惴?,但參?shù)調(diào)整更加準(zhǔn)確,因?yàn)樗倪B接可以看到有113億,我們大腦里面神經(jīng)元的突觸鏈接應(yīng)該是一百萬(wàn)億的。
人工智能的進(jìn)展在很大意義上是從原來(lái)的傳統(tǒng)建模、制定規(guī)則到今天依賴于數(shù)據(jù)機(jī)器學(xué)習(xí)的根本轉(zhuǎn)變。這種轉(zhuǎn)變恰恰是因?yàn)槲覀兘裉煊辛藬?shù)據(jù),覆蓋度越來(lái)越好,精度越來(lái)越高,從而我們對(duì)模型的依賴比較低了,或者是說(shuō)再?gòu)?fù)雜的模型都有足夠數(shù)據(jù)訓(xùn)練。
過(guò)去的傳統(tǒng)AI的算法或者是神經(jīng)網(wǎng)絡(luò)之所以不能夠達(dá)到今天的精度,很大程度上是因?yàn)槲覀儧](méi)有非常好的數(shù)據(jù),從而依賴于某種模型,依賴于某種算法。在今天,我們已經(jīng)在很大程度上覆蓋整個(gè)樣板空間的時(shí)候,我們數(shù)據(jù)如此之大,從而使得我們?cè)瓉?lái)非常困難的問(wèn)題,今天解決的非常好。
不同的算法的性能會(huì)隨著數(shù)據(jù)量變化產(chǎn)生的變化,當(dāng)數(shù)據(jù)量增加的時(shí)候它的精度也在迅速提高。但是你可能會(huì)問(wèn)一個(gè)問(wèn)題,是不是現(xiàn)在我們有足夠多的數(shù)據(jù),從而我們?nèi)斯ぶ悄芫湍軌蚋采w所有的場(chǎng)景?去年發(fā)生第一起特斯拉傷人的事件,說(shuō)明即使特斯拉這樣每天有幾十萬(wàn)輛車(chē)在路上跑,但是數(shù)據(jù)依然不夠,依然在有些情況下出現(xiàn)死人的事故。
如果做數(shù)據(jù)庫(kù)的人不知道Jim Grey,那基本上不應(yīng)該跟別人說(shuō)是做數(shù)據(jù)庫(kù)的。Jim Grey他在十多年前就提出了人類(lèi)在做科研的四個(gè)不同的范式。過(guò)去最早的純粹基于觀察和實(shí)驗(yàn),百年前的理論模型,幾十年前開(kāi)始的計(jì)算模型,到今天數(shù)據(jù)推動(dòng)的模型。過(guò)去十年大數(shù)據(jù)進(jìn)展非???,大數(shù)據(jù)已經(jīng)開(kāi)始在企業(yè)里面大規(guī)模的進(jìn)行運(yùn)用了。
美國(guó)一個(gè)咨詢公司調(diào)查了300家3000人以上的公司,基本上60%的IT公司都在使用大數(shù)據(jù)了,只是說(shuō)使用層次不一樣。最早期是統(tǒng)計(jì)發(fā)生了什么,后來(lái)分析發(fā)生的事情,到今天預(yù)測(cè)怎么樣發(fā)生。未來(lái),大數(shù)據(jù)將洞察什么樣的決策是好的商業(yè)決策,再進(jìn)一步的認(rèn)知真正落實(shí)到行動(dòng)上,也就是自我學(xué)習(xí)的能力了。
英特爾這樣老牌的公司今天在瘋狂并購(gòu)做AI或者創(chuàng)作數(shù)據(jù)的公司,比如說(shuō)兩個(gè)月以前以天價(jià)并購(gòu)了一家以色列公司Mobileye。原因很簡(jiǎn)單,英特爾認(rèn)為汽車(chē)其實(shí)是人類(lèi)生活中能產(chǎn)生大量數(shù)據(jù)的設(shè)備,這些數(shù)據(jù)能夠幫助數(shù)據(jù)使用者給人畫(huà)像、判斷一些商業(yè)應(yīng)用。而這一切產(chǎn)生的過(guò)程、處理的過(guò)程由英特爾控制,這意味著它控制了另外一個(gè)新的平臺(tái),這是為什么英特爾在這方面投入這么大的資本。
講完了計(jì)算和大數(shù)據(jù)。再回到一開(kāi)始的所說(shuō)的算法的進(jìn)展。
3
深度學(xué)習(xí)的基本原理
大數(shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí)方式,是機(jī)器自主學(xué)習(xí);
深度學(xué)習(xí)第三次浪潮的特征:大數(shù)據(jù) 強(qiáng)計(jì)算 新算法。
AI做了60年,終于迎來(lái)了第三次浪潮,這次浪潮看起來(lái)比前面兩次浪潮來(lái)得更猛烈,而且解決的問(wèn)題比以前更多。很重要的是,我們用的深度學(xué)習(xí)的方式與傳統(tǒng)的專(zhuān)家系統(tǒng)方式有很大的不一樣。專(zhuān)家系統(tǒng)的方式是人總結(jié)規(guī)則,然后把規(guī)則交給機(jī)器,機(jī)器來(lái)開(kāi)始利用這個(gè)規(guī)則面對(duì)使用場(chǎng)景。深度學(xué)習(xí)方式,大數(shù)據(jù)來(lái)驅(qū)動(dòng)的是機(jī)器自己來(lái)學(xué)習(xí)的。好處是機(jī)器本身具有學(xué)習(xí)能力,所以可以較容易地從一個(gè)應(yīng)用擴(kuò)展到另外一個(gè)應(yīng)用。
過(guò)去的十年,恰恰是深度學(xué)習(xí)迅速發(fā)展的十年。2006年Hinton在Nature發(fā)表文章,標(biāo)志了深度學(xué)習(xí)這個(gè)詞誕生。2010年隨著大數(shù)據(jù)的爆發(fā),深度學(xué)習(xí)熱潮開(kāi)始興起。2012年Hinton這個(gè)團(tuán)隊(duì)用CNN模型以超過(guò)第二名10個(gè)百分點(diǎn)的成績(jī)奪得當(dāng)年競(jìng)賽冠軍。到了2016年的AlphaGo,人們對(duì)深度學(xué)習(xí)的能力沒(méi)有懷疑了,深度學(xué)習(xí)將會(huì)改變?nèi)祟?lèi),這是一個(gè)新的時(shí)代的到來(lái)。
深度學(xué)習(xí),到底是什么樣的東西?神經(jīng)網(wǎng)絡(luò)這件事其實(shí)在第二次浪潮(80-90年代)就已經(jīng)開(kāi)始了,大家已經(jīng)用過(guò)了,80年代-90年代初,神經(jīng)網(wǎng)絡(luò)泛濫的一塌糊涂。那個(gè)時(shí)候數(shù)據(jù)量不夠,就是輸入層、輸入層、隱含層。另外一個(gè)根本改變是今天的設(shè)備、速率如此之強(qiáng)大。
為什么深度學(xué)習(xí)方法不一樣了?首先是一開(kāi)始的原理就是神經(jīng)網(wǎng)絡(luò),類(lèi)似大腦的思考原理。人類(lèi)大腦大概有1000億個(gè)神經(jīng)元,在這些神經(jīng)元之間有超過(guò)一百萬(wàn)億的連接。神經(jīng)元的數(shù)字還有連接的數(shù)字,是人智力很重要的標(biāo)志。一個(gè)具體的神經(jīng)元就是有一個(gè)核加上一個(gè)突觸鏈,我們根據(jù)這種原理做模擬神經(jīng)元。并且將它跟別的神經(jīng)元的連接。經(jīng)過(guò)一個(gè)非線性的函數(shù),從而轉(zhuǎn)成一個(gè)輸出。輸出的信號(hào)就是你所需要的結(jié)果。當(dāng)神經(jīng)元多了的時(shí)候,或者層數(shù)多的時(shí)候顯然需要的訓(xùn)練數(shù)據(jù)就要更多。
為什么大數(shù)據(jù)實(shí)際上是深度學(xué)習(xí)驅(qū)動(dòng)力?以前模擬系統(tǒng)來(lái)做的神經(jīng)元,用物理模擬機(jī)器來(lái)做這個(gè)復(fù)雜度,不可能做到一億的神經(jīng)元,不可能做到一百萬(wàn)億的連接。但是今天我們用計(jì)算機(jī)能夠做到。深度學(xué)習(xí)是什么意思?很簡(jiǎn)單,深度學(xué)習(xí)就是層數(shù)比較多的神經(jīng)網(wǎng)絡(luò)。每一次訓(xùn)練你輸出一系列的數(shù)據(jù),當(dāng)實(shí)際輸出和目標(biāo)函數(shù)有一定的差距,這個(gè)差距反饋回去再進(jìn)行訓(xùn)練,這是整個(gè)循環(huán)的過(guò)程。
4
AI的發(fā)展與影響
AI的應(yīng)用與未來(lái):輔助人,代替人,超越人;
機(jī)器將造成未來(lái)社會(huì)出現(xiàn)90%的閑人,但機(jī)器難以替代資本家、藝術(shù)家和手藝人;
機(jī)器在感知上超越了人類(lèi),但在認(rèn)知上還要5-10年。
講完深度學(xué)習(xí),我們可以想像當(dāng)神經(jīng)網(wǎng)絡(luò)增加到152層的時(shí)候它的復(fù)雜性是什么樣的增長(zhǎng)。這種增長(zhǎng)使得今天的AI,今天的機(jī)器學(xué)習(xí)不光是能夠輔助人,而且很大程度上會(huì)代替人,未來(lái)還會(huì)在很大程度上超過(guò)我們。也許這是我們今天不愿意接受的。
未來(lái)AI會(huì)超過(guò)我們。到底怎么樣超過(guò)?其實(shí)我們想象一下人工智能今天確實(shí)能夠做很多人類(lèi)能夠做的事情。原因是為什么?人類(lèi)可以像AlphaGo一樣一晚上下一百萬(wàn)盤(pán)棋嗎?能夠像特斯特收上百輛的車(chē)同時(shí)收集數(shù)據(jù)并進(jìn)行同時(shí)學(xué)習(xí)嗎?這做不到。同樣今天人類(lèi)不可能對(duì)遍布于全國(guó)各個(gè)火車(chē)站,各個(gè)機(jī)場(chǎng)的數(shù)據(jù)同時(shí)進(jìn)行處理,也就是說(shuō)規(guī)模你也比不上。
人工智能會(huì)代替人、超越人是時(shí)間問(wèn)題。不光是這樣,機(jī)器學(xué)習(xí)在一些場(chǎng)景做的比人還好,因?yàn)槿送ㄟ^(guò)觀察、通過(guò)思考判斷出來(lái)的東西,人工智能通過(guò)學(xué)習(xí)很大程度上比你做得快。AlphaGo已經(jīng)完全展示出了,人們?cè)趪暹@一點(diǎn)上是已經(jīng)被人工智能打敗了。
投資決策、政策、規(guī)劃、戰(zhàn)爭(zhēng)沙盤(pán)推演這些很大程度都是靠經(jīng)驗(yàn)的。今天從AlphaGo上看到的,人工智能在這些場(chǎng)景里都會(huì)超過(guò)人類(lèi),這是因?yàn)闄C(jī)器本身的自我學(xué)習(xí)的能力已經(jīng)非常強(qiáng)大。像開(kāi)車(chē)、滑雪、畫(huà)畫(huà)、拉提琴這些不可能通過(guò)看手冊(cè)就能學(xué)會(huì)的事情,人工智能也已經(jīng)超過(guò)了人類(lèi)。其實(shí)我們自以為很了不起的東西,人工智能看的比我們要透徹。
前一段AlphaGo隱姓埋名跟人類(lèi)下棋,世界排名第一名的柯潔下輸了后感慨地說(shuō)人類(lèi)三千年的圍棋文化只是接觸了圍棋的皮毛。我們以前下圍棋,人類(lèi)的思考實(shí)際上只是看到一個(gè)本地的最優(yōu)解,不可能翻山越嶺去看,但是AlphaGo可以看到山外還有山。是因?yàn)樗臄?shù)據(jù)處理能力比我們強(qiáng),所以它學(xué)到了這一點(diǎn)。人類(lèi)以后再也不可能贏AlphaGo了。這就是殘酷的現(xiàn)實(shí)。
舉一個(gè)微軟研究院的例子。在這個(gè)例子里,機(jī)器看到Stop Sign標(biāo)志,會(huì)描述出這是在一個(gè)城市邊上有這樣一個(gè)標(biāo)志,有紅色,立柱,與交通相關(guān)等等標(biāo)簽。這個(gè)系統(tǒng)希望能看圖講故事,不是看圖識(shí)字,是識(shí)圖講故事。
這里有另外一個(gè)例子:這幅照片是一位婦女在廚房準(zhǔn)備食物。第一個(gè)描述是一個(gè)婦女在廚房準(zhǔn)備食物。第二個(gè)描述寫(xiě)的是,一個(gè)婦女在廚房水臺(tái)邊上準(zhǔn)備一份午餐或者早餐。第一個(gè)是機(jī)器學(xué)的,在這一點(diǎn)上機(jī)器已經(jīng)超過(guò)了人。你可以說(shuō)這個(gè)人不會(huì)講故事,但是至少機(jī)器能夠講出比他還好的故事。當(dāng)然了,這還是屬于探索的階段。
據(jù)說(shuō)在AI的浪潮下最安全是考古學(xué)家??墒沁@個(gè)社會(huì)上考古學(xué)家也不需要太多,工資也不會(huì)太高。男怕入錯(cuò)行,女怕嫁錯(cuò)郎。隨著這些的變化,未來(lái)哪些工作會(huì)被AI取代,社會(huì)將是什么樣的?
全球化是在全球范圍內(nèi)尋找最廉價(jià)完成某一項(xiàng)制造的過(guò)程,于是全球化導(dǎo)致了兩級(jí)分化,導(dǎo)致了跨國(guó)企業(yè)效率不斷提高,也導(dǎo)致了包括美國(guó)在內(nèi)發(fā)達(dá)國(guó)家藍(lán)領(lǐng)工人的失業(yè)。AI是否會(huì)加劇這個(gè)趨勢(shì)?
未來(lái)可能會(huì)有兩種人,一種叫神人,一種叫閑人。問(wèn)題是90%以上的是閑人,這怎么辦?其實(shí)去年瑞士的國(guó)家有一個(gè)議員提出了,不管工作不工作每個(gè)人先發(fā)三千法郎,工作再拿另外的錢(qián)。瑞士人還是比較冷靜,全民公投沒(méi)有通過(guò)。未來(lái)可能只有三種人能夠?qū)笰I,資本家是沒(méi)有問(wèn)題的,未來(lái)仍需要資本運(yùn)作。另外就是藝術(shù)家和手藝人,這類(lèi)技能機(jī)器暫時(shí)不能學(xué)過(guò)來(lái)的。當(dāng)然大部分人很難做到這三種人。
人工智能的局限在哪兒?強(qiáng)AI(GAI)依然道路漫長(zhǎng)。機(jī)器在感知上已經(jīng)超過(guò)了人,但是認(rèn)知可能還有5-10年甚至更長(zhǎng)的路要走。
深度學(xué)習(xí)的方式,有沒(méi)有問(wèn)題?其實(shí)有一個(gè)很大的問(wèn)題,事實(shí)上是人們給自己創(chuàng)造出來(lái)的一個(gè)問(wèn)題。人工智能或者機(jī)器智能是機(jī)器通過(guò)觀察體驗(yàn)來(lái)學(xué)習(xí),機(jī)器本身可以對(duì)自己進(jìn)行編程,程序員不再需要寫(xiě)命令解決問(wèn)題,而程序會(huì)根據(jù)示例數(shù)據(jù)和期望輸出生成自己的算法。
今天在很多領(lǐng)域已經(jīng)往這些目標(biāo)行進(jìn),第一個(gè)案例,比如Nvidia無(wú)人駕駛車(chē),不是靠程序員指令走的,完全靠觀察人的行為,觀察人們開(kāi)車(chē)的行為來(lái)確定自己駕車(chē)方法。第二個(gè)案例,在紐約一家醫(yī)院開(kāi)發(fā)了一套系統(tǒng),叫做Deep Patient,醫(yī)院只給了它70萬(wàn)個(gè)病例,然后這個(gè)系統(tǒng)從70萬(wàn)的病例中學(xué)習(xí),通過(guò)數(shù)據(jù)發(fā)現(xiàn)規(guī)律,總結(jié)出了非常強(qiáng)的疾病預(yù)測(cè)能力,尤其患精神分裂癥的預(yù)測(cè)能力遠(yuǎn)遠(yuǎn)超過(guò)了大夫。第三個(gè)案例,美國(guó)軍方大量投入機(jī)器學(xué)習(xí),為車(chē)輛和飛行器導(dǎo)航確定攻擊目標(biāo),在大量數(shù)據(jù)中間挖掘出恐怖分子的一些信息,都已經(jīng)遠(yuǎn)遠(yuǎn)超出了人們一開(kāi)始的預(yù)期。深度學(xué)習(xí)已經(jīng)具備了這樣的能力,但是深度學(xué)習(xí)依然沒(méi)有能夠解釋自己的行為。還是黑匣子。
人類(lèi)歷史上從來(lái)沒(méi)有創(chuàng)造過(guò)這樣一個(gè)機(jī)器,這個(gè)機(jī)器的行為和判斷連人類(lèi)都不能完全理解。今天我們創(chuàng)造了深度學(xué)習(xí)的機(jī)器不能判斷和解釋自己的行為,這就是今天我們感覺(jué)到不舒服的。人們反而問(wèn)自己,我們自己作出了很多判斷我們自己能夠說(shuō)清楚為什么做的嗎?可是人類(lèi)可以容忍自己的這種情況,但是不能容忍機(jī)器的這種情況。美國(guó)國(guó)防部就將機(jī)器學(xué)習(xí)的不可解釋性定性為“關(guān)鍵的絆腳石”。
當(dāng)然未來(lái)一定是說(shuō),人們需要跟機(jī)器不斷合作。我們看動(dòng)物到人的進(jìn)化,其實(shí)智力進(jìn)化的本質(zhì)特征是進(jìn)化到一個(gè)系統(tǒng),這個(gè)系統(tǒng)連創(chuàng)造者都無(wú)法解釋。今天我不敢保證上帝理解我們今天做的這么多的事情。為了這個(gè)擔(dān)心,研究人員已經(jīng)開(kāi)始在進(jìn)行一些分析,來(lái)試圖理解或者跟蹤這種決策的過(guò)程。
終級(jí)目標(biāo),機(jī)器和人到底有什么區(qū)別?
它比你來(lái)得快,比你大,某些能力比你還強(qiáng)。它和人類(lèi)區(qū)別在哪兒?
求生本能,對(duì)于死亡的恐懼,這是機(jī)器沒(méi)有的,這是定義出人和機(jī)器一個(gè)根本性的區(qū)別。人和動(dòng)物的演化速度,一系列的求生本能,被打了會(huì)跑,避免疼痛,會(huì)食色,會(huì)有歸屬感。人類(lèi)做壞事也是因?yàn)閷?duì)死亡的恐懼,對(duì)欲望的驅(qū)動(dòng)。機(jī)器本身目前為止因?yàn)樗粦峙滤劳?,所以也沒(méi)有感情,沒(méi)有感情是不是就不能說(shuō)有智能呢?這是一個(gè)宗教問(wèn)題,不是一個(gè)科學(xué)問(wèn)題。
講完了機(jī)器學(xué)習(xí)我們到此打住,我時(shí)間到了,很快講一下AI投資的判斷。
5
AI投資的機(jī)會(huì)與陷阱
在對(duì)AI投資的判斷中,產(chǎn)業(yè)鏈包含:基礎(chǔ),技術(shù),應(yīng)用;
基礎(chǔ)被巨頭控制,技術(shù)層面能否出來(lái)一些公司依然存疑;
應(yīng)用層要尋找能夠大量產(chǎn)生數(shù)據(jù)的產(chǎn)業(yè)。
過(guò)去經(jīng)驗(yàn)也告訴大家,每一波科技浪潮中會(huì)有一些平臺(tái)性的公司。我們談AI投資,到底投什么?就像我們談PC的投資,談互聯(lián)網(wǎng)的投資我們是談生態(tài)鏈。
在對(duì)AI投資的判斷中,產(chǎn)業(yè)鏈包含基礎(chǔ)、技術(shù),應(yīng)用。基礎(chǔ)這個(gè)層面已經(jīng)被巨頭控制了,基礎(chǔ)層有兩大塊:基本計(jì)算能力和數(shù)據(jù)?;居?jì)算能力無(wú)論是谷歌還是微軟,包括中國(guó)百度都已經(jīng)把它作為SaaS服務(wù)提供出來(lái)了。技術(shù)這一塊,沒(méi)有數(shù)據(jù)能否成為一個(gè)平臺(tái)?。在SaaS這一塊,不是通用的SaaS,也許在SaaS應(yīng)用這一塊能夠出來(lái)一些公司?這也是一個(gè)非常大的問(wèn)號(hào)。
應(yīng)用層中,AI其實(shí)是AI 這個(gè)場(chǎng)景,它是一種生產(chǎn)力提高的工具,會(huì)讓所有以前的應(yīng)用變得更加有效,當(dāng)然你要找比較容易突破的。顯然這個(gè)錢(qián)多和數(shù)據(jù)多的行業(yè)是最早發(fā)揮功效的地方。所以我們要找這個(gè)產(chǎn)業(yè)是不是大量產(chǎn)生數(shù)據(jù),是否有這個(gè)數(shù)據(jù)能夠不斷拓展,不斷創(chuàng)造價(jià)值,從而使得我們能夠在這一里面把原有的生態(tài)進(jìn)行改變。
如果說(shuō)上一波是互聯(lián)網(wǎng),這一波是AI。大家要注意AI跟互聯(lián)網(wǎng)的區(qū)別。最簡(jiǎn)單的可以說(shuō),AI發(fā)展到一年多以后我們就發(fā)現(xiàn)實(shí)際上是智能 。AI技術(shù)驅(qū)動(dòng),更加從垂直開(kāi)始。因?yàn)榧夹g(shù)本身發(fā)展的太快了,而互聯(lián)網(wǎng)是商業(yè)模式創(chuàng)新,是全新的應(yīng)用,贏家通吃在AI那一塊未必行得通。
根據(jù)這個(gè)觀察可以看一下今天AI投資的情景,今天AI顯然是有很多泡沫,最大的泡沫我覺(jué)得是在估值公司。你去你找一家公司談,每一家公司都說(shuō)我自己是AI公司。真正看這家公司是不是AI公司,更重要的是它要有數(shù)據(jù)。能夠不斷有數(shù)據(jù),它能夠不斷搶占數(shù)據(jù)的高低,這是我們的核心。
今日頭條這家公司,之所以能夠站穩(wěn),在過(guò)去五年之間突然出現(xiàn),有它一個(gè)根本的原因,那就是信息的獲取這個(gè)大的需求。今日頭條在人工智能開(kāi)始使用的時(shí)候迅速占領(lǐng)高地,它第一個(gè)用搜索的方法做了新聞推薦,從而它本身這個(gè)系統(tǒng)就是一個(gè)很大的學(xué)習(xí)網(wǎng)絡(luò),使得今天能夠不斷的演化,推薦的能力不斷增強(qiáng),從而在這個(gè)基礎(chǔ)上對(duì)核心的能力進(jìn)行突破。我們完全可以預(yù)測(cè)未來(lái)的今日頭條就是一個(gè)超級(jí)的智能系統(tǒng),同樣我們看到了它的數(shù)據(jù)量是如此之大,它已經(jīng)遠(yuǎn)遠(yuǎn)超過(guò)了一開(kāi)始的文字到今天走向圖象,走向論壇,走向直播,它其實(shí)所具備是不斷增加的數(shù)據(jù)。
最后,AI的投資。如果你記住我剛剛所說(shuō)的話就是三個(gè)投資點(diǎn),第一是“智能 ”,所有公司都應(yīng)該具備的一種能力,而這個(gè)能力是它核心競(jìng)爭(zhēng)力。第二,AI產(chǎn)業(yè),包括自主開(kāi)發(fā)、咨詢服務(wù)、人工智能即服務(wù)AI-aas。第三,要有數(shù)據(jù)和人才。
人才、數(shù)據(jù)是核心,投算法本身就是投人,我前面談到深度學(xué)習(xí)的訓(xùn)練需要人對(duì)于這個(gè)算法的理解并且掌握的訓(xùn)練的技巧,懂算法還要懂應(yīng)用的人才是非常有價(jià)值的。另外,數(shù)據(jù)實(shí)際上是AI公司最終的護(hù)城河。
最后一點(diǎn),給大家一個(gè)信息,就是AI這個(gè)領(lǐng)域里面中國(guó)人才是非常多的。高盛的一個(gè)AI報(bào)告指出,在過(guò)去的五年里面發(fā)表的跟神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)相關(guān)的文章里面,中國(guó)人作者的數(shù)量已經(jīng)超過(guò)了美國(guó),而且還持續(xù)增長(zhǎng)。在引用的文章里面中國(guó)作者的數(shù)量也超過(guò)了美國(guó),而且還在持續(xù)增長(zhǎng)。所以至少我們?cè)谶@個(gè)是里面中國(guó)人不少,數(shù)量多了之后以后自然就有強(qiáng)人。在人才這一塊中國(guó)不差。
另外,中國(guó)發(fā)生的數(shù)據(jù)如此的巨大。也就是說(shuō)中國(guó)有人才、有數(shù)據(jù)。所以AI這一塊一定是中國(guó)創(chuàng)新和投資的新希望。謝謝大家。
聯(lián)系客服