優(yōu)酷視頻《Google DeepMind's Deep Q-learning playing Atari Breakout》(//v.youku.com/v_show/id_XMTUxODU2NjY5Ng==.html)展示的是Google deep mind發(fā)明的re-enforcement learning的一種算法。運用這種算法的機器可以自動跟游戲交互而學(xué)會怎樣更好地打游戲。 剛開始的時候電腦不太會玩這個游戲,然后逐漸學(xué)會了一些技巧,開始像一個人在打。最有意思的是它在若干輪的學(xué)習(xí)之后,發(fā)現(xiàn)了一個技巧——它可以把球打到空間的上方,然后讓它不斷地反彈,這樣就能不斷地得分,可以快速地把這個游戲的得分提升上去,整個學(xué)習(xí)過程都是機器自己完成的——這是最讓人興奮的地方。 彩云天氣團隊在天氣領(lǐng)域也有一個類似的構(gòu)想,就是利用人們的反饋,天氣觀測數(shù)據(jù)的彼此對照,作為一個輸入,讓算法自己不斷地改進自己,從而不斷提高天氣預(yù)報的準(zhǔn)確性。 具體到工程的實現(xiàn)上,可能需要很多前期的工作一步步完成,包括很大的開發(fā)工程,我們會在接下來的幾年中不斷優(yōu)化并實現(xiàn)這樣一個想法。