是這個人,一步步把 “深度學習” 從邊緣課題變 成Google 等網絡巨頭仰賴的核心技術
早在1960年代,Geoffrey Hinton的高中時期,就有一個朋友告訴他,人腦的工作原理就像全息圖一樣。
創建一個3D全息圖,需要大量的記錄入射光被物體多次反射的結果,然後將這些信息存儲進一個龐大的數據庫中。大腦儲存信息的方式居然與全息圖如此類似,大腦並非將記憶儲存在一個特定的地方,而是在整個神經網絡里傳播。 Hinton為此深深的著迷。
對Hinton來說,這是他人生的關鍵,也是他成功的起點。 “我非常興奮,”他回憶到,“那是我第一次真正認識到大腦是如何工作的”。在高中時代談話的鼓舞之下,Hinton在他的求學期間,在劍橋大學以及愛丁堡大學繼續他的神經網絡的探索。在80年代早期,他就參與了一個雄心勃勃的關於使用計算機的軟硬件來模擬大腦的研究,這形成了早期的AI的一個分支,也就是我們現在所說的“深度學習”。
三十多年的努力,深度學習已成為學術界炙手可熱的課題。現如今,Hinton和他的深度學習小團隊,包括紐約大學的Yann LeCun教授,蒙特利爾大學的Yoshua Bengio教授,在互聯網上已然大有名氣。作為多倫多大學的教授和研究員,Hinton也同時為Google工作,使用深度學習技術來改進語音識別,圖像標記和其他在線工具。 LeCun也在Facebook從事類似的工作。 AI風靡全球,微軟,IBM,百度和許多網絡巨頭都為之著迷。
在劍橋大學的心理學專業的本科學習當中,Hinton發現,科學家們並沒有真正理解大腦。人類大腦有數十億個神經細胞,它們之間通過神經突觸相互影響,形成極其複雜的相互聯繫。然而科學家們並不能解釋這些具體的影響和聯繫。神經到底是如何進行學習以及計算的,對於Hinton,這些正是他所關心的問題。
他不知道所有的答案,但在他的努力之下已經取得了進展。 “我非常興奮,我們改進了神經網絡,而這是一個比較接近大腦真實工作的方式。”他很高興的說到。在Hinton的世界裡,神經網絡本質上就像一個運行在多層面上的軟件。他和他的伙伴建立了一層層互相連接的人工神經元模型,模仿大腦的行為,處理視覺和語言等複雜問題。這些人工神經網絡可以收集信息,也可以對其做出反應。它們能對事物的外形和聲音做出解釋。它們對語言的理解也在進步。它們可以自行學習與工作,而不需要人為提示或者參與控制。這些正是它們與傳統的學習機器的區別。
隨著時間的推移,計算機能力的發展,神經網絡也更加快速,靈活,高效,得到了很好的擴展。因為這一切已經醞釀了30年了。
從非主流到核心技術
早在80年代初期,當Hinton和他的同事們剛開始這項研究時,那時的電腦還不夠快,不足以處理有關神經網絡的這些龐大的數據,他們取得的成就是有限的。而當時AI普遍的研究方向也與他們相反,都在試圖尋找捷徑,直接模擬出行為,而不是試圖通過模仿大腦的運作來實現。
在這樣艱難的環境下,Hinton和LeCun仍舊堅持了下來。就算到了2004,學術界對他們的研究仍未提起興趣。而這時距離他們首次提出“反向傳播”算法已經過了20年。這個算法是他們神經網絡研究的墊腳石。但也就在這一年,靠著少量的來自Canadian Institute for Advanced Research(CIFAR)以及LeCun和Bengio的資金支持,Hinton創立了Neural Computation and Adaptive Perception(NCAP,神經計算和自適應感知)項目。該項目邀請了來自計算機科學,生物,電子工程,神經科學,物理學和心理學等領域的專家參與。
精心挑選了這些研究人員,Hinton的目的是創建一個世界一流的團隊,致力於創建生物智能的模擬——至少他打算模擬出大腦運用視覺、聽覺和書面的線索來做出理解並對它的環境做出反應這一過程。 Hinton認為建立這樣一個小組對AI的研究將是一個創舉。在此之前,科學家們和工程師們各自為政,很少與其他領域的人合作。
事實證明他是對的。
得益於計算機能力的提高,NCAP實現了一些早期的想法。他們定期的舉行研討會,研究步伐也加快了。最終他們建立了更有效的深度學習的算法。贏得全球AI界的關注,並成功的吸引到了網絡巨頭們的注意。
2011年,NCAP研究成員同時也是斯坦福大學的副教授Andrew Ng在Google創立並領導了Google Brain項目,今天,Google正在用神經網絡來幫助識別Android手機上的語音命令和Google+網絡上標記的圖像。去年,Hinton與其他多倫多大學的研究人員加盟了Google,目的就是要把這項工作做進一步的發展。
與此同時,百度也在中國和矽谷創建了自己的AI實驗室。微軟也把深度學習技術用到了自己的語音識別研究上頭。而有了LeCun,Facebook也在進一步探索定向廣告和人臉識別技術。
另一個NCAP研究成員,Terry Sejnowski則正在幫助奧巴馬實施他斥資1億美元的“腦計劃”(全稱:推進創新神經技術腦研究計劃)。 Sejnowski正是與Hinton一起在80年代初發明了玻爾茲曼機的人,這可是最早的生成式隨機神經網絡之一。
只用了一年,Hinton和他的團隊就讓CIFAR看到他們的投資會有多麼豐厚的回報。而Google已經嚐到了甜頭。在這個過程中,Hinton和NCAP已然讓人刮目相看。相比傳統的工程技術,大學生們更樂意去從事深度學習的研究,來自阿姆斯特丹大學的計算機科學教授Max Welling如是說,“就算是遠在荷蘭的大學生,他們也知道正在發生什麼事,他們都想投奔到這個行業來呢。”
換句話說,深度學習是目前的主流。 “我們不再是極端分子了,”Hinton說,“我們現在可是炙手可熱的核心技術呢。 ”
Hinton和深度學習的未來
秋季,NCAP在舊金山舉行了年度研討會。該研討會探討範圍廣泛,包括了神經系統科學,機器學習,計算機圖形設計,面部識別和運動檢測等方面。在演講途中,Hinton靜靜的站在講台附近,大多數情況下,他只是聆聽,只是偶爾打斷演講者提出一兩個問題,或鼓勵他的智囊團提出問題並及時討論。他的冷靜、謙遜與公平,對NCAP的成員來說,建立了一個良好的開放合作的氛圍,這給他們帶來了鼓勵,也直接推進了世界的AI研究工作。
深度學習的革命是遲早會發生的,但有了NCAP,有了Hinton,微軟、Google、雅虎等網絡巨頭在語音識別、人工視覺系統等方面的發展就提前了許多。 “Geoff就像正能量,每個人都想向他看齊。”Bruno Olshausen,加州大學伯克利分校的Redwood神經系統科學研究中心的主任如是評價。
即便不是NCAP的成員也對此表示同意。 “在過去的20到30年裡,他一直在推動著神經網絡和深度學習在前進,”余凱,百度深度學習研究院副院長提到,“在此之前,機器學習或者AI技術從未如此對行業產生過如此迅猛的影響。”
Hinton也在世界範圍進行深度學習的演講,他在多倫多大學依然指導著研究生工作。通過NCAP和CIFAR,Hinton還創辦了一個暑期學校,由NCAP的成員進行教學,努力培養新一代的AI研究員。現在有了這麼多的公司進軍該領域,事情可比以前好辦多了。這領域也不僅僅是科技巨頭的專利了,像Ersatz, Expect Labs和Declara這樣的公司,正在起步。
深度學習下一步會朝著什麼方向呢?首要的應該是破譯人們發佈到網絡上的話吧,包括那些狀態的更新,即時消息和評論等。這些就有夠Facebook,Google和雅虎公司忙上一陣了,他們的目標就是在沒有人工的情況下真正理解他們的用戶到底在說什麼。
“我們希望把AI和CIFAR帶到一個美妙的新領域,”Hinton說,“一個還沒有人或者程序到達的境界。”
那是要去哪裡呢?
[本文編譯自:wired.com]
資料來源:36Kr