關於人工智能,幾個容易 “想當然” 的誤解
[按]本文節選自公眾賬號“機器之心”(almosthuman2014),英文原載IEEE《Spetrum》,作者Lee Gomes,由機器之心獨家翻譯出品。全文鏈接見此。
IEEE 《Spectrum》的Lee Gomes與LeCun(Facebook人工智能實驗室主任,卷積神經網絡專家)進行了一次深度談話,本文摘選了其中和人工智能定義和應用最密切相關的幾部分。
用8個單詞解釋“深度學習”
IEEE Spectrum:這些天我們看到了許多關於深度學習的新聞。在這些對深度學習的眾多描述中,你最不喜歡哪一種?
Yann LeCun:我最不喜歡的描述是「它像大腦一樣工作」,我不喜歡人們這樣説的原因是,雖然深度學習從生命的生物機理中獲得靈感,但它與大腦的實際工作原理差別非常非常巨大。將它與大腦進行類比給它賦予了一些神奇的光環,這種描述是危險的。這將導致天花亂墜的宣傳,大家在要求一些不切實際的事情。人工智能之前經歷了幾次寒冬就是因為人們要求了一些人工智能無法給與的東西。
Spectrum:因此,如果你是一名關注深度學習的記者,而且像所有新聞記者所做的那樣,只用八個單詞去描述它,你會説什麼?
LeCun:我需要考慮一下。我想將會是「學着描繪世界的機器」(machines that learn to represent the world)。可能另外一種描述是「端對端的機器學習」(end-to-end machine learning)。這種理念是:在一個能夠學習的機器中,每一個組件、每一個階段都能進行訓練。
Spectrum:你的編輯可能不大喜歡這樣。
LeCun:是的,公眾將無法理解我所表達的意思。好吧,有另外一種方法。你可以把深度學習看作是,通過整合大量能夠基於相同方式訓練的模塊和組件來構建擁有學習能力的機器,比如説模式識別系統等。因此,需要一個能夠訓練每個事物的單一原則。但這又超過了八個字。
Spectrum:有哪些事情是深度學習系統可以做,而機器學習無法做到的?
LeCun:這是個更好的問題。之前的系統,我想我們可以稱之為「膚淺的學習系統」,會受他們能計算的函數的複雜度所限。因此,如果你使用一個類似於「線性分類器」的膚淺學習算法來識別圖像,你將需要從圖像中提取出足夠多的參數特徵來提供給它。但手動設計一個特徵提取器非常困難,而且很耗時。
或者使用一個更加靈活的分類器,比如説「支持向量機」或者兩層神經網絡,直接將圖片的像素提供給它們。而問題是這不會提高物體識別在任何程度上的準確性。
Spectrum:這聽起來不像是一個簡單易懂的解釋。或許這就是為什麼那些記者會嘗試着把深度學習描述成……
LeCun:像我們的大腦。
有5億個開關的黑盒子
Spectrum:其中有一個問題是,機器學習是一個非專業人士極其難以接近的研究領域。一些經過教育的外行能夠理解一些半技術性的計算問題,比如説Google使用的 PageRank算法。但我敢打賭只有教授才能對線性分類器和向量機瞭若指掌。這是因為該領域從本質上就很複雜難懂嗎?
LeCun:事實上,我認為機器學習的基礎原理非常簡單易懂。我曾經向高中的老師和學生解釋過這一主題,並沒有讓其中的許多人覺得枯燥乏味。
模式識別系統就像一個黑盒子,背面裝有攝像頭,頂上有一個紅燈和一個綠燈,前面裝有一連串開關。比如説一種嘗試着調節開關的學習算法,當一條狗出現在攝像頭中時控制開關使紅燈亮起;當一輛車出現在攝像頭中時控制開關使綠燈亮起。為了訓練該算法,你將一條狗放在機器面前,如果紅燈亮起,什麼都不做。如果光線模糊,扭動旋鈕使燈變亮。如果綠燈亮起,扭動旋鈕使燈光變暗;接下來換成汽車,扭動旋鈕使紅燈變暗或綠燈變亮。如果你進行多次嘗試,並且保持每次都對旋鈕進行逐漸微調,最終,機器每次都能得出正確答案。
有趣的是它能正確的區分開它從未見過的汽車和狗。竅門在於要計算出每次扭動旋鈕的方向和幅度,而不是亂動一氣。這包含對「梯度」的計算,旋鈕的每次扭動代表着燈光的相應改變。
現在想象一下,有個盒子擁有5億個旋鈕、1000個燈泡,用1000萬張圖來訓練它。這就是一個典型的深度學習系統。
Spectrum:我認為你用「膚淺的學習」這個詞好像有些不太嚴謹;我不認為那些使用線性分類器的人會認為他們的工作很「膚淺」。之所以用「深度學習」這個表述難道就沒有媒體宣傳的因素在裏面?因為這看起來好像它學到的東西很有深度,但實際上,「深度」僅僅是指這個系統的級數?
LeCun:是的,是有點兒滑稽,但這反映了真實情況:膚淺學習系統有一層或兩層,而深度學習系統一般有5-20層。膚淺還是深度指的並不是學習行為本身,而是指被訓練的結構。