Google 的 AlphaGo 真的可以獨立「思考」嗎?
引用 創見乾貨:Google 的「AlphaGo」系統在圍棋上以 5 比 0 擊敗了歐洲圍棋冠軍,但這個系統的創造者卻不能解釋箇中原因。這難道意味着 AlphaGo 已經具備獨立思考的能力嗎?
在上個星期,研究人員和人工智能公司「DeepMind」(已經被 Google 收購)宣佈了一個重大突破:在上年 10 月份,由 DeepMind 公司設計的計算機系統「AlphaGo」以 5 比 0 的成績擊敗了歐洲圍棋冠軍。這場勝利在上週被刊登在《自然》雜誌(Nature)上。
那麼這究竟意味着什麼呢?隨着時間的推進,計算機在棋類遊戲上的表現已經越來越精湛了。例如在 1997 年的「黑暗時代」,IBM 的「深藍」(Deep Blue)計算機便曾經擊敗當時的世界象棋冠軍加里 · 卡斯帕羅夫(Garry Kasparov)。和使用 6 類棋子的國際象棋相比,圍棋所使用的只是黑白兩隻。那麼為什麼將 AlphaGo 在圍棋上的勝利視為重大突破呢?原因非常簡單:圍棋所具備的可能性甚至比整個宇宙的原子數量還多,自然要比國際象棋所具備的可能性要多得多。
「深藍」這類棋牌類程序的運行機制是為所有的可能性構建「搜索樹」,但想要為圍棋構建「搜索樹」絕非一件容易的事情,其計算時間可能長達數百萬年,甚至是數數十億年之久。DeepMind 公司的做法是將「搜索樹」(由 Google 公司強大的雲計算能力支撐)和深層神經系統結合在一起。和和人類的大腦一樣,這種模擬神經元的設計可以通過例子和經驗作出反應,因此程序中不同層級之間的連接將在極大程度上得到強化。
AlphaGo 首先研究了圍棋比賽中的 3,000 萬種可能性,進而從現實的棋局中汲取信息。隨後,AlphaGo 會通過 50 台計算機和自己進行博弈。配備有強化學習技術的 AlphaGo 在每一次迭代中都會得到優化。實際上,這項技術是 DeepMind 公司在不久前的實驗中開發出來的。在這次實驗中,DeepMind 公司的類神經網絡通過觀看電腦遊戲的玩家回放,自學成為了一位熟練的遊戲玩家。整個過程完全不涉及任何的編程工作。
AlphaGo 最讓人覺得震撼的一點是:不論是程序本身還是程序的開發者都不能解釋它所採取的行動。AlphaGo 能夠在許多困難的遊戲中展示出專業水準,它所展現的能力和我們所謂的「直覺」非常相近——在無意識推理的情況下汲取知識。截至目前為止,我們一直認為直覺是由人類專屬的一種特權。牛頓(Newton)在《自然哲學的數學原理》第二版中曾表示自己從來不作任何的假設。「我從不作任何假設。」他寫道,「但我已然知曉。」
如果 AlphaGo 真的可以證明機器也有具備直覺的可能,我們在人工智能技術上的發展將會步入一個全新的階段。我們目前尚不清楚直覺的運行機制,但我們總是假定直覺只是一個屬於人類範疇的名詞。由於牛頓是一位天才,因此我們傾向於相信他的説法,正如我們總是傾向於相信一位察覺出孩子異樣的母親,又或者相信某人能夠察覺出説謊的人。
重點在於直覺也有可能出錯。根據我們的日常經驗,直覺在很多時候往往並不正確,因此我們總會要求人們用證據和邏輯推理來佐證他們的直覺。但後面兩種元素缺失的時候,直覺的説服力就會大打折扣。在當下階段,過度關注計算機是否擁有直覺根本毫無必要,AlphaGo 是否能夠解釋自己所採取的行動也並非一個具有現實意義的問題。然而,當 DeepMind 的聯合創始人德米斯 · 哈撒比斯博士(Dr Demis Hassabis)實現了他的願景的時候,這個問題將會被提升至一個全新的高度。
「就效果而言,棋牌類遊戲確實是開發和測試人工智能技術的一個理想平台。」哈撒比斯在上週發佈的一篇博文中寫道,「但最終我們還是希望使用這些技術來解決困擾世界已久的一些重要問題。這些技術無疑是具有通用性的,我們的目標是讓它們幫助人類解決社會上最為緊迫、嚴峻的問題,例如氣候建模和病毒分析等等。」
另一方面,哈撒比斯認為人工智能技術的開發者需要肩負起一定的社會責任。他一直呼籲人們開展一場以「道德在人工智能技術的開發工作中應扮演怎樣的角色?」為主題的辯論。在去年 9 月份所舉行的一個活動上,哈撒比斯透露稱 Google 公司將會在內部設置一個道德委員會,以便對自己的所作所為進行監督。這個消息引起了與會人員的歡呼。
和領域中的其他人一樣,哈撒比斯認為人工智能技術非常強大,因此在長期確實有引發嚴重道德問題的可能。更有甚者,這項技術甚至還可能威脅到人類的存在。但至少就目前看來,DeepMind 公司所取得的進展非常喜人。
文章來源:theguardian,由 TECH2IPO / 創見 阮嘉俊 編譯,首發於 TECH2IPO / 創見
資料來源:TECH2IPO