AlphaGo 對李世乭“放水”?棋手説不可能!


就在輿論普遍認為李世乭將會繼續敗北的時候,人機大戰的第四場,李世乭出人意料地挽回了勝局,將比分改寫為“3:1”。

比賽開局階段,李世乭始終落後於 AlphaGo,一直在被吊打。然而,第78手的時候,局勢峰迴路轉,李世乭下出了關鍵的一步,一招極其冷門下出妙手。對於這一步棋,視頻觀戰的職業棋手古力評價為“神之一手”。

隨後,AlphaGo 一連串的差手讓棋面局勢利好於李世乭。在第97步,AlphaGo 再次出現低級失誤,所下白子被李世乭果斷吃掉。最終,經過長達4個多小時的鏖戰之後,AlphaGo中盤認輸,李世乭終於在這場人機大戰中贏回“尊嚴”之戰。


對於戲劇性的比賽結果,雷鋒網記者的朋友圈出現了有多種觀點看法,其中最有代表性的一種説法是“AlphaGo 選擇性放水“。甚至還有陰謀論表示,AlphaGo 今天失利是因為被改代碼。那麼,AlphaGo 放水的可能性有多大呢?


雷鋒網第一時間針對這一問題請教了圍棋界、科學界的專業人士。對此説法, 他們都表示,“可能性為零”。至於李世乭第78步的落子,完全可以稱得上是載入史冊的一次妙招!

業餘圍棋5段的高飛龍表示:

引用李世乭創造了歷史,第78步棋沒有一定水平看都看不懂,很高的職業水準才能想得到。

棋手鮑雲對於李世乭第78步下法給予了很高的評價:

引用“配得上最高評價神之一手。

AlphaGo 程序在大優局面的情況下被李世乭的妙手打懵了,導致在隨後的20來步進入瘋狗狀態。鮑雲表示:

引用AlphaGo 前半盤大優,不是防水的態度。至於AlphaGo 第97步的表現可以用“瘋狗病發作”來形容。78-97步,機器應該有足夠的(時間來)緩衝調整計算出局面走勢。97確實是很“丟狗”的一步,説明算法還是有極大的問題,抗擊打能力不足,崩潰的太脆了”。

那麼,AlphaGo 為何會出現如此明顯的異常表現?

根據Alphago原論文第一作者之一的Demis Hassabis 在賽後的總結,

引用“李世乭下出白78後,AlphaGo自我感覺良好,在程序的“值網絡”(用於評估電腦勝率)中,誤以為勝率達到70%,直到第87步才反應過來。”


高飛龍猜測,很可能是蒙特卡洛算法本身的一個缺陷。“78步本身是盲點,(李世乭)小概率的選點,很可能導致(AlphaGo)在正確率很高的算法上出現意外事件,導致出錯。”如果這一猜測成立,人類將可能找到每盤打敗阿爾法的策略。而Google公司,將需要很長的時間來修正這一“缺陷”問題。

出門問問NLP工程師李理也在微信羣給出了自己的猜測:

引用(如果一定要猜測)我覺得可能是開局主要靠value network,因為搜索空間太大,有可能在某些特殊的局面下出現非常差的結果。就像之前神經網絡識別圖片時也出現過很詭異的錯誤,還有人研究怎麼構造讓它識別出錯的例子。

同時,他也認為這一“詭異”問題將會比較難解決,

神經網絡打分是固定的,搜索有一定隨機性。而value network是異步的,調試也不簡單,得通宵加班找bug了。

PS.最新消息補充:

在賽後的記者招待會上,李世乭談到了AlphaGo的兩個弱點:一個是AlphaGo執黑棋時似乎掙扎比較多,相較執白棋時更難贏。另一個是,當它遇到出其不意的招數時,有可能會導致失誤,未必是失誤,就是bug。

那麼問題來了,第5場比賽,各位怎麼看?是李世乭再下一城還是AlphaGo 4:1 榮耀收關?


資料來源:雷鋒網
作者/編輯:陳留

如果喜歡我們的文章,請即分享到︰

標籤: Google  Deep Mind  AlphaGo  李世乭  李世石