無敵是多麼寂寞,AlphaGo 要在星際 2 再次吊打人類


在兩週前落下帷幕的世紀圍棋人機大戰中,李世石最終以 1:4 的成績不敵 Google 出品的 AI AlphaGo。顯然,AlphaGo 團隊已經不滿足於圍棋一種遊戲,暴雪娛樂製作總監 Tim Morten 在 WCS 中國區總決賽上確認:

引用AlphaGo 接下來將要挑戰 《星際爭霸 2》

但暴雪官方沒有透露更多的細節信息,因為關於這場電子競技領域的人類大戰,Google 還在和暴雪處在商談過程中,而無疑人類也將會派出最高水平的電子競技選手與 AlphaGo 再次一決高下。


與圍棋不同,在《星際爭霸 2》中 Alpha 將難以推算出下一步應該做什麼,所以暴雪的娛樂製作總監 Time Morten 也預言 AlphaGo 將不會在 《星際爭霸 2》中戰勝人類。但是誰又能説的準呢?畢竟在 AlphaGo 挑戰李世石開始之前,人類也是對之後的戰局自信滿滿。


不過星際爭霸顯然與圍棋不同,圍棋對人操作的要求更低,只需要玩家謹慎思考然後下出棋子就好。但在星際爭霸等一些電子遊戲中,APM(Actions Per Minute)每分鐘操作次數,換句話來説就是我們常説的手速,是評價一個玩家競技水平的一個重要指標。而在星際爭霸和魔獸爭霸 3(WAR3)這兩款遊戲中 APM 的高低往往象徵着玩家操作的精細程度。但從理論上來講 AlphaGo 的 APM 可以調節到人類完全實現不了的水平,為了與人類的對戰更加公平,在真正比賽時 AlphaGo 的 “手速” 很有可能受到限制。


同時作為一款即時戰略類遊戲,星際爭霸對於 AlphaGo 來説還有很多難點需要突破,首先圍棋與星際爭霸是完全不同的兩種遊戲,圍棋的輸入值很小,只需要幾個數字就能描述清楚場上的局面,但是即時戰略遊戲需要有多少數據來處理,可以參考上面那張圖,雙方的兵力數量、兵種構成、每一個士兵的能力屬性、當前時間、地形等等。而所有這些的解析、決策、執行都需要在極短的時間時間內完成,這些需要極大的運算量。而從圍棋世紀大戰中我們可以看出,AlphaGo 也是需要一個較長的運算時間的,而戰局轉瞬即逝的星際爭霸 2 明顯不允許 AlphaGo 來慢慢考慮。


還有一處難點就是每一步的狀態改變,所造成的結果不一致。不僅僅是圍棋與即時戰略遊戲,即使是同類遊戲的星際爭霸 2 和魔獸爭霸 3,每走一步對最終的勝負完全是不一樣的,即使 AlphaGo 已經能夠算是一個圍棋大師,在星際爭霸 2 中還是需要打造它的團隊一點一點重新學習改進。像 AlphaGo 這樣 AI 行為還是需要對目標進行數學建模,然後使用各種算法去簡化和求解。越是難以數學建模的遊戲,構建 AI 的難度就越大,而像星際爭霸這樣的即時戰略遊戲,恰好是個很難建模的事務,需要很大的工作量。

那我們什麼時候能看到這場星際爭霸的人機大戰呢?可能還需要挺長一段時間,首先是因為 AlphaGo 的算法哲學其實是經驗主義的,也就是説,它並不關心也無法做到理解它每一步為什麼這麼走的深刻含義,但是它知道這樣走能夠獲取最高的預測勝率(通過一定程度的搜索、試錯與枚舉)。所以也就是説  AlphaGo 還需要一段時間的學習,先戰勝星際爭霸界的“樊麾”這些較低段位選手,才能挑戰星際爭霸界中的“李世石”這樣的世界大師。

下次在玩星際爭霸的時候,不要噴對面小學生了,也許對面坐着的,可是肩負戰勝 AlphaGo 大任的祖國花朵。

題圖插圖來自:遊民星空


資料來源:愛範兒(ifanr)
作者/編輯:張博文

如果喜歡我們的文章,請即分享到︰

標籤: AlphaGo