繼 AlphaGo 之後又一突破:人工智能 Libratus 戰勝頂級撲克選手
雷鋒網消息:當地時間1月30日,在賓夕法尼亞州匹茲堡的Rivers賭場,卡耐基梅隆大學(CMU)開發的人工智能系統Libratus戰勝四位德州撲克頂級選手,獲得最終勝利。
據官網介紹,此次由4名人類職業玩家Jason Les、Dong Kim、Daniel McAulay 和Jimmy Chou對戰人工智能程序Libratus,賽程為20天,一共進行了12萬手牌的比賽。
2015年,CMU曾組織了首場“大腦對抗人工智能”賽事。在當時的賽事中,代表CMU出戰的是另外一款人工智能系統“Claudico”,同樣也有4名職業撲克玩家參加了比賽,然而,Claudico並未獲得最終勝利。
不過CMU學認為,當時撲克職業玩家與Claudico僅進行了8萬手牌的比賽,就統計學角度來講並無法證明人類職業撲克玩家或人工智能具有優勢。這也是本輪巡迴賽中比賽的牌局數量增加50%的原因。
德州撲克的玩法:每個玩家有2張牌作為“底牌”,同時還有5張公共牌。玩家選擇5張公共牌裏的3張,與手裏的2張底牌組合,最後以期得到最好的5張牌的組合。按照“Card Ranking”決定最後的勝者。
由於對方的“底牌信息”是隱藏信息,對於計算機來説,就是在處理一種“非完整信息博弈”。而圍棋對弈雙方的信息是完整的、對稱的,並沒有隱藏的信息。Libratus此次戰勝頂級人類德州撲克選手,具有非常重要的意義。
引用計算機正確決定,依賴於對方“底牌信息”情況下的概率分佈,這種“底牌信息”可以通過對手過去的行為顯露出來。比如有時玩家採取“詐唬”(Bluffing),對手有時手裏並沒有強牌,但還是作出全額下注志在必得的行為,計算機這時要根據對方過去的博弈表現,來判斷對手有強牌的概率。
相應的,對手也會推斷我方的底牌信息,所以這裏就是一個“遞歸推理”(recursive reasoning),一個玩家無法輕易推理博弈狀況。
繼圍棋和德州撲克之後,人工智能的下一站會是哪個遊戲呢?
雷鋒網雷鋒網(公眾號:雷鋒網)
【招聘】雷鋒網堅持在人工智能、無人駕駛、VR/AR、Fintech、未來醫療等領域第一時間提供海外科技動態與資訊。我們需要若干關注國際新聞、具有一定的科技新聞選題能力,翻譯及寫作能力優良的外翻編輯加入。
簡歷投遞至 [email protected],工作地 北京。
雷鋒網版權文章,未經授權禁止轉載。詳情見轉載須知。
資料來源:雷鋒網
作者/編輯:周翔