別恐慌,大眾關心的人工智能問題學界都在努力求解

本文作者:微軟亞洲研究院副研究員 黃鉑鈞

今年是美國人工智能協會(AAAI – the Association for the Advance of Artificial Intelligence)組織首次在冬天舉辦旗幟性年會:AAAI 2015大會。大會總共收到超過2000篇投稿,最終收錄了500餘篇論文,又從中選取200餘篇分為十餘個方向在現場報告。會議期間,除了這些主流技術報告外,主辦方還組織了一系列活動,包括各類AI競賽,機器人展示,公眾開放日,主題辯論,專題研討會等等。這裏我簡單談談那些給我個人印象較深的部分。
人工智能研究的道德問題

與人工智能有關的職業和社會道德問題是主題演講中最熱門的話題。最近一段時間這個問題似乎確實受到了整個社會的廣泛關注。一些為大眾所熟知的科技明星,如Stephen Hawking和Elon Musk,表達了人工智能技術的突破會對人類自身構成威脅的擔憂。

而加州大學伯克利分校計算機系教授Stuart Russell(目前最權威的人工智能專著的作者)則在他的主題演講中表示:現有人工智能技術水平距離引發“機器人統治人類”之類的風險還為時尚早。不過,他也認為人工智能技術的研究和應用與核武器、生化技術、基因技術等其他影響巨大的技術一樣,應該受到規範化約束。

“ACM通訊”雜誌的主編Moshe Vardi教授做了一個關於人工智能技術進步引發的失業問題的主題演講。他提到以往的幾次技術革命在導致失業的同時也創造了大量新型工作。但人工智能技術的發展有可能從本質上對創造新工種貢獻有限,從而在整體上對就業產生負面影響。

另外,大會還組織了一個關於自治武器的倫理問題的公開辯論也相當有趣。

個人覺得,對人工智能技術的這一波“擔憂”浪潮實際上反映了外界對人工智能技術近年來進步的認可(我猜一些人工智能領域的學者在聽到這些“質疑”時其實是欣慰遠大於困擾吧)。也許與“機器是否會過於聰明”相比,“機器是否已經真如公眾想象的那樣聰明”才是更值得人工智能學界擔心的問題。

從歷史上看,人們對機器智能水平的理解似乎極易產生偏差,往往一開始過於高估,覺得它們無所不能,然而在發現機器能力達不到他們的想象之後又轉向過於低估,覺得現有的技術什麼都不是。這兩種看法又經常在媒體的推波助瀾下走向極端化,長期來看無論是哪種極端化看法都會對正常嚴謹的人工智能研究造成負面影響。


人工智能與機器人技術

“人工智能與機器人技術”是AAAI 2015大會的一個主題。從學科基礎看,人工智能學科從“什麼是智能”的哲學問題出發,從原理上研究在“智能行為機械化”過程中的一些根本限制和技術原則。另一方面機器人學科則從工程應用的角度出發,考慮如何實際製造滿足特定“智能化”要求的機器。兩個領域本應是相輔相成的關係,機器人領域為人工智能領域提供實驗和實踐的機會,而人工智能領域為機器人領域提供知識儲備和技術工具。”

但事實上兩個領域的研究在很大程度上是相互脱節獨立發展的。所以現在人們開始考慮如何加強這兩個領域的合作和相互滲透”,本次大會的學術委員會主席Sven Koenig教授在一次交談中提到。事實上美國國家科學基金會(NSF-National Science Foundation)專門就這個問題在會議期間組織了一個專題研討會(只有受邀的領域專家才能參加)。

在公開活動中,大會隆重舉行了一個對機器人項目“Shakey, the robot”的紀念活動。上世紀60年代末到70年代中期,幾個研究員為設計製造一個名為Shakey的機器人發明了一系列後來影響廣泛的人工智能技術,包括啟發式搜索中的A*算法,自動規劃中的STRIP模型,計算機視覺中的霍夫變換,以及如今幾乎已成為標準的機器人系統框架。

在紀念活動中領銜發言的是人工智能領域元老級人物Edward Feigenbaum教授,他以一篇極具感染力的演講高度評價了Shakey項目的巨大影響。有趣的是,以他的名字命名的Feigenbaum獎也同時在紀念活動中頒發,而今年獲獎者是微軟雷德蒙研究院的院長Eric Horvitz。Feigenbaum獎是當今人工智能界的一個主要獎項,用來獎勵對人工智能的實驗方面研究做出突出貢獻的個人和團體。

此外,會議期間還有一個Robocup參賽隊的表演賽。下面是我在現場錄的一小段機器人足球比賽的視頻(視頻見附件)。

從視頻來看,現在參加Robocup的機器人在基本運動能力方面還比較有限。個人覺得,雙足機器人應該先在競技場景下“跑起來”,再考慮踢足球之類的複雜任務。因此,現階段我們或許可以先考慮一些諸如“機器人田徑”之類的比賽…


圖靈測試的改進方案

去年關於Eugene Goostman通過圖靈測試的新聞似乎讓一些研究者們看到一個“推翻”圖靈測試的好機會。他們先後組織了一個專題研討會和一個正式會議,主題都叫“Beyond Turing Test”。會議期間,研究者們提出了一些新的機器智能的測試標準,試圖代替圖靈測試。其中有兩個標準是比較有影響力的:

  • The Winogard Schema Challenge

這是一個旨在取代“有缺陷的”圖靈測試的測試方案。這個方案的基本思想是限制圖靈測試中對話的內容。在標準的圖靈測試中人類提問者可以問任意問題,但在Winogard Schema Challenge中所有問題都有關自然語言中的代詞理解。

不過,在和這個挑戰的主辦方交流之後,我個人感覺這個方案真正的關鍵似乎在於他們只允許人類專家參與提問,而不像標準圖靈測試中是普通人在提問。而代詞理解,儘管被聲稱是“關鍵思想”,其實可以被看作只是對我們應該如何在圖靈測試中提問的一種“建議”。但我個人並不覺得這個建議對人類專家是必要的。比如我——作為人工智能領域一個普通的研究員——很有自信可以在圖靈測試中分辨出任何當下的聊天機器人,即使不使用這類代詞理解問題。所以在我看來,真正的問題是要找“對”的人,而不是找“對”的問題。

從這個角度説,我並不認為目前有特別必要的理由真的要取代現有的圖靈測試。也許我們應該做的是規範化圖靈測試在執行層的一些細節,例如更好地挑選甚至培訓參與圖靈測試的人類提問者。

  • The Aristo Challenge

這是另一個要求計算機通過我們在中小學裏常見的期中或期末考試的測試方案。考試內容一般包括算術,幾何,和一些常識問題等等。另外還有一些題目需要考生結合文字和圖片內容進行理解和作答。現在的人工智能技術在這類考試中能達到大概小學4年級水平。

我個人覺得這個挑戰更有趣一些。不過,如果站在“測試機器是否具有智能的方案”的高度,你仍然很難説如果真有計算機通過了所有中學考試是否它就一定具有智能。在我看來,和仔細設計的圖靈測試相比,似乎還是這個方案更有可能被破解,就像國際象棋或者“危險邊緣“競賽那樣。


自動遊戲博弈的新突破

最近該領域的一個階段性成果是,德州撲克的一個最基本的版本被近似完美解決了,具體就是説研究員們顯式地找到一個博弈策略,其平均收益與(這個遊戲的一個)納什均衡策略的差距比連續玩這個遊戲70年之後結果的隨機波動還要小。這個結果發表在一月份的一期《科學》雜誌上,而項目的主要負責人Michael Bowling教授在會議期間就這項成果做了一個主題演講。

會議期間同時舉行了General Game Playing比賽。這項比賽要求計算機在沒有人類手工輸入領域知識的情況下進行棋類遊戲博弈。為了保證這一點,比賽組織方會維護一個包括各種不同遊戲的列表,每項遊戲的基本規則都用一套通用語言進行形式化表述,並且只在比賽當時才輸入給計算機。另外組織者還進行了一場有趣的“碳硅大戰“,也就是讓人跟比賽中優勝的計算機在這個比賽規則下比賽,結果是機器取得勝利。

深度學習

深度學習的主將之一Jeff Hinton教授在會議期間做了一個主題演講,題目就叫“深度學習”。這個演講毫不意外地成為了整個會議參加人數最多的活動。Hinton的演講內容主要是對到目前為止的深度學習運動的總結性回顧。值得一提的是,Hinton教授對微軟研究院在整個深度學習運動中的先驅性貢獻給予了很大肯定。確實,他的團隊與微軟研究院合作完成的基於深度學習的語音識別研究完全稱得上是直接點燃深度學習熱潮的第一批成功案例。

規劃、決策、約束補償、優化、與搜索算法

這些都是人工智能的傳統領域。讓我其實有一點意外的是,這次會上相當多這些領域裏的論文是關於蒙特卡洛樹搜索法(Monte Carlo Tree Search)的內容——一個從計算機圍棋領域發展而來的技術。而我這次在會議中做的論文報告正是關於如何結合Monte Carlo Tree Search與傳統的搜索算法,從而設計更為通用的人工智能算法。儘管論文主要討論在假設最差情況下如何規劃(adversarial planning),我相信論文的主要結果同樣適用於更為一般的情況,例如基於概率的規劃問題。

另外有些關於算法選擇(Algorithm Selection)的論文,討論如何通過增強學習等技術解決組合優化問題。基本思想是説,一般而言每一個單獨的算法在解決這類問題時都有自己的“盲點”,也就是在最差情況下性能很差(所謂的“NP困難”問題)。但是不同的算法盲點往往不同,因此如果在實際應用中能通過學習技術瞭解正在面對的是“哪些”具體問題類型,也就有可能有的放矢地選擇合適的算法。個人認為這是一個有趣的研究方向。

知識表示與推理

我一直認為找到“合適”的知識模型是實現人工智能的主要難點所在。個人對這個領域三方面的研究比較感興趣:(1)致力於將抽象模糊的術語(如知識、本體、表達力)賦予具體和形式化語義的工作,例如Judea Pearl教授提出的“因果模型(causal model)“;(2)在學習、決策和規劃等語境下討論知識表示和推理的工作,例如Leslie Valiant教授提出的”知識灌輸模型 (Knowledge Infusion)”;(3)從中立獨立的角度對已有模型和理論的實驗性或實踐性研究。

機器學習及其應用

機器學習是這次會議中最重要的話題,總共佔據了9個會議,同時還有大量論文安排在海報會議裏。不過遺憾的是這次會議我不得不“策略性地”選擇放棄了全部機器學習有關的內容,以換取時間和精力參加上面所列的所有其他話題的會議。


資料來源:36Kr

如果喜歡我們的文章,請即分享到︰

標籤: 人工智能