最好的人工智能仍敵不過中二少年


2012年,IBM的Watson獲得了克利夫蘭診所勒納大學醫學院的錄取通知書,作為一名醫生院學生開始了求學之旅。Watson是IBM的人工智能,而它進入醫學院是在讓醫生們訓練它,用於醫學研究。

三年後,你可能想當然地認為,或許Watson至少在對醫學的理解上有一些進步了。但從它的同類來看,人工智能的表現很不如人意,甚至不能通過美國八年級的科學測試,更不要説符合醫學院的錄取標準了。或許Watson當初是走後門進去的吧。

華盛頓大學的計算機科學教授Oren Etzioni和艾倫人工智能研究所最近舉行了一場比賽,邀請800個人工智能團隊讓其AI系統參加八年級(相當於國內的初二)科學測試。如今結果出來了:表現最好的也只答對了60%的問題。換句話説:在座的各人工智能都是……不如中二少年。

對Etzioni來説,這場長達五個月的測試説明了人工智能的發展現狀。得益於深度神經網絡(模擬人腦神經元網絡的軟硬件網絡)的興趣,Google和Facebook還有微軟等公司的系統在圖像語音識別等領域,達到了人類高度的表現水平。但要讓機器學會思考,還是一件不太可能的事,他們甚至不能進行對話,也不能通過基本的科學測試。

Watson們去哪兒?

遙想2011年,Watson在問答節目Jeopardy!上擊敗了最優秀的人類選手;就在前不久,Google的人工智能還在圍棋上戰勝了人類職業選手。但對機器來説,這些都沒科學測試難。

研究所的科學測試不僅包括知識問答,它還會要求機器理解基本的概念,回答進化適應這類複雜的問題。其中一個多項選擇問題是:

引用一些魚類成熟後的多數時間都生活在鹽水中,但會在淡水中產蛋。它們適應不同環境的能力是什麼的最佳例證?

這些多項選擇機器還是應付不過來,就算是用神經網絡也不行。Etzioni表示,自然語言處理,推理,理解科學書籍上的概念,這些都是更為複雜的挑戰,需要很多推理。

雖然多數參賽的人工智能都屬於學術機構和獨立研究員,但Etzioni認為科技巨頭的表現也不會好到哪裏去。“Google那樣公司的得分很可能高些,但‘集體的智慧’説明了一切,而且參賽的還有一些很聰明的人。”

親愛的Watson呢?Etzioni説IBM拒絕參加比賽,因為對這類比賽沒什麼興趣,更關注解決現實世界中的問題。不過Watson也不是最好的測試對象了,它以前可能主要關注問答比賽,但現在已經是一系列人工智能工具的集合了,也不能代表普遍的水平。

Etzioni測試是對自然語言處理的測試,能用來了解機器能在多大程度上理解人類語言。IBM的服務包括自然語言處理,但自Watson誕生以來,這類技術逐漸更多受到了深度神經網絡的影響。正如你能用大量喵星人圖片訓練神經網絡識別貓一樣,你也能用對話教它理解自然語言。Google甚至還用這種方式開發了一個聊天機器人,能與你探討人生的意義。

但聊天機器人並不能讓人信服,而且人工智能的現狀不取決於單一的技術。在沒有通用方法前,我們需要多種機器學習和人工智能工具。就像在Etzioni的測試中,很多參賽者也用了多種工具,但結果仍舊不理想。

不過也有人認為讓機器通過科學測試沒多大意義,我們關注的應該更深遠。完全多項選擇題並不是人工智能的目標。像自然語言理解和科學測試,應該是真正的智能程序可以自然掌握的內容,換句話説,通過測試也並不代表真正的智能。既然還無法戰勝中二少年,人工智能們還需努力。

via wired


資料來源:雷鋒網
作者/編輯:張馳

如果喜歡我們的文章,請即分享到︰

標籤: IBM  Watson