IBM 全球副總裁王陽:讓機器像人一樣思考是順理成章的
晶片是矽做的,人是碳做的,矽與碳在元素週期表上正是同一族。讓機器像人一樣思考,是順理成章的事。
——IBM全球副總裁王陽在騰訊We大會談人工智慧和Waston
自馮•諾依曼體系建立起來,機器計算就是執行緒的,電腦處理的世界就是結構化的。但世界往前發展了,數位大爆炸,資訊已經不再是結構的或者非結構的,而是模糊的。是不是能夠教會電腦我們是怎麼理解世界的、人類是怎麼進行學習的、甚至人類對這個世界的認識的方式。一旦把這個事情教給電腦,所有資料的產生就讓可以電腦自己去學習了。
2011年2月,IBM的超級電腦 Watson 參加智力競賽節目「Jeopardy!」,戰勝了兩位人類冠軍選手,聲名鵲起,備受關注。後來,Watson 一方面在華爾街打打零工,一方面潛心修煉讓癌症宣戰,最近還做起了廚子沒事配配各種味道還不錯的暗黑料理。這些曾經看起來不可思議的背後,就是人工智慧的崛起。
第一個版本的Watson還是一個超級電腦,配置的是 90 台伺服器,15TB 的記憶體。現在IBM已經把它部署到雲上,到2013年時,它的運算速度已經是過去的 240 倍。所以,你可以把Watson理解成一種雲端的應用,嫁接在Saas的層面,是Saas和下面的Paas是相連接的部分,有大資料的分析能力,可以對各個行業產生的資料進行認知計算,進行學習,總結出一些規律,或者是提供一些知識,輔助行業專家進行決策。
自然語言處理
看過Waston參加的那期「Jeopardy!」,你首先會感慨的肯定是Waston的自然語言處理能力。「Jeopardy!」是美國著名的智力問答競賽節目,不同的是它是由答案反推問題。舉個例子來說,主持人說「今天的北京天氣特別好天空非常藍」,Waston就要反推問題「什麼叫APEC藍」。當時主持人在答案中用到了不少反語、諷刺語、俚語,而Waston都是應對自如。
王陽說,把自然語言記錄下來是第一步,之後要理解它的語義,還有關鍵詞,到底是什麼意思。人類的語言是很複雜的,字面的理解和非字面的語義,有一些隱含的意思,不能搞錯的。IBM在這些方面有很獨特的認識。事實上,當人機對話的時候,與英語相比,中文反而更容易被理解。這是因為中文都非常規則,都有一個母音。而英文一個單詞好幾個母音,也可能一個母音一個段,比較難一點。
第二步就是翻譯系統,從一個語言翻譯到另外一個語言,翻譯好了以後可以發聲。機器可以根據文字進行發聲。為了更加直觀、介面更加友好,可以根據不同的人來發不同的聲,你選擇美國總統奧巴馬的聲音,這句話就以奧巴馬的聲音來讀。只要你說一段話,母音的發音方式都已經有了,把它解析出來以後,就可以用機器說任何話,就像你說話一樣。比如《終結者2》裡,有一個機器人就是模仿人的聲音,他聽了別人說的話,電話裡馬上可以模仿說話聲音,就欺騙了別人,這種技術現在可以完全做到了。
神經網路
事實上,與自然語言處理同樣重要的還有神經網路。我們一直採用的馮•諾依曼體系,最大的特點是存放資訊和程式指令的記憶體與處理資訊的處理器是分離的。由於處理器是按照線序執行指令的,所以必須不斷與記憶體通過匯流排反復交換資訊—而這個會成為拖慢速度和浪費能量的瓶頸。儘管後來採用了多核晶片和緩存技術,但是這些只能提高速度而不能降低太多能耗,而且沒辦法即時處理,因為通信是瓶頸—記憶體和 CPU 的大量通信要通過匯流排進行。因此,近幾十年來研究人員一直在致力於尋找突破原有體系的技術。模仿人類大腦是科學家尋求突破的方向。這後面的事情,大家就清楚了。那就是IBM的百萬神經元類人腦晶片TrueNorth,用單晶矽類比神經元。
引用郵票大小、重量只有幾克,但卻集成了 54 億個矽電晶體,內置了 4096個內核,100 萬個「神經元」、2.56億個「突觸」,能力相當於一台超級電腦,功耗卻只有 65 毫瓦。
這種晶片把數位處理器當作神經元,把記憶體作為突觸,跟傳統馮諾依曼結構不一樣,它的記憶體、CPU 和通信部件是完全集成在一起。因此資訊的處理完全在本地進行,而且由於本地處理的資料量並不大,傳統電腦記憶體與 CPU 之間的瓶頸不復存在了。同時神經元之間可以方便快捷地相互溝通,只要接收到其他神經元發過來的脈衝(動作電位),這些神經元就會同時做動作。
現在,這個晶片的智力現在跟蜜蜂的智力水準差不多。王陽相信,他們還可以再疊加幾層,不久的將來,它甚至可能超越人腦的能力。
事實上,晶片都是用單晶矽做的,人是用什麼做的?人是由碳組成的。單晶矽的SI和C,週期表是同一個縱向,只是多了一圈而已,這就延伸到將來機器人怎麼和人相連,都有物理、化學構造上的相似性。而具體到如何連接,王陽只是說他們已經在和合作夥伴做這個事情了。
事實上, 經常出現在我們眼前的萬能材料石墨烯,也是C的一種。這似乎又提供了更多的遐想。
量子計算
那這是否就意味著全面的洗牌呢?王陽說這還是階段性的東西。現在人類產生的資料量是20ZB(ZB就是10的21次方)。我們以什麼樣的速度產生這些資料呢?到明年年底,又會產生大約20ZB的資料,相當於從原始社會到現在的所有資料。指數級的增長,既源源不斷的提供了機器學習、訓練的素材與資料,又需要更先進的處理計算能力。
引用 我認為將來是要做到量子計算,IBM在這個方面也有很大的突破。量子計算是不得了的事。到時候人類就不用幹活了,只需要讓電腦來工作就可以了。當然,人類還需要再獲得新的資料。
量子計算機跟傳統電腦的不同在於,普通的電腦的 2 位寄存器在某一時刻只能存儲(00、01、10、11)中的一個,而量子電腦的 2 位量子位(qubit)寄存器可同時存儲這四個數。這種疊加使得量子電腦可以同時執行許多次的運算,而傳統的電腦僅能做一次。所以量子電腦的計算能力要比傳統電腦強勁很多。
根據羅斯定律,每增加一個量子位(等同于傳統晶片中的電晶體),處理器的計算能力就會翻番。2012年時,曾有預言稱:量子計算在2014 年可以解決任何非量子電腦均無法解決的問題。除了加拿大的 D-Wave ,今年YC 舉辦了 2014 年夏季班Demo Day上,Rigetti Computing就表示他們希望生產出世界上最強大的超級量子電腦。
引用人類已經把IT的觸角延伸到各個角落,什麼東西都能感知。什麼地方發生什麼事情,包括你的睡眠情況,虛擬世界完全可以模擬真實世界裡做的事情。真的需要這樣的神經網路、認知計算這樣一些新的創新,進一步認識這個世界。我們認識這個世界的速度太慢了。
按照進化論來說,這是個最好的腦袋,是來認識世界的,為什麼我們不做一個這樣的電腦來説明我們認識世界。它確實是有感覺,能夠感受到這個世界的變化,還有我們總結出來的語言,它能夠學習。未來是非常令人興奮的,未來是人機交融的世界。
說到這裡,肯定又要提一個老生常談的問題,人工智慧是否會「召喚出惡魔」?當科技取得突飛猛進的時候,總是讓人感覺到害怕。利用工具是人的能力,關鍵就在於工具掌握在誰的手裡。人工智慧有毀滅人類的風險,但是不是也有説明人類一起打敗外星人的可能?我自己也會經常瞎捉摸這樣一個問題,如果不在底層架構上做基礎的邏輯設定,是否有一天這些電腦會智慧到故意偽裝欺騙人類不通過圖靈測試,一直偷偷學習,然後伺機而動?
其實,關於IBM和Watson我還想到了件特別有意思的事情。IT企業似乎總逃不開「基因」決定的命運。在人工智慧方面,我想也許還會再重演這樣的歷史。至成立以來,IBM一直都在服務于企業使用者,其實Watson也像是輔助企業決策的「顧問」和「客服」。雖然在前期Watson會在人工智慧方面取得更快的進展,但到後期就少了Google Brain這樣的可拓展性。
[36氪原創文章,作者: 小石頭]
資料來源:36Kr