你好,機器人!終於即將進入屬於你的時代!(上)


創見乾貨:

在「摩爾定律」的影響下,科技水平目前正在呈現跨越式發展,尤其在計算機領域體現的尤其明顯。毫無疑問,當數據在「雲層」彙總,「機器學習」開始逐漸成熟,我們必然要邁入機器人時代。在這個時代中,我們將以全新的目光來審視四周,以及自身與機器之間的關係。社會的方方面面,人們的日常生活都將改頭換面。本文針對即將到來的機器人時代,進行了全方面的總結和描述。從計算機技術的發展歷程,講到社會演變的各個層面,其所包含的內容全面且深刻。相信讀完之後,你對世界的認識,對自己未來生活的定位都會有了全新的看法。

你好,機器人。我們來了!

從政府的祕密項目到如今電視櫃中的遊戲機

1992 年,美蘇雙方達成共識,終止一切核試驗項目。在此情況下,1996 年美國政府開啟了一個名叫「戰略計算能力加速研發項目」。當時中斷的核試驗使得人們需要進行復雜的計算機推演,一方面出於安全的考慮,設計目前傳統武器該如何逐步的削減下來;另外一方面也是出於對世界仍舊動盪不安的現狀的認識,在不違反這次核試驗中斷協議的前提下利用強大的計算能力去開發新式武器。無論是處於和平需要,又或者是為了武裝自己,美國人都極為需要超級發達的計算機提供支持。為了做到這一點,剛才提到的 ASCI(戰略計算能力加速項目)所需要的計算能力已經超過了當時任何機器的極限。最後,一款名叫 ASCI Red 的超級電腦橫空出世,它是世界上第一款能夠每秒進行一萬億次計算的超級計算機。到了 1997 年,Red 超級電腦開始運行起來的時候,它甚至能夠進行每秒 1.8 萬億次的計算。這相當於在 18 後面加了 11 個 0!直到 2000 年的年末,Red 這台超級電腦一直穩坐着世界最強大的超級計算機的頭號交椅。

喔對了,要跟你們説一下,我昨天的時候就運行了一次「Red」超級計算機。同學們肯定要問:真的假的!這麼牛逼的超級計算機怎麼可能讓你輕易接觸到?事實上我並不是真的觸摸到實際的真機,而是擁有着和 Red 的運算能力完全一樣的一款機器。它就是 PS3. 它於 2005 年由 Sony 發佈,於 2006 年開始上市售賣。

然後,讓我們看看 Red 和 PS3 之間的區別吧。Red 這台超級計算機的大小應該僅次於一座網球場,使用的電力相當於供給 800 間房子,斥資高達 5500 萬美金。那麼 PS3 呢?它就安放在我家電視機的下方,連着最普通不過的電線。你只要花不到兩百美金就能搞到一台。十年的時間,那個一秒鐘運行 1.8 萬億次的計算機,只能由世界上最富有的政府手中打造,為了世界和平等非常宏大高遠的目的而誕生出來的機器,演變成了一款年輕人在聖誕節的聖誕樹下所期待的小小禮物。


摩爾定律

這十年的光陰背後所演變的力量,我們稱之為「摩爾定律」。這其實並非一個真的定律,而是由一個叫做喬登·摩爾(Gordon Moore)的人對於事物演變過程的一種觀察和總結。喬登·摩爾曾是計算機芯片公司 Intel 的創始人之一。直到 1965 年,摩爾發現了硅芯片在經過幾年時間的研發後,其能力變得越發強大,而與之相關的價格卻在持續不斷的大幅下降。於是他發佈了一篇論文,預測這樣的趨勢將會持續至少十年時間。這在現在聽起來其實覺得是很保守的了‍‍。當時他的理論很快被髮展成為一種更加準確的表示:每十八個月,計算機芯片的運算能力將翻倍,而價格將下降一半。這樣的趨勢目前已經維持了將近半個世紀。‍‍‍‍也正是因為這種趨勢的存在,才使得我們擁有了‍‍客廳電視櫃中的 PS3. 如果站在人類發展的歷史長河中去審視這段時間,你會發現人類的發明創造從未以如此驚人的速度向前躍進。

機器學習正在向人類語言領域邁進

在計算機的運算能力呈現指數式爆炸發展,並且價格也變得越來越便宜的同時,人類在編程方面的能力也越來越棒。最明顯的一個例子來自於 2011 年。那時候有一個由 IBM 牽頭研發的項目,名字叫做「Watson」。這個項目背後的理念是打造出來一台能夠理解普通語言的計算機,使得它能夠參加電視上的猜謎競賽活動!它不僅要和普通的參賽者進行較量,還要和猜謎遊戲的紀錄保持者一較高下,看看這款計算機是否能夠擊敗他們!這不禁讓人們想到了 1997 年 IBM 公司研發的 Deep Blue 超級電腦(「深藍」),它在當年的國際象棋比賽中一舉擊敗了世界冠軍蓋裏·卡斯帕羅夫。不過這次的「Watson」計算機所面臨的挑戰可比 1997 年要嚴峻很多。因為這要將複雜的人類交流能力納入到計算機模式匹配當中,所需要滿足的要求比之前要多太多。國際象棋其實在超級強大的計算能力面前也許只是小兒科。而一款涉及人類語言和文化的猜謎遊戲,這對於純粹的計算能力來説真的容易做到嗎?

它能否勝出?這個懸念牽動着無數人的心,無論是計算機領域,機器人,又或者是未來學,它們所指的核心都在於這次 Watson 超級電腦的表現。結果出來,Watson 計算機贏了,以非常輕鬆的方式。儘管它的表現不是十全十美,比如它錯誤的認為多倫多是在美國,當問到一些具有雙關語特徵的詞彙的時候,它會表意錯誤。不過,這一切都無所謂了。在為期兩天的對抗競賽中,它的得分已經超過了人類對手的佼佼者,其得分是人類最高分的三倍多!挫敗的人類選手沮喪的説:「也許猜謎遊戲是人類歷史上第一個被電腦一腳踢出局,變得無用無趣的娛樂活動。並且我相信這並不是最後一個,這只是一個開始。」


Watson 的表現實際上就充分顯示出來了機器學習方面在最近這些年所獲得的進展。在處理任務的過程中,機器用於在自我提升算法的過程中,涉及兩方面的內容:其一是分析;其二是預測。而機器學習的各個環節都圍繞着數據統計進行展開。通過不斷的測試以及出錯的頻率,機器會很快的知道到底哪個答案的正確率是最高的。這聽起來似乎有點兒不靠譜,難道僅僅是猜麼?這樣我們就不得不回到「摩爾定律」這個話題上,正是因為這個定律,計算機的運算能力得到了空前的進步,機器能夠以超快的速度進行一輪又一輪的試錯,在非常短的時間內,機器的分析能力就能夠得到實質性的提升。Google 的翻譯軟件就是一個非常有力的例證。你登陸 Google Translate 這個頁面,在上面你可以打一些文字,然後就看到系統跳出選項,讓你選擇翻譯的語言種類。這項翻譯服務是在 2006 年推出的,不過一經推出就被人們視為「讓人印象深刻的笑話」。説印象深刻,是因為沒人想到真的有公司推出來機器語言翻譯的服務,它竟然真的已經存在了!説是笑話,是因為翻譯的精準度實在讓人汗顏。但是如果你在那個時候就放棄使用 Google Translate,再也不關注它的發展,也許你就見證不了它在後面的日子裏經過了怎樣飛速的提升。現在最新版的 Translate 已經存在於智能手機的 App 上,你不僅僅可以打字,你還可以通過説話,系統通過你的語音進行翻譯!同時,這款 App 還能夠通過智能手機的攝像頭掃描文本將其翻譯成另外一種語言。如果你同時知曉兩種語言,那麼 Google Translate 的表現在你的眼中還是比較可笑的,介於糟糕和尷尬之間。但如果那是一種你完全不知道的語言,那麼它所提供的服務真的是非常有價值的。想象一下你現在的手機可以隨意的在匈牙利語與日本語之間轉換,在馬來語和依博語之間轉換,這多麼神奇啊!而且,更加關鍵的是,這項服務還都是免費的!

曾經,語言的翻譯工作需要一大堆學者進行詞彙的謄寫和對比工作,如今機器學習的出現,使得這一進程大大加快。軟件在兩種平行的語言之間進行比對,主要就是通過數據來判定到底在 B 語言中的哪個句子最有可能對應上 A 語言的句子。於是,Translate 憑藉着計算機超強的運算能力,將數以海量級別的文本投射到數據庫,使之找出不斷完善自身的「對應」水平。也許有人會説這壓根不是什麼所謂的「學習」。確實,它這種通過數據統計,通過最高概率來「猜」正確答案的方式並不符合人們腦海中對學習的定義。但是從廣義的角度上來看,比如「鑑於從某個具體的任務出發,結果正在不斷的朝着更好的方向發展」,那麼它就是機器學習。

在下一章節,我們將討論更加有趣的內容。機器自我學習的技術瓶頸到底有哪些?哪些是它即將克服的領域,哪些又是克服不了的?牛津大學的學者甚至還做出一份榜單,到底哪些工作要被機器取代?哪些又無法被取代?想知道這一切的答案?請關注本系列的下一章節!

來源:lrb.co.uk 由創見花滿樓編譯


資料來源:TECH2IPO

如果喜歡我們的文章,請即分享到︰