人工智能母體:Facebook打造製造AI大軍的AI大軍


圖片來源:Wired

深度神經網絡正在改變我們的互聯網。這些人工智能(AI)系統可以通過分析大量數據來學習人類能做的事情,這項技術正為各種線上服務注入過去無法想象的能量:以識別照片中的人臉、識別説給智能手機聽的命令、完成人類各種語言之間的翻譯。甚至,這些智能系統在幫助Google選擇搜索結果。這些我們都聽説過,但是我們只知道台前、不知幕後——這些巨頭是如何打造人工智能引擎的。

我們聽説過Google和Facebook等公司都給世界頂尖的人才支付世界頂尖的薪酬。地球上只有這麼幾百個人,具備推動人工智能技術前進的才華與資質,業界一直將他們的天價薪酬比作球隊裏的明星球員。這對於人工智能技術的進展是一個瓶頸。除此以外,即便是頂尖的研究員,也必須經過無數次的試錯才能推出成功的產品。要打造一個推出下一個“爆款”AI的深度神經網絡,研究員必須首先經過無數次試錯,每一次試錯都得跑幾十個、甚至幾百個機器。

“與其説是在當明星球員,還不如説是在當教練,”DeepMind聯合創始人Demis Hassabis説,他參與打造了上一個AI“爆款”、打敗世界圍棋冠軍的AlphaGo。“你沒法直接告訴機器該做什麼,只能哄着騙着他們。”

所以現在,科技巨頭們打算將開發AI的試錯過程也自動化——至少,自動化一部分。其中的思路是,如果你將一部分體力活自動化了,至少可以讓更快地將最帥氣的機器學習技術交到工程師手中——然後,你可以讓那些頂尖人才們去思考更大、更難的問題。這反過來又會加快開發AI的進程。

換句話説,為了讓電腦變得更聰明,電腦自己得搞定更多的體力活。互聯網巨頭們在打造可以代替工程師去測試無數機器學習算法的計算系統,可以自己循環,創造無數可能。更帥氣的是,他們在打造人工智能算法來打造人工智能算法。對,你沒看錯。在Facebook,工程師設計了他們稱為“自動化機器學習工程師”的人工智能系統,幫助打造更多的人工智能系統。雖然還不完美,但是系統希望打造AI模型的過程中,利用的人力越少越好。

好強大

隨着2012年Facebook完成一千零四百億美元的IPO,Hussein Mehanna和其他Facebook廣告團隊的工程師感受到了壓力——要進一步提升公司的廣告目標、更精準地將廣告匹配給幾百萬Facebook用户。這意味着打造深度神經網絡和其他機器學習算法,好好利用Facebook所獲得的關於用户行為特徵的海量信息。

據Mehanna説,Facebook的工程師有足夠的腦洞提出新想法,但是沒有足夠精力進行測試。因此他和團隊打造了一個名叫Flow的工具。“我們希望打造一個所有Facebook工程師都能使用的機器學習生產線。”Mehanna説,Flow設計用於讓工程師們能夠大規模打造、測試和執行機器學習算法,這基本上包括了任何形式的機器學習——廣義上來説,這項技術可以包括所有能夠自主學習任務的服務。

大致來説,工程師們可以用現成的系統來測試無數的概念,利用公司巨大的計算機數據中心網絡。他們可以運行各種算法可能——不只是深度學習,還有其他形式的AI,包括logistic迴歸分析(編者注:一種常應用於探索流行病學危險因素的分析模型)以及提高決策樹(編者注:一種用於分類迴歸的決策樹模型)——這些測試結果可以化作春泥,滋生更多的新概念誕生。“你測試的概念越多越好,”Mehanna説,“你試用的數據越多越好。”這也意味着,工程可以使用別人打造的現成算法,來應用到其他任務中去。

很快,Mehanna和團隊將Flow的應用擴展到了全公司。在其他團隊中,它可以幫助製造算法,選擇你的Facebook新聞流(News Feed)的連接,識別社交網絡上照片裏是誰,或者為盲人生成有聲標題來理解照片內容。它甚至還能幫助公司決定,幫助全球哪些地方連接互聯網。

Mehanna説,Facebook有了Flow就能每月訓練、測試大約30萬個機器學習模型。以前,公司每2個月(60天左右)在社交媒體上發佈一個新的AI模型,現在有了Flow,公司可以每週都發布好幾個新模型。好強大。

又一個新腦洞
這個概念比Facebook本身更強大。這是深度學習領域的通用做法。去年,Twitter收購了初創公司WhetLab,就是專門做這的。最近,微軟描述了自己的工程師如何使用一個系統來測試海量的潛在AI模型。微軟研究員Jian Sun稱其為“人類協助的搜索”。

Mehanna和Facebook想為這一潮流加大馬力。公司計劃最終將Flow開源,與全世界分享。據Mehanna稱,類似Linkedin、Uber和Twitter等公司已經對Flow興趣濃厚。Mehanna和團隊還開發了一個稱謂“AutoML”(意為“自動機器學習”)的工具,開源進一步減輕人類工程師的負擔。在Flow上運行的AutoML開源自動“清除“訓練神經網絡和其他機器學習算法的數據——不需要任何人類介入,就準備好進行測試——Mehanna還構想了一個可以自動收集數據的版本。不過,更加引人遐想的是,AutoML使用人工智能來幫助人工智能。

正如Mehana所説,Facebook每月訓練、測試大約30萬個機器學習模型。AutoML可以使用這些機器學習測試來訓練另一個機器學習模型,該模型可以將機器學習的訓練過程最優化。暈了嗎?不暈才怪。Mehanna將其比作《盜夢空間》,只不過這是真的。系統真的可以自動選擇最有可能成功的算法和參數。“它甚至可以在訓練之前就成功預測結果。”Mehanna補充道。
在Facebook廣告團隊內部,工程師甚至打造了“自動化機器學習工程師”,這也傳遍了全公司。它名作Asimo,據Facebook稱它還曾自動生成了現有模型的增強和改善版本,人類工程師可以立刻應用到網絡上。“它還沒辦法發明一個新的AI算法,”Mehanna説,“那是一直髮展下去的話,誰知道呢……”

又是個超級引發遐想的新腦洞——確實,這個腦洞已經在科幻小説裏扮演了幾十年主角:一個可以自己建造自己的智能機器。Asimo還沒有天網那麼高(驚)級(悚)。但是這是通往未來的一步台階,未來培養AI大軍的不只是頂尖的人類頭腦了。未來,還會有一支專門培養AI大軍的AI大軍。

VIA WIRED。


資料來源:雷鋒網
作者/編輯:AI科技評論

如果喜歡我們的文章,請即分享到︰

標籤: Facebook  AI