聊天機器人為什麼需要進行深度學習?
編者按:本文作者 Sergei Burkov 是俄羅斯莫斯科物理技術學院博士,也是旅遊推薦智能機器人公司 Alterra.ai 創始人兼首席執行官。
聊天機器人現在非常熱門,但是當我們談到“聊天機器人”時,會發現它有兩個完全不同的類型:一種是配置對話用户界面的智能虛擬助手,另一種,則是依賴屏幕按鍵圖像用户界面的非智能菜單驅動的程序。相比於前者,以菜單驅動的聊天程序的確擁有不少劣勢,用户接受度也不高,比如他們無法支持深度鏈接、創新性較低、同時也缺乏內部機器人之間的“bot-to-bot”通訊協議。相反,智能聊天助手則為上述問題帶來了解決方案,它們無需新協議或應用程序接口就能實現彼此間的通訊,而且也不依賴於類似於 Google Assistant 這樣的“主機器人”。更重要的是,人們用自然語言就能與之交互。
機器人要用自然語言實現交互
過去,每家公司都需要有一個官方網站,以後他們都需要一個專屬的會話式機器人。但是在絕大多數情況下,你不會直接與它們對話,用户可能會首先與一個“主機器人”進行交互,比如Google的 Google Assistant、三星的 Viv、以及亞馬遜的 Alexa。主機器人會判斷哪一個“下屬”機器人有能力處理你的請求,再把你的請求轉發給它們。
舉個例子,假如你想要在巴黎預定一個酒店,你只需説:
引用Google,我下週日想去巴黎,請幫我預訂一個每晚不超過 200 美元的四星級酒店,裏面要有免費的 Wi-Fi 和健身房服務,還有,我要住五天。
此時,Google Assistant 會找到一個旅行代理服務機器人(比如 Expedia、Booking.com、或是 Alterrra 等),然後把這個請求轉發過去,如果“接收方機器人”足夠智能,能夠理解用户請求,那麼就能完成一筆酒店預訂業務。
關鍵是,“主機器人”和“接收方機器人”之間也能夠使用自然語言彼此交流。再比如,當你和全球私人旅行指南出版商《Lonely Planet》旗下的聊天機器人對話,想問問它阿姆斯特丹有哪些著名的旅遊景點,你只需問説:
引用下週二阿姆斯特丹的天氣怎麼樣啊?
此時《Lonely Planet》機器人會把你的請求轉發給 Weather.com 機器人,如果後者有能力回答這種自然語言問題,那麼就會把答案傳遞過來。換句話説,英語將變成未來機器人彼此之前的“通訊協議”。
聊天機器人會變成另一個“亞馬遜土耳其機器人”嗎?
看上去,人工智能技術對聊天機器人非常有幫助。但可能也不一定,因為我們還有另外一個選擇:由人工支持的聊天代理服務,比如亞馬遜的土耳其機器人模型。事實上,現在不少初創公司已經採用了這種方式,但它卻是一個死衚衕。
為什麼這麼説呢?其實還是人類本身的問題——無法實現規模化拓展,速度也太慢,成本更是無比昂貴。而且我們沒有足夠多的人力,來支持數以百萬計的機器人服務世界上每家公司。人類願意回到手工勞動力時代嗎?想象一下,假如亞馬遜每筆交易都是通過現場銷售人員來為客户提供服務,他們能夠承受得了嗎?所以結果很明顯,企業未來只能選擇人工智能,否則距離破產就不遠了。
傳統的自然語言處理技術還能發揮作用嗎?
自然語言處理算法有兩大類:傳統自然語言處理和深度學習。
傳統自然語言處理涉及大量編碼。你必須要預測用户在每個場景下可能會説的詞彙和短語、識別説話類型、再提取預定義的關鍵詞,等等。換句話説,傳統自然語言處理有很多規則,很多正則表達式,以及大量的硬編碼。所以,你需要花費大量時間寫代碼,調試程序bug。但是,一旦用户在對話時偏離了預期路徑,之前所設定的規則就很容易會被打破,這就是為什麼許多機器人讓人感到非常愚蠢的原因。
我們不得不構建大量智能虛擬助手,讓它們去維護自然語言對話。那麼問題是,我們能夠用傳統自然語言處理來實現這個功能嗎?貌似看上去不太可能——畢竟難度太大,而且也十分耗時。更重要的是,地球上可能沒有那麼多程序員來寫代碼。
依靠深度學習來解決聊天機器人的瓶頸問題
幸運的是,現在我們有一個替代方案,這個技術給人們帶來了希望,它就是深度學習!相比於特別編寫一個明確的規則,現在我們只需要構建一個人工神經網絡,然後給它提供培訓語言。
然而,構建人工神經網絡並不簡單,你需要把不同的算法和解決方案縫接在一起。好的一面是,當你完成的時候所有工作後,會得到一個可以理解自然語言的神奇機器。如果你注意到它出現了某些錯誤,完全不需要編寫新代碼來解決問題——只需給它提供更多學習樣本就可以了。而且,你也不需要重新給“機器人大腦”編程,當你有了這樣一種機器,會發現團隊的工作效率大幅提升,過去需要花費數年時間才能完成的產品,現在即便人手不足也能快速推出。
不幸的是,我們現在還沒有這樣神奇的機器,然而很多公司都正在朝這個方向努力。現在幾乎所有的聊天機器人設計框架都是基於自然語言處理的軟件開發包,而不是深度學習技術。換句話説,如今的聊天機器人依然類似於傳統的勞動密集型服務行業,但是隨着深度學習技術的不斷髮展,我們應該很快就能看到隧道盡頭的曙光了!
資料來源:36Kr