Android 語音 vs. Siri,誰才是語音強者?
在兩個星期前的Moto X 評測文章中,紐約時報的戴維·波格(David Pogue)說了一句,“Android 的語音指令仍然比不上Siri。”於是,他收到一封憤怒讀者來信:“你的評測文章是我讀過的最傻缺的。我極力避免用髒話來形容你的蠢。”
每一篇稿件紐約時報都會做事實審查,編輯甚至會進行改寫以更加符合報紙的風格,然後才予以發布。有著這樣嚴格的流程,至少可以說明波格的這句話不是隨意判斷。
波格說,為了評測語音識別這個功能,在兩個星期的時間裡,他身上帶著iPhone 和Android 手機,他同時向兩部手機說話,體驗其中的差別,雙方各自的優勢和劣勢。對於讀者這樣的來信,他覺得,人一般在談論語音識別的時候,他們常常弄混聽寫、命令以及搜索的區別。
聽寫,是指將聽到的語音轉化為文字。
波格經過測試發現,不論iPhone 還是Android 手機,在將語音轉化為文字的時候都出了許多錯。當人們把手機摔在一邊說“我放棄了”的時候,通常都是在聽寫這部分遭遇到挫折。當然,要讓手機識別出不同地方的人說話的口音,而且還要應對每個人在不同距離跟麥克風說話,以及不同程度的環境噪音,如此之高的要求之下,“聽寫”表現不好是可以原諒的。
最新的Android 版本有了離線語音包,可以在不聯網的情況下,進行簡單的語音識別。而且Android 可以一邊聽,一邊將寫,而Siri 則要等人說完以後才寫出來。
Siri 對文書格式的支持比較完善,能夠識別出“大寫”、“全部大寫”,“不要空格”等指令,還認得出標點符號,包括“冒號”、“破折號”、“星號”還有“省略號”等等。而Android 只識別基本的符號,比如“句號”、“逗號”和“感嘆號”。
命令,是指通過語音來操作手機。
語音命令能提供便利,比如說打開某個應用的時候,不必翻翻找找;而設置鬧鐘的時候,也不必進入到鬧鐘應用,打開復雜的設置選項,點擊好十幾次屏幕才完成操作。波格稱,這是 Siri 取得優勢的領域。比如說在開車的時候,當有短信來的時候,可以直接命令它讀出來。讀完之後,Siri 甚至會詢問是否回复,這樣人們就不必將視線從道路轉移到手機。而 Android 做不到這一點。
搜索,提供網絡相關信息。
在這一部分,Android 則超出Siri 許多。雖然兩者都提供了諸如天氣、股票、運動等信息,還提供了單位換算、計算器等功能,以及常見的網絡搜索索引。但是,因為Google 的招牌就是網絡搜索,因此Android 當遇到“搜索”的情形時,反應十分、十分迅速,超出Siri 許多。
Android 最爽的是,不必拿起手機就能呼叫和導航。比如說,“打電話給第34 街的Macy”,或者“獲取La Guardia 機場的公共交通路線”。不必說,Google Maps 的質量槓槓的。此外,Android 的上下文理解也不錯,如果第一個問題是問,“誰是希拉里·克林頓?”,那麼第一個問題會是“誰是她的丈夫?”
此外,Android 內置了類似Shamzam 的音樂識別功能,直接點擊語音識別按鈕,然後讓它聽正在播放的音樂,就能識別到這首歌曲是什麼,歌手是誰。
比較遺憾的是,Android 的語音識別功能不是全局通用——要用的時候,只能點擊Google 搜索欄旁邊的“麥克風”圖表,或者Google Now 界面中。這限制了Android 在語音方面的發揮,人們無法在鎖屏的狀態、或者在別的應用中使用語音功能。換言之,除了Moto X 以外,要使用別的Android 手機的語音功能,就必須不斷的拿起和放下手機。
因為與OpenTable 合作,所以通過Siri,人們可以直接訂酒店、電影票等等。此外,Siri 對自然語言的理解比較到位。如果問“這個星期有什麼電影?”,“給我看《The Way,Way Back》的評論”這樣的問題,SIri 可以正確理解,並給出相關的信息。而Android 的話,就僅僅會在網絡上搜索而已。
另外,Siri 有幽默感,而Android 沒有。我們可以對著它開玩笑。
以上就是波格用兩個星期親身體驗,得到的Android 與Siri 的對比。從Siri 發佈到現在,它已經有了長足的進步,Google 在語音方面也積累了大量的經驗,語音識別的精度與速度都在不斷提高。隨著未來這兩個語音引擎逐漸成熟,它們將為我們的生活帶來更多的便利。
資料來源:ifanr