iPhone 7 全國首發日:你買的不是智能手機,而是超級 AI 計算機
編者按:今天是新版 iPhone 首發第一天,各大蘋果店門口已經排起了長龍。除了無線耳機,雙攝像頭也是此次新版 iPhone 的關注點,加上新推出的 iOS 10 系統,蘋果在圖像識別、處理方面的功能會更加強大。《快公司》的一名科技記者Sean Captain 發文稱,未來智能手機將會變成超級 AI 計算機。
9月13日,蘋果用户可以正式更新全新的 iOS 10 系統,更新後的 iOS 系統可以讓用户隨意找到在任意時間和地點、有關任意人或事物的照片。iOS 10 系統利用了人工智能神經網絡技術,用户每次拍攝照片的0.1秒內會進行約110億次運算,可以找出照片中的人物是誰,甚至以及他們處於什麼樣的情緒。
本次 iOS 10 照片應用程序僅僅只是 AI 技術走向“手持設備化”趨勢的一個最新例子而已。比如今年一月份所發佈的應用程序Aipoly,能夠識別出各種物體,併為視障人士大聲播放物品名字。還有,Google翻譯現在可以在你拿起相機對準文本內容的同時,將內容文字即時翻譯成另一種語言。現在這類運算可以做到非常之快,甚至在你意識到之前就已經完成。
Aipoly不僅能夠識別出圖片中的動物,還能識別出該動物的品種,然後大聲地播放出它們的名稱。
就在“雲技術”正成為“它是如何運作的?”這類問題的唯一答案時,智能手機卻反其道而行,朝着獨立運行的方向發展。AI 技術已經可以在手機上獨立進行任務處理,而無須像以往那樣,需要一個龐大的雲端服務器羣提供支持。這樣做的結果,是用户在使用 AI 技術的時候,不會再產生網絡鏈接數據中心時的惱人延遲,用户將會得到更自然和順暢的使用體驗。“當我説,‘嘿,Siri,這是什麼?’的時候,需要兩秒鐘來把圖片發送到雲端才能獲得響應,” 創始人之一Alberto Rizzoli説,“這有點像在與一個剛睡醒的人聊天。”實際上,Aipoly不是第一個幫助視障人士識別物體的應用程序,而是第一個通過減少對雲端的依賴而在智能手機上獨立運行AI技術來即時識別物體的應用程序。
根據高通(Qualcomm)產品經理 Gary Brotman 表示,這類即時AI技術,將可以精確而又詳細地繪製周圍的地理環境,然後在其中植入具有豐富細節的3D物件、字符和動畫,最後呈現在用户的智能手機或其他電子產品的顯示屏幕上,這將遠遠超過遊戲 Pokémon Go 裏所使用的 AR 技術。
同樣,VR 技術與智能手機上的 AI 技術結合後將顯得更加真實。“要實現上述效果,一切都得是完全實時的,”他説。“所以你必須能夠在展示視頻、音頻的同時,由人工智能技術來實現眼球追蹤、頭部跟蹤、手勢跟蹤和空間聲源跟蹤。”
AI 技術同樣也可以為人們的生活提供便利。Rizzoli表示,虛擬助手可以利用手機的攝像頭來識別人們的位置,比如在一個特定的街道邊或餐廳裏,然後關聯到相關的應用程序。而這一次,實時AI技術將使得類似的給人們帶來極大便利的功能不再受到網絡延遲的影響。如果未來的AI技術不再需要雲端支持,那麼雲計算同樣也不再需要人們的個人數據。
“無論出於對隱私原因、延遲原因還是其他各種各樣原因的考慮,AI技術的分析和控制中心都應該被安裝在手機上,而不是雲端。”Brotman説道。
內置人工智能
是什麼在驅使着將 AI 技術應用到手持設備中?答案是視頻遊戲。
“人們想要在他們的手機和ipad上體驗到更好的手機遊戲,”Rizzoli説。“所以蘋果、高通以及其他芯片製造商在追求更佳的性能上一直表現得很出色。”實際上,這也是手機CPU和GPU往更強性能的方向上發展的重要推動力。CPU大多是按照順序分步完成任務,而GPU在進行3D圖像快速渲染時則是並行地處理數量巨大的簡單任務。AI技術也需要串聯地執行多個並聯起來的簡單任務。
以現代圖像識別領域內的主要技術——“卷積神經網絡(CNN)”為例,卷積神經網絡(CNN)模仿大腦視覺皮層的工作原理,把視覺領域分成重疊的圖片塊,然後按照特定的順序,過濾掉簡單的細節,例如所有的圖片塊邊緣。當這些信息到達某一神經層(人類的生物層面或者軟件的虛擬層面)的時候,這一層的神經元可能會把邊緣結合成線,而到達另一層神經元的時候,則可能識別出圖片的主要形狀。每一層(數量上可能達到幾十層)進一步改進圖像的感知器。“你看一張照片時候,你同時也在確認它裏面的各種信息,”Rizzoli説,“當你在確定圖像邊緣的時候,你也在確認圖像可能存在的形狀。而且所有這些確認行為可以並行地同時完成。”
實際上,智能手機的芯片已經經歷了幾年的挑戰。2013 年發售的iPhone 5s在本次iOS 10的更新中,仍然能夠支持新的人像識別,場景識別和對象識別。Aipoly也在製作數個版本,使該軟件可以在幾年前發售的iphone5和Android手機上順利運行。然而程序員們最近才能充分利用好這種新技術,今年六月推出的照片效果處理軟件Prisma,便是這種技術的最早應用者之一。
二十五歲Aleksey Moiseenkov 創建的 Prisma,可以將智能手機的照片渲染成30種不同藝術風格的應用程序,比如“尖叫”、“蒙德里安風格”,以及一些有趣的標題諸如“美到犯罪”“火焰噴射器”以及“#進城”。與其複雜程度不相匹配的是,渲染效果的呈現幾乎是瞬時完成的。一個Instagram上的濾鏡只是通過預設之後簡單地調整圖像的基本參數,如顏色、對比度、亮度或是白平衡。而Prisma則需要分析圖像以及識別出圖像的基本信息,如形狀、條紋、顏色和材質,然後就像Edvard Munch(挪威畫家,1863~1944)或者 Piet Mondrian(荷蘭畫家,1872~1944)一樣,在隨意塗鴉一樣重新畫出來。即便開始時輸入的是平庸水準的照片,通過如此處理後的成品效果依然可能會大放異彩。
左邊是一張極度無聊的照片,右邊為經過Prisma的“摺紙藝術”風格處理後的照片效果圖。
Prisma的所有處理過程最初全都是在雲端進行的,然而Moiseenkov卻認為依靠雲計算可能會影響到這個應用程序的使用質量。“我們在亞洲有很多的用户,”他説,“我們需要給予他們始終如一的優質體驗,無論用户是使用何種方式鏈接的網絡,以及無論服務器或者雲計算服務器位於何處。”該軟件在8月份更新的iPhone版本中,已經能夠在iPhone上完全獨立地完成所有處理過程,Moiseenkov現正集中精力在研發該升級的Android版本。
將同樣的藝術效果渲染技術適用於視頻處理的升級可能也會在9月份推出,Moiseenkov説。“按照之前在雲端的處理方法,視頻的處理將會複雜得多,服務器和其他相關的東西隨時都有可能超載”,他説,“所以,使視頻可以在手機上完成效果處理是至關重要的。”
Moiseenkov和他的團隊需要找到讓AI程序能夠在智能手機上流暢運行的方法,這項工作對於未來的程序員來説可能會較容易實現。今年5月,高通公司推出了一個專為高通驍龍 820芯片設計的,名為“神經處理引擎”的軟件開發工具包。該款芯片被廣泛使用於2016年的高端Android手機中,比如三星Galaxy S7和Note 7,Moto Z和Z Forece,OnePlus 3,HTC 10 和LG G5。這個名為“神經處理引擎”的軟件開發工具包可以在並行處理CPU、GPU任務的同時,還可以支持芯片的其他組件來完成其他工作,比如場景識別、文本識別、人臉識別和自然語言處理(能夠理解對話內容而不僅僅是嚴格的執行命令)。
另一方面,AI專用芯片也已經問世。一家名為Movidius的公司製造的VPUs(視覺處理器,Vision Processing Units)專為計算機視覺神經網絡技術進行了優化,使之取得更佳的效果表現。比如,該公司最新的Myriad 2芯片被應用在大疆公司的幻影4無人機上,幫助無人機發現和躲避障礙物,以及跟蹤騎行者或滑雪者的移動軌跡。就在本週,芯片造商巨頭英特爾公司宣佈將收購該公司。
Myriad 2芯片在智能手機上運行時,將僅僅消耗1瓦特的電力。值得注意的是,Movidius公司對未來的產品曾做過一些模糊的表述。6月份的時候,該公司宣佈“與聯想公司達成戰略合作伙伴關係,為其各種產品的VR核心部件提供先進的視覺處理技術”。這可能指的是聯想的VR外設或者帶有VR功能的手機,又或者兩者兼指。早在今年1月,Movidius和Google公司宣佈達成了一項關於“優化和加速採用了深度學習技術的移動設備”的合作,當記者尋求Movidius和Google此次合作的更多信息的時候,雙方均表示沒有更多的消息需要披露。
The iBrain
在六月份蘋果公司發佈iOS 10的預覽之前,蘋果對於其在人工智能產品的規劃上一直顯得十分神祕。
Apple Watch示,賦予了AI技術的照片功能是AI技術使用得最多的部分。它使用了深度學習神經網絡技術來識別場景和對象,還可以識別照片中的人臉並且使這些照片可以被方便的搜索到;它的記憶功能可以依據照片或視頻裏的人物、地點和具體事件(比如某次旅行)自動生成一個相冊。而且,蘋果強調,所有這些新功能將在充分保證用户隱私安全的情況下完成。
同時,神經網絡技術也能夠幫助蘋果設備在預測文字輸入並自動完成語句上做得更好。在iOS10之前,AI技術已經在蘋果設備上運行良好。早在2014年的7月,蘋果就已經利用神經網絡技術,將siri轉變成能夠在手機上運行的語音助手,以改善其語音識別能力。
iOS 10上基於AI技術的相冊功能
目前來説,Siri 是APP開發商們在需要調用蘋果設備的AI技術時使用得最多的通道。儘管蘋果目前並沒有像高通公司為驍龍芯片所做的那樣,為其自己的A系列芯片放出AI軟件開發工具包,但是一個名為SiriKit的功能組件可以利用Siri語音助手作為通道,幫助開發者們的APP連接用户。
蘋果在幫助第三方開發者利用AI技術上,可能並不會一直遠遠落後於高通。有報道稱,蘋果最近花了2億美元在一家名為Turi的公司上,該公司專為程序員開發AI工具。同時,開發者們在利用AI技術上也將變得更加得心應手。在CPU運行速度和圖形處理上,蘋果iPhone 7 和7 Plus上搭載的最新A10芯片比上一代iPhone分別快40%和50%。
隨着AI技術對整個科技世界的影響力持續擴大,智能手機自然首當其衝。人們對於各種電子產品能夠理解我們所需所想的期望與日俱增。“我可以説,大部分的移動APP將成為AI應用程序”,一個專注於醫療助手APP的AI工程師和顧問Nardo Manaloto表示。
在1月份的電子消費展上,Alberto Rizzoli希望能夠看到更多的全新APP。“當有更多的深度學習軟件可以使用的時候,開發者們自然會選擇跟進。尤其是作為開發者,他們更能夠意識到這一趨勢”,他説。“儘管在許多IT從業者眼裏,AI技術仍然是一項黑科技,但其實他們錯了。”
注:本文由“圖普科技”翻譯,楊志芳編輯。
資料來源:36Kr
9月13日,蘋果用户可以正式更新全新的 iOS 10 系統,更新後的 iOS 系統可以讓用户隨意找到在任意時間和地點、有關任意人或事物的照片。iOS 10 系統利用了人工智能神經網絡技術,用户每次拍攝照片的0.1秒內會進行約110億次運算,可以找出照片中的人物是誰,甚至以及他們處於什麼樣的情緒。
本次 iOS 10 照片應用程序僅僅只是 AI 技術走向“手持設備化”趨勢的一個最新例子而已。比如今年一月份所發佈的應用程序Aipoly,能夠識別出各種物體,併為視障人士大聲播放物品名字。還有,Google翻譯現在可以在你拿起相機對準文本內容的同時,將內容文字即時翻譯成另一種語言。現在這類運算可以做到非常之快,甚至在你意識到之前就已經完成。
Aipoly不僅能夠識別出圖片中的動物,還能識別出該動物的品種,然後大聲地播放出它們的名稱。
就在“雲技術”正成為“它是如何運作的?”這類問題的唯一答案時,智能手機卻反其道而行,朝着獨立運行的方向發展。AI 技術已經可以在手機上獨立進行任務處理,而無須像以往那樣,需要一個龐大的雲端服務器羣提供支持。這樣做的結果,是用户在使用 AI 技術的時候,不會再產生網絡鏈接數據中心時的惱人延遲,用户將會得到更自然和順暢的使用體驗。“當我説,‘嘿,Siri,這是什麼?’的時候,需要兩秒鐘來把圖片發送到雲端才能獲得響應,” 創始人之一Alberto Rizzoli説,“這有點像在與一個剛睡醒的人聊天。”實際上,Aipoly不是第一個幫助視障人士識別物體的應用程序,而是第一個通過減少對雲端的依賴而在智能手機上獨立運行AI技術來即時識別物體的應用程序。
根據高通(Qualcomm)產品經理 Gary Brotman 表示,這類即時AI技術,將可以精確而又詳細地繪製周圍的地理環境,然後在其中植入具有豐富細節的3D物件、字符和動畫,最後呈現在用户的智能手機或其他電子產品的顯示屏幕上,這將遠遠超過遊戲 Pokémon Go 裏所使用的 AR 技術。
同樣,VR 技術與智能手機上的 AI 技術結合後將顯得更加真實。“要實現上述效果,一切都得是完全實時的,”他説。“所以你必須能夠在展示視頻、音頻的同時,由人工智能技術來實現眼球追蹤、頭部跟蹤、手勢跟蹤和空間聲源跟蹤。”
AI 技術同樣也可以為人們的生活提供便利。Rizzoli表示,虛擬助手可以利用手機的攝像頭來識別人們的位置,比如在一個特定的街道邊或餐廳裏,然後關聯到相關的應用程序。而這一次,實時AI技術將使得類似的給人們帶來極大便利的功能不再受到網絡延遲的影響。如果未來的AI技術不再需要雲端支持,那麼雲計算同樣也不再需要人們的個人數據。
“無論出於對隱私原因、延遲原因還是其他各種各樣原因的考慮,AI技術的分析和控制中心都應該被安裝在手機上,而不是雲端。”Brotman説道。
內置人工智能
是什麼在驅使着將 AI 技術應用到手持設備中?答案是視頻遊戲。
“人們想要在他們的手機和ipad上體驗到更好的手機遊戲,”Rizzoli説。“所以蘋果、高通以及其他芯片製造商在追求更佳的性能上一直表現得很出色。”實際上,這也是手機CPU和GPU往更強性能的方向上發展的重要推動力。CPU大多是按照順序分步完成任務,而GPU在進行3D圖像快速渲染時則是並行地處理數量巨大的簡單任務。AI技術也需要串聯地執行多個並聯起來的簡單任務。
以現代圖像識別領域內的主要技術——“卷積神經網絡(CNN)”為例,卷積神經網絡(CNN)模仿大腦視覺皮層的工作原理,把視覺領域分成重疊的圖片塊,然後按照特定的順序,過濾掉簡單的細節,例如所有的圖片塊邊緣。當這些信息到達某一神經層(人類的生物層面或者軟件的虛擬層面)的時候,這一層的神經元可能會把邊緣結合成線,而到達另一層神經元的時候,則可能識別出圖片的主要形狀。每一層(數量上可能達到幾十層)進一步改進圖像的感知器。“你看一張照片時候,你同時也在確認它裏面的各種信息,”Rizzoli説,“當你在確定圖像邊緣的時候,你也在確認圖像可能存在的形狀。而且所有這些確認行為可以並行地同時完成。”
實際上,智能手機的芯片已經經歷了幾年的挑戰。2013 年發售的iPhone 5s在本次iOS 10的更新中,仍然能夠支持新的人像識別,場景識別和對象識別。Aipoly也在製作數個版本,使該軟件可以在幾年前發售的iphone5和Android手機上順利運行。然而程序員們最近才能充分利用好這種新技術,今年六月推出的照片效果處理軟件Prisma,便是這種技術的最早應用者之一。
二十五歲Aleksey Moiseenkov 創建的 Prisma,可以將智能手機的照片渲染成30種不同藝術風格的應用程序,比如“尖叫”、“蒙德里安風格”,以及一些有趣的標題諸如“美到犯罪”“火焰噴射器”以及“#進城”。與其複雜程度不相匹配的是,渲染效果的呈現幾乎是瞬時完成的。一個Instagram上的濾鏡只是通過預設之後簡單地調整圖像的基本參數,如顏色、對比度、亮度或是白平衡。而Prisma則需要分析圖像以及識別出圖像的基本信息,如形狀、條紋、顏色和材質,然後就像Edvard Munch(挪威畫家,1863~1944)或者 Piet Mondrian(荷蘭畫家,1872~1944)一樣,在隨意塗鴉一樣重新畫出來。即便開始時輸入的是平庸水準的照片,通過如此處理後的成品效果依然可能會大放異彩。
左邊是一張極度無聊的照片,右邊為經過Prisma的“摺紙藝術”風格處理後的照片效果圖。
Prisma的所有處理過程最初全都是在雲端進行的,然而Moiseenkov卻認為依靠雲計算可能會影響到這個應用程序的使用質量。“我們在亞洲有很多的用户,”他説,“我們需要給予他們始終如一的優質體驗,無論用户是使用何種方式鏈接的網絡,以及無論服務器或者雲計算服務器位於何處。”該軟件在8月份更新的iPhone版本中,已經能夠在iPhone上完全獨立地完成所有處理過程,Moiseenkov現正集中精力在研發該升級的Android版本。
將同樣的藝術效果渲染技術適用於視頻處理的升級可能也會在9月份推出,Moiseenkov説。“按照之前在雲端的處理方法,視頻的處理將會複雜得多,服務器和其他相關的東西隨時都有可能超載”,他説,“所以,使視頻可以在手機上完成效果處理是至關重要的。”
Moiseenkov和他的團隊需要找到讓AI程序能夠在智能手機上流暢運行的方法,這項工作對於未來的程序員來説可能會較容易實現。今年5月,高通公司推出了一個專為高通驍龍 820芯片設計的,名為“神經處理引擎”的軟件開發工具包。該款芯片被廣泛使用於2016年的高端Android手機中,比如三星Galaxy S7和Note 7,Moto Z和Z Forece,OnePlus 3,HTC 10 和LG G5。這個名為“神經處理引擎”的軟件開發工具包可以在並行處理CPU、GPU任務的同時,還可以支持芯片的其他組件來完成其他工作,比如場景識別、文本識別、人臉識別和自然語言處理(能夠理解對話內容而不僅僅是嚴格的執行命令)。
另一方面,AI專用芯片也已經問世。一家名為Movidius的公司製造的VPUs(視覺處理器,Vision Processing Units)專為計算機視覺神經網絡技術進行了優化,使之取得更佳的效果表現。比如,該公司最新的Myriad 2芯片被應用在大疆公司的幻影4無人機上,幫助無人機發現和躲避障礙物,以及跟蹤騎行者或滑雪者的移動軌跡。就在本週,芯片造商巨頭英特爾公司宣佈將收購該公司。
Myriad 2芯片在智能手機上運行時,將僅僅消耗1瓦特的電力。值得注意的是,Movidius公司對未來的產品曾做過一些模糊的表述。6月份的時候,該公司宣佈“與聯想公司達成戰略合作伙伴關係,為其各種產品的VR核心部件提供先進的視覺處理技術”。這可能指的是聯想的VR外設或者帶有VR功能的手機,又或者兩者兼指。早在今年1月,Movidius和Google公司宣佈達成了一項關於“優化和加速採用了深度學習技術的移動設備”的合作,當記者尋求Movidius和Google此次合作的更多信息的時候,雙方均表示沒有更多的消息需要披露。
The iBrain
在六月份蘋果公司發佈iOS 10的預覽之前,蘋果對於其在人工智能產品的規劃上一直顯得十分神祕。
Apple Watch示,賦予了AI技術的照片功能是AI技術使用得最多的部分。它使用了深度學習神經網絡技術來識別場景和對象,還可以識別照片中的人臉並且使這些照片可以被方便的搜索到;它的記憶功能可以依據照片或視頻裏的人物、地點和具體事件(比如某次旅行)自動生成一個相冊。而且,蘋果強調,所有這些新功能將在充分保證用户隱私安全的情況下完成。
同時,神經網絡技術也能夠幫助蘋果設備在預測文字輸入並自動完成語句上做得更好。在iOS10之前,AI技術已經在蘋果設備上運行良好。早在2014年的7月,蘋果就已經利用神經網絡技術,將siri轉變成能夠在手機上運行的語音助手,以改善其語音識別能力。
iOS 10上基於AI技術的相冊功能
目前來説,Siri 是APP開發商們在需要調用蘋果設備的AI技術時使用得最多的通道。儘管蘋果目前並沒有像高通公司為驍龍芯片所做的那樣,為其自己的A系列芯片放出AI軟件開發工具包,但是一個名為SiriKit的功能組件可以利用Siri語音助手作為通道,幫助開發者們的APP連接用户。
蘋果在幫助第三方開發者利用AI技術上,可能並不會一直遠遠落後於高通。有報道稱,蘋果最近花了2億美元在一家名為Turi的公司上,該公司專為程序員開發AI工具。同時,開發者們在利用AI技術上也將變得更加得心應手。在CPU運行速度和圖形處理上,蘋果iPhone 7 和7 Plus上搭載的最新A10芯片比上一代iPhone分別快40%和50%。
隨着AI技術對整個科技世界的影響力持續擴大,智能手機自然首當其衝。人們對於各種電子產品能夠理解我們所需所想的期望與日俱增。“我可以説,大部分的移動APP將成為AI應用程序”,一個專注於醫療助手APP的AI工程師和顧問Nardo Manaloto表示。
在1月份的電子消費展上,Alberto Rizzoli希望能夠看到更多的全新APP。“當有更多的深度學習軟件可以使用的時候,開發者們自然會選擇跟進。尤其是作為開發者,他們更能夠意識到這一趨勢”,他説。“儘管在許多IT從業者眼裏,AI技術仍然是一項黑科技,但其實他們錯了。”
注:本文由“圖普科技”翻譯,楊志芳編輯。
資料來源:36Kr