AR 十年發展史:它會讓你看到未來嗎?

編者按:AR 技術是這兩年才走進人們視野,贏得廣泛關注的,然而實際上,AR 技術已經有了十年的發展歷程了。a16z 知名投資人 Benedict Evans 最近發表了一篇文章,對 AR技術的進化歷程進行了回顧。他認為,AR已經演示過,相當出色,但是面向大眾市場的商用產品還沒有出現,應該不遠了。


2006年2月,Jeff Han在TED演講中演示了多點觸控技術,當時多點觸控界面還處在實驗階段。現在我們還可以在網上看到演示視頻。回看視頻,他所展示的技術平淡無奇,花50美元買一台Android手機就能做到。當時的觀眾大部分都是經驗豐富、關注科技的老手,他們為技術喝彩。現在看起來平淡的技術當時卻是驚人的。一年之後,蘋果發佈了iPhone,科技產業因為多點觸摸重新歸零。

回看過去的10年,多點觸摸技術的發展出現了4個關鍵點,第1個關鍵點,多點觸摸在實驗室內成為有趣的概念,第2個關鍵點,演示技術出現在公眾視野中;第3個關鍵點,在iPhone推出,出現了第一個可行的消費產品;第4個關鍵點,7年之後,銷量爆炸,iPhone不斷進化,Android追了上來。

看看下面這張圖片,發展有些滯後,2007年iPhone出現之後,等了好幾年銷量才開始騰飛。大多數革命性技術都是分階段發展起來的,很少有技術一下就成熟了。與此同時,有一些系統走上了錯誤的道路,比如西方的Symbian,日本的iMode。


我認為,今天的AR介於第2關鍵點和第3關鍵點之間:技術已經演示過,相當出色,我們還看到了原型產品,但是面向大眾市場的商用產品還沒有出現,不過很接近了。

微軟HoloLens正在出貨,微軟頭盔擁有出色的位置追蹤技術,將計算機集成到頭盔內,這樣做也有一些缺點,頭盔的成本會上升,視野比較狹窄,定價達到了3000美元。第二代HoloLens將會在2019年推出。很顯然蘋果也在開發一些類似的產品,從人才招募、收購與蘋果CEO的評論就可以看出來。我甚至懷疑,蘋果在微型化、功率、音頻方面開發了一些技術,這些技術用在Apple Watch、Airpods上,在AR領域這些技術也很關鍵。Google、Facebook、亞馬遜可能也會開發一些東西。還有一些小企業、創業公司參與進來,它們正在開發有趣的東西。

Magic Leap也在開發自己的可穿戴技術,它發佈過一些視頻,展示設備的能力。視頻很酷,不過觀看iPhone視頻和使用iPhone是完全不同的,同樣的,觀看AR視頻,戴上AR頭盔、走一走、看到世界浮現於眼前,二者也是完全不同的。我自己試過,一點也不差。

第一級AR和Google Glass體驗差不多,屏幕讓內容浮現於眼前的空間內,不過它與世界沒有任何聯繫。事實上,Google Glass的概念跟智能手錶極為相似,只是你需要向上向右看,不是向下向左看。眼鏡給你一塊新屏幕,對於你眼前的世界,它沒有任何感覺。如果引進更先進的技術,視野可以變成球形,顯示窗户、3D對象及其它一切東西,飄浮在空間內。

當AR變成“真正的AR”,或者是説是“混合現實”,設備開始感知環境,它可以將圖像放進世界,當你停止懷疑,你就會認為圖像是真實的現實。和Google Glass不同,頭盔始終用3D技術給環境繪圖,追蹤頭部位置。你可以將虛擬電視掛在牆壁上,當你移動時電視仍然會在牆上,或者乾脆將整個牆壁變成顯示屏。


你也可以將Minecraft放在咖啡桌上,將小山放在手掌中,好像你在雕塑黏土一樣。如果其它人戴上同樣的眼鏡,他們會看到同樣的東西:你可以將牆壁、會議桌放進屏幕,然後你的整個團隊都可以同時使用;在同一張Minecraft地圖內,你和你的孩子可以同時控制。或者説,一個小機器人藏在沙發後,你可以將機器人藏在那裏,讓你的孩子尋找。這就是混合現實,它如同一塊屏幕,或者説,我們可以將身邊的世界變成無限的屏幕。

有時你想戴着頭盔去某個地方,你本人是靜止的,只是使用了SLAM技術,你會給房間的3D表面繪圖,但是你不理解它。假設我與你在網絡事件中相遇,我查看你的LinkedIn資料卡,它浮現在你的頭頂,或者查看Salesforce記錄,它告訴我説你是關鍵目標客户,或者查看Truecaller記錄,它説你想向我兜售保險。和《黑鏡》所説的一樣,你也許還可以屏蔽某人。也就是説,眼鏡中的圖像傳感器不只可以給周邊對象繪圖,還可以感知它們的存在。

這就是真正的AR:你可以展示圖像,它與世界是平行的,你還可以成為圖像的一部分。眼鏡可以向你展示一些東西,它看起來也許像智能手機,也許像2000英尺的屏幕,它還可以將屏幕分解,融入真實世界,改變真實世界。於是體驗就分成了兩極:一方面,你可以將所有一切放進屏幕,讓整個世界更充實,或者破壞世界;另一方面,你可以將微妙的線索或者變化放進世界,當你旅行時,它會將標誌翻譯成你理解的語言,但是不只如此,它還可以將美式英語修正為英語。如果有人安裝Chrome擴展包,將“millennial”換成“snake people”(擴展包的名稱),MR擴展會有怎樣的變化?總之,有趣是我們需要解決的最重要問題。

一旦眼鏡變得足夠小,我們會不會整天佩戴?如果不佩戴,許多環境應用程序將會找不到用武之地。你可能還會使用手錶、手機,它們一直處於開啟狀態,眼鏡只在合適的環境下用來閲讀。這樣就可以解決社交問題,Google Glass就出現了社交問題:拿出手機,看看手錶,或者戴上一幅眼鏡,它們所傳達的信號是其它人可以理解的;如果在酒吧戴上Google Glass,其它人很難理解。

如此一來我們就觸及一個問題:VR與AR會不會融合?的確有可能,VR與AR所做的事是存在聯繫的,面臨的工程挑戰也是存在聯繫的。要在同一款設備中提供VR和AR體驗有一個挑戰:VR將你帶到另一個世界,它會將其它一切阻擋在外,眼鏡邊緣是密封的,AR不需要這樣。AR面臨的挑戰在於:讓世界穿過,同時阻擋那些你不想看的東西,VR卻是從黑屏開始的。

戴上AR眼鏡,你可以看到人的眼睛。10年或者20年之內,許多事情有可能變成現實,但就目前而言兩種技術還是不同的。1990年代末,我們曾經爭論過一個問題:移動互聯網設備將會擁有獨立的音頻元件或者屏幕,加上聽筒,或者加上一個鍵盤,或者是擁有一個鍵盤和一塊屏幕的哈殼,當時我們還在探討設備的外形,到了:2007年,所有問題在一塊屏幕上解決。同樣的,VR與AR可能要花一段時間探討該問題。


如果某些東西不是實體存在,我們如何控制它,與它互動?VR的物理控制器夠用嗎?手勢追蹤足夠好嗎?在智能手機上引進多點觸摸技術,意味着我們擁有了直接的物理交互體驗,我們在屏幕上觸摸想觸摸的東西,不需要移動鼠標,鼠標離目標1英尺或者2英尺遠,我們可以在空中觸摸AR對象嗎?這種界面模式適合全天候使用嗎?Magic Leap的確創造出一種深度感,你會覺得自己真的在觸摸一些東西,你是不是需要一種界面,當你的手滑過時會感覺到它是堅硬的?

我們是不是應該用語音替代?語音又會造成多大的限制?或者選擇眼球追蹤技術?如果眼鏡可以支持虹膜追蹤技術,你會注視自己想看的東西,然後觸擊手錶選擇它嗎?這些問題與之前智能手機、PC必須解決的問題是一樣的,正如2000年或者1990年所探討的外形問題一樣,答案並不清晰,實際上連問題本身也不明確。

AR將對象和數據放進我們周圍的世界,關於這點思考越多,你就會發現它變成了一個AI問題,同時又是物理界面問題,這兩個問題同等重要。當我走向你,我應該看到什麼?顯示LinkedIn信息還是Tinder信息?我應該在什麼時候看到新信息,即時顯示還是晚一點?當我站在餐廳外面,我應該説:“嗨,Foursquare,這裏有什麼好吃的嗎?”還是設備的操作系統自動完成?這名經紀人到底如何?是讓操作系統判斷,還是讓剛才添加的服務判斷,或者讓雲中的Google Brain判斷?

關於這個問題,Google、蘋果、微軟、Magic Leap可能有着不同的哲學態度,不過在我看來,如果你想讓它完美運行,最好讓大多的事情自動完成——應該是AI來完成。你也許記得Eric Raymond曾經説過,計算機如果可以做完某件事,它就不應該問你,照此發展下去,計算機將會看見你所看見的,知道你在看什麼,在接下來的10年裏,機器學習技術不斷髮展,整個問題層全部剔除,今天我們認為這些問題必須手動解決,未來不是這樣的。

當我們從桌面計算機的Windows、鍵盤、鼠標UI向智能手機觸摸操作和直接交互體驗轉移時,整個問題層都被移除了,抽象層改變了。照片應該存在哪裏?打車時你在哪裏?應該使用哪個郵件APP?密碼是什麼?智能手機不會問,所有問題都被移除。當AR到來時,我們會朝着同樣的方向前進一步:你的前方出現一個小窗口,智能手機APP出現在窗口中,不過體驗遠不止如此。Snapchat和Facebook桌面網站是不一樣的,基於環境的、無形的、以AI主導的UI將會再次改變一切。

當AR眼鏡越來越理解周邊世界(理解你自己),它們看到的東西越來越多,就會將自己看到的一些東西傳送到不同的雲服務上,具體是哪個服務根據環境、使用案例、應用模式而定。這是不是一張臉,你是不是在與它交談?將它發送到Salesforce、LinkedIn、TrueCaller、Facebook或者Tinder。是不是一雙鞋子?發送到Pinterest、亞馬遜或者Net a Porter。開會時如果人人感到厭煩,你是否將記錄發送到Success Factors?類似的信息可能會帶來嚴重的隱私安全問題。我曾經在博客中説過,無人駕駛汽車不斷捕捉HD 3D 360度視頻,如果城市裏到處都是無人駕駛汽車,它就會變成監獄。如果每個人都穿戴AR眼鏡又會怎樣,還能逃跑嗎?如果被黑又會怎樣?如果你的聯網住宅被黑,相當於你有了一隻搞惡作劇的鬼怪,如果你的AR眼鏡被黑,你就會出現幻覺。

最後,有一個重要的問題值得追問:到底有多少人會擁有AR設備?AR會不會成為附件,被手機用户中一小部分人使用,正如智能手錶一樣?或者説英國、印尼的每一個小鎮都有小店鋪銷售AR眼鏡,有幾十款可以選擇,它們來自中國,定價50美元,今天這些店鋪銷售Android設備?到時寬帶成本是多少?

這個問題現在還很難回答,有點太早。1990年代末2000年代初,我們也曾看到過一些爭論:是否每個人都應該擁有相同的移動數據設備?或者説一些人擁有智能手機,一些人擁有功能手機,然後一直向下,擁有更簡單的設備,它們沒有攝像頭,沒有彩色屏幕。説來有點像馬後炮,這種爭論似曾相似:是否每個人都會擁有PC?或者説一些人會堅持使用文字處理器?之前有過這種爭論。按照規模和通用計算的邏輯,最開始時是PC,然後智能手機成為單一通用設備,今天有50億人擁有手機,25-30億人擁有智能手機,很明顯,其它人大部分也會追趕潮流。

有一個新問題值得思考:大部分人堅持使用智能手機,一些人(1億,5億或者10億?)會轉向眼鏡,將它當成附件嗎?或者説會將眼鏡變成新的通用設備嗎?關於這個問題,任何答案都是基於想像得出的,而非分析。1995年時,也曾有人説過地球上的每一個人將會有一台手機。

譯文:小兵手 編輯:楊志芳


資料來源:36Kr

如果喜歡我們的文章,請即分享到︰