在這個地方里搜索表情,會有奇蹟發生 | MindStore


有時候看着一張照片,盯久了,腦袋會突然卡殼,辨認不出照片裏面是什麼東西,每當遇到這種情況的時候,我想我內心是崩潰的。

可這樣的煩惱,我想也許以後就不存在了,MindStore 分享了一個由微軟推出的智能圖像識別機器人 CaptionBot,可以像人類一樣識別並且能夠描述圖片的內容。除了能夠告訴我圖片中的物體是什麼,還能讓我知道它正在做什麼。

CaptionBot 的出現主要是微軟為了展示其通過多年的研究成果,特意推出的微軟認知服務(Microsoft Cognitive Services)。確切地説,CaptionBot 由計算機視覺 API、人工情感 API 和Bing圖像搜索 API 等三個部分組成。

不可思議的辨認識別度


我們可以發現 CaptionBot 網站本身有提供六張圖片作為測試,只是想嚐嚐鮮的人只要輕點其中一張圖片,不久就會出現分析結果。


CaptionBot 識別的準確度比想象中要高很多,不僅僅能識別出圖片中的物體是三明治,還知道它是被切成兩塊的三明治。在三明治的下面,我們還可以為識別的結果打分,根據評分來判斷識別結果的正確性。

也許隨着評分人數的增加,CaptionBot 的深度學習系統使其智能識別準確度越來越高。

當然,像我這種具備強烈好奇心的人,自然不會忽略頁面下面的“Upload a photo”的字眼。CaptionBot 提供由本地上傳和圖片鏈接等兩種圖片上傳的方式,操作方式跟平時使用的一樣,按提示一步步完成即可。


有時候 CaptionBot 充滿人性化的語氣真是讓人忍俊不禁。


實際上 CaptionBot 的出現,讓我想起微軟在 2015 年開發者大會上,用來展示自家人臉識別 API 的網站 How-Old.net,用户只要上傳照片,系統就會自動判斷你的性別和年齡。

當時這個產品在國內外的社交平台上都火了一圈,不知道大家還記不記得,當時的朋友圈幾乎每張照片上,每個人的臉都被方框框住,每個方框上面都飄着一個數字,説不定 CaptionBot 就是下一個轉瘋朋友圈的 How-Old.net.


當時每個人都以年齡數字小為榮,可有一個詭異的事件不知道大家有沒有發現。大家可以觀察一下上面這張圖片,然後在評論區給我留言發現了什麼。

他們的“第三隻眼睛”

CaptionBot,是微軟在其圖像識別等領域取得的成果的展現, 目前它可能僅僅只是作為一個小測試,識別某張圖片的內容。

我在剛打開這個網站的時候,心裏也是嘀咕着説:“這玩意兒有什麼用啊?不就是識別圖片嘛。”

沒錯,對於普通人來説,CaptionBot 可能僅僅是在社交媒體上充當一個玩具的作用,我利用這樣一個玩具達到我娛樂和社交的目的,這樣就完了,也沒有後面的東西了,也許僅僅是兩三天後我就已經忘記這樣一個網站的存在了。


可是仔細想一想,對於盲人等一些有缺陷的人來説,這可能就是打開新世界的大門了。假如一個盲人戴着裝有能實現 CaptionBot 功能的 Google Glass 出門,任何圖像內容能夠被智能識別並且轉化為語音,那盲人是否也能通過這樣的“第三隻眼”來“看到”這個世界了?

期待這一天的到來。

題圖來自:unsplash



資料來源:愛範兒(ifanr)
作者/編輯:柳 鵬飛

如果喜歡我們的文章,請即分享到︰