你是否會記住一張圖片?人工智能可以預測!

經典老照片「勝利之吻」:二戰結束後,時代廣場上一位美國海軍正在親吻一名護士。
在這個人工智能技術飛速發展的年代,「人類」這個詞的定義似乎越來越狹隘。由於我們教會機器的東西越來越多,很多我們以為只有人類會做的事情越來越多地可以由機器人取代,人類和人工智能的界限越來越模糊。「只有人類能做的事」變得越來越少,誰也不知道是否有一天,人工智能可以完全地取代人類。


最近一個來自 MIT 的科研團隊就成功地開發出了用人工智能測量人類記憶的程序。研究員們聲稱他們發明的程序可以預測圖像是否容易讓人類記住,這種技術史無前例。

這項發明意義及其重大,其原因不僅僅是「記憶」這個概念的複雜和精細,還有更多其他因素。

該團隊在論文中寫道:「原本人們以為靠人工智能來預測人類的視覺記憶是不可能的。圖像記憶和普通的視覺分類判斷完全不同;圖像的可記性似乎沒有規律可循。例如一頭大象,一間廚房,一副抽象畫,一張臉和一張賬單,這些圖像可能可記性都屬於同等級,然而沒有任何圖像識別算法可以把這些圖分類到同種羣。」

我們該如何教會一台機器怎麼分析一張圖像對人類而言的可記性?首先你得從人類身上自行判斷,什麼樣的圖像容易被記住。科學家們讓志願者玩了個遊戲:給他們看一系列圖像,其中有些圖像是重複的。總共有 600000 張不同的圖片,例如夕陽,中標,芭蕾舞者,自拍,狗,樹木等等等等。如果志願者發現展示的圖片中有他之前看過的,就按指定按鈕。

「理論上,我們給的圖像可記性越高,人們記住的也就越多。」

然後研究員再教電腦 MemNet 根據人類判斷的可記性將同一張圖像用 1000 中不同的方法來歸類。瘋狂的是,「通過把 MemNet 的分析用分層圖像來表示,我們終於發現了決定圖像可記性的關鍵。」

簡單地説,他們通過了解機器如何精準地預測圖片的可記性,從而發現了人們為什麼會覺得一張圖片容易記住。

例如下圖,我個人覺得我這張照片很容易記住。在從 0 到 1 的可記性指標中(0 為最難記住,1 為最容易記住),該圖的指數是 0.85。圖中紅色區域代表着這張圖最容易被記住的特徵。

可記性:高, 指數:0.854

研究員發現,代表憤怒、厭惡和恐懼的圖像通常比代表滿意、敬畏的更容易被記住。總體來説,負面圖像的可記性比正面圖像更高,除非是滑稽類圖像。讓人覺得滑稽的圖片通常可記性都非常高。

我的這張圖片可記性為什麼這麼高?研究員 Khosla 告訴我,從目前的技術階段判斷,主要原因是構圖關係。由於目前人臉分析模型還在研發階段,因此還無法確定臉部特徵和可記性之間的確切關係。基於現有的電腦模型,他們發現容易被人記住的圖像通常都有顯著的聚焦點,或是主要物體更集中。

可記性:高,指數:0.849

這張狗的照片可記性也很高:

不過這張街景圖片可記性就不太高:

可記性:低,指數:0.385

這些畫了臉的雞蛋非常容易被人記住:

可記性:非常高,指數:0.938

科學家們還發現,圖片的熱門度與可記性也有很大聯繫。研究人員使用的圖像集中也有不少來自 Flickr 的圖片,統計顯示熱門圖片的可記性明顯比相對不太熱門的要高。這就意味着人類今後可以專門設計圖片從而提高它在社交網絡上的分享熱度。這項發現也引發了我們對「可記性」的本質的更深度的思考。如果只讓人們看容易記住的圖像,那會怎樣?「他們是否會忘記其中的大部分,只記得其中可記性最高的那幾張?我們的初步試驗證明已經證明這項假設是錯誤的。我們發現,我們給參加者看得圖像可記性越高,他們平均記住的圖像也越多。」Khosla 告訴我。

這項研究的可應用範圍非常廣泛。例如教材可以由此進行改編,好讓學生更容易記住教學內容;總統侯選人或是廣告公司可以設計出讓人更難忘的海報。MIT 的研究人員們給的報告總結非常精簡:「我們的研究證明,預測人類的認知能力對計算機視覺領域而言是完全可能的。」但其研究的潛力和應用範圍大到不可估量。


原文來源:Atlantic , 本文由 Tech2ipo / 創見 Locin 編譯,首發於 TECH2IPO / 創見

資料來源:TECH2IPO

如果喜歡我們的文章,請即分享到︰