華盛頓最新研究:人臉識別算法在面對 100 萬陌生臉譜時能做到何種地步

摘要:計算機科學家和工程師們推出了“大集合臉圖挑戰,“世界第一的競爭旨在評估和提升百萬人規模的人臉識別算法性能”


大的臉圖集包含了1百萬張圖片,代表了超過690,000個不同的人。這是第一次在一百萬規模下測試面部識別算法。在最近幾年中,已經有幾個團隊聲稱,他們的臉部識別算法系統的精準率已經近乎完美。

但本次測試只會在一個僅有13,000張圖片的數據集上進行-比參加美國職業足球賽的平均人數還少。隨着這些人羣增長到一個美國主要城市的規模,他們的表現將如何?

華盛頓大學的研究者回應了這個人臉挑戰問題。世界的第一個競爭,旨於在百萬人的數據規模下評估和提高人臉識別算法的性能。當面臨着更多的干擾時,所有的算法都面臨精準率的考核,但有些算法的表現比別其他的好得多。

“我們需要在星球的尺度上測試臉部識別,確保他能實際應用--在更大範圍進行測試,以便你發現識別算法的缺陷和優點。”計算機科學助理教授和UW項目的首席研究員 Ira Kemelmacher-Shlizerman説道。

“我們不能再一個很小的集合中測試,然後説他是完美的。”

UW團隊首先開發了一個有一百萬相冊圖片的數據集,圖片來自於全世界並且可公開提供創意共享許可證,代表着690572個獨特的個人。隨後他們考驗人臉識別團隊,讓他們下載數據庫然後觀察當必須區分有一百萬種可能性的匹配時他們算法的運行效率。

Google的臉部網絡在其中一項測試中展現出了非常高的性能,當面對更小的圖片集時,達到了近乎完美的精準度,在百萬人測試中精準度達到了75%。一個來自於俄羅斯N-TechLab的團隊在另一個測試中脱穎而出,降到73%。

相比之下,其他算法的精準率也很不錯--大概95%--在一個小規模內下降了更大的百分比,當面臨着更艱鉅的任務時精度低至33%。初步的結果,在計算機視覺與模式識別會議(CVPR 2016)6月30日的論文中被非常詳細的展現出,以及項目網站上更新正在進行的結果,超過300個研究小組正在努力攻克大規模的臉圖。

大規模的臉圖挑戰在查證方面測試了算法,或者説他們在正確的識別兩個照片是否是同一個人方面能表現的多好。這就是一個iPhone的安全功能如何運作,例如,能夠識別你的臉並且決定是否解鎖你的手機,而不是要你輸入密碼。

“如果你在阿姆斯特丹的火車站丟失了你的手機會發生什麼?,或者有人想偷他呢?”共同領導UW圖像算法和成像實驗室的Kemelmacher-Shlizerman説道。“我想非常的肯定我的手機可以在一百萬甚至七百萬人中正常的識別出我,而不是在僅僅10,000或者更少”

他們同樣也在識別方面測試了算法,或者説他們能夠多精準的匹配一個單一個體的照片,從一百萬“分心”中找到同樣是這個人的不同照片。這正是在進行的,例如,當執法部門有一個犯罪嫌疑人的照片,並通過在地鐵站台或機場拍攝的照片,看看是否該人試圖逃跑。

“你可以看出這個問題的難點-從不同的年齡階段中識別出同一個人是無法解決的問題。因此從他們二重身識別出個人和匹配不同姿勢的個人就像側視圖到正視圖一樣。 ”Kemelmacher-Shlizerman説道。在評估規模時,文章同樣分析了在人臉識別時年齡和姿勢的不變性。

總體來説,“學習”在大規模圖片數據集中如何正確片匹配的算法勝了那些只獲得較小的訓練數據集的算法。除了中國研究團隊演算出的SIAT MMlab算法,在更小數量的圖片集上學習,逆流而,上通過比其他的算法做的更好。
大集合面部圖集挑戰仍然在進行並且不斷的收到結果。



團隊的下一步包括收集一半一百萬的個體--每一個都有一定數量的照片--為了一個將被用於臉部識別算法的數據集。這將有助平衡運行場地於並且測試給出相同數量的大規模訓練數據,那個的算法優於其他人,當大多數研究者無法獲得和Google或者Facebook一樣大的圖片集時。該訓練集將被髮布到夏季結束。

“最先進的深神經網絡算法有數以百萬計的參數要學習並且要求有大量的例子來調整他們”Aaron Nech説道,華盛頓大學計算機科學與工程碩士的學生在為訓練數據集而努力。

“和人不一樣,這些模型最初是一個空白的石板。具有數據的多樣性 ,例如在超過500,000個不同個體發現的雜的身份線索,通過提供各種各樣現在未出現的樣本,能夠提高算法的性能”

Via :https://www.sciencedaily.com


資料來源:雷鋒網
作者/編輯:章敏

如果喜歡我們的文章,請即分享到︰