圖像識別領域, 微軟和 Google 之間差了十個 Intel


在第六屆 ImageNet 圖像識別挑戰賽上,微軟研究院在多個類別的比賽中取得了第一名的成績。比賽結果顯示,微軟的技術水平遠遠超越了 Google、Intel、高通、騰訊以及一眾創業公司和科研實驗室。

這個叫做「圖像識別的深度殘差學習」的獲勝項目由微軟研究員何愷明、張祥雨、任少卿和孫劍共同完成。根據微軟博客顯示,有關該成果的細節將會在後續的論文中詳細介紹。

該技術的顯著意義主要在於其複雜性。

據該團隊介紹,「我們訓練了深度超過 150 層的神經網絡。我們提出了「深度殘差學習」的框架將深層網絡的優化和聚合過程簡化。當網絡層次比起先前不斷加深時,我們的「深度殘差網」會獲得準確性的增長。這樣的準確性增長是許多普通網絡在深化時所沒有的。」

該研究領域在科技公司相當常見,大家都在想辦法同時改進自己的內部系統和麪向消費者的產品。深度學習身處高性能網絡的核心,涉及到訓練大型數據集(例如照片)的人工神經網絡,然後據以推導新數據。

微軟以十分接地氣的方式展示了該技術的成效,例如「How Old Do I Look?(測顏齡)」「How's My Moustache Doing?(鬍子怎麼樣)」等應用。在微軟研究院牛津項目中,它首次實現了圖像識別技術的商業化。


ImageNet 的比賽需要在對 10 萬個來自 Flickr 和搜索引擎的圖片進行識別,正確地定位物體並劃分到 1000 個實體類(狼蛛、iPod、清真寺、玩具店、調制解調器等)中,錯誤越少越好。

微軟憑藉 3.5% 的分類錯誤率,和 9% 的定位錯誤率獲勝。早些年,Google、創業公司 Clarifai 和 NEC 都在分類比賽中領先。

今年何愷明等人的系統在 ImageNet 目標偵測比賽中也獲得了第一。孫劍説,「我們甚至不相信這個的想法有這裏厲害。」

今年的排行榜上少了百度。百度因提交的內容超出了比賽許可範圍而提前出局,他們最終道歉並解僱了做出該錯誤決策的團隊負責人。

本次比賽中,IBM 採用 SoftLayer 公共雲服務,為參賽團隊提供了英偉達圖形處理器。

文章來源:venturebeat 由 TECH2IPO / 創見 雍若陽 編譯,首發於創見科技(http://tech2ipo.com/),轉載請註明出處。


資料來源:TECH2IPO

如果喜歡我們的文章,請即分享到︰