圖像識別領域, 微軟和 Google 之間差了十個 Intel

http://dn-noman.qbox.me/Fk3iJqtstBR1TS-xCw86C352Sv3L

圖片來源：dn-noman.qbox.me

在第六屆 ImageNet 圖像識別挑戰賽上，微軟研究院在多個類別的比賽中取得了第一名的成績。比賽結果顯示，微軟的技術水平遠遠超越了 Google、Intel、高通、騰訊以及一眾創業公司和科研實驗室。
這個叫做「圖像識別的深度殘差學習」的獲勝項目由微軟研究員何愷明、張祥雨、任少卿和孫劍共同完成。根據微軟博客顯示，有關該成果的細節將會在後續的論文中詳細介紹。

該技術的顯著意義主要在於其複雜性。

據該團隊介紹，「我們訓練了深度超過 150 層的神經網絡。我們提出了「深度殘差學習」的框架將深層網絡的優化和聚合過程簡化。當網絡層次比起先前不斷加深時，我們的「深度殘差網」會獲得準確性的增長。這樣的準確性增長是許多普通網絡在深化時所沒有的。」

該研究領域在科技公司相當常見，大家都在想辦法同時改進自己的內部系統和麪向消費者的產品。深度學習身處高性能網絡的核心，涉及到訓練大型數據集（例如照片）的人工神經網絡，然後據以推導新數據。
微軟以十分接地氣的方式展示了該技術的成效，例如「How Old Do I Look？（測顏齡）」「How's My Moustache Doing？（鬍子怎麼樣）」等應用。在微軟研究院牛津項目中，它首次實現了圖像識別技術的商業化。

http://dn-noman.qbox.me/FqkZke7UhkVr1DPUYoPXBx3nzjpe

圖片來源：dn-noman.qbox.me

ImageNet 的比賽需要在對 10 萬個來自 Flickr 和搜索引擎的圖片進行識別，正確地定位物體並劃分到 1000 個實體類（狼蛛、iPod、清真寺、玩具店、調制解調器等）中，錯誤越少越好。

微軟憑藉 3.5% 的分類錯誤率，和 9% 的定位錯誤率獲勝。早些年，Google、創業公司 Clarifai 和 NEC 都在分類比賽中領先。

今年何愷明等人的系統在 ImageNet 目標偵測比賽中也獲得了第一。孫劍説，「我們甚至不相信這個的想法有這裏厲害。」
今年的排行榜上少了百度。百度因提交的內容超出了比賽許可範圍而提前出局，他們最終道歉並解僱了做出該錯誤決策的團隊負責人。

本次比賽中，IBM 採用 SoftLayer 公共雲服務，為參賽團隊提供了英偉達圖形處理器。

文章來源：venturebeat 由 TECH2IPO / 創見雍若陽編譯，首發於創見科技（http://tech2ipo.com/），轉載請註明出處。

資料來源：TECH2IPO

圖像識別領域, 微軟和 Google 之間差了十個 Intel

如果喜歡我們的文章，請即分享到︰