準確率98.66% 四個完全不懂日語的碼農開發出了日語識別軟件
人工智能走進現實世界的步伐比你想象中的快得多。
雖然阿爾法狗在圍棋領域的實力讓人印象深刻,但是機器智能也進化到可供更多人使用。這也是為什麼四個幾乎完全不懂日語的碼農能在短短几個月的時間開發出可識別手寫日語的軟件。
這些程序員來自成立僅 18 個月的創業公司 Reactive,他們開發的手寫日語識別程序準確度高達 98.66%。這家位於東京的公司是一個由碼農和投資者組成的社區中的一員,該社區致力於利用神經網絡將人工智能用於更加實際的用途,而不是回答一些雞毛蒜皮的小事,或者在棋盤類遊戲中獲勝。
「僅僅在幾年前,只有天才才能開發出這類軟件,」David Malkin 説,他有着機器學習領域的博士學位,但不會説一句完整的日語。「而現在,利用這些工具你就能成為非常聰明的人。往後,就是關於如何運用想象力將這些工具應用在現實世界。」
曾經,人工智能是 Google、Facebook 等其他科技巨頭獨有的技術、現在,任何一家深度學習相關的創業公司都可以利用基於雲端的平台開發產品,微軟、英偉達和亞馬遜把人工智能當做工具一樣銷售。
Reactive 公司的技術表明,再小的團隊,在一點點專業知識的輔助下,也可以開發出複雜的應用。也許,產品不是問題,如果實現盈利才是需要認真思考的。Reactive 計劃利用該軟件幫助日本學校閲卷。
Malkin 和他的同事 Joe Bullard, Philippe Remy 和 Philip Irri——其中有兩個碩士,一個博士——的進展很快。年初,Bullard 就在 Google 日本總部的一次社交活動上向人工智能愛好者展示了公司的項目,表現堪稱完美。
在很多人看來,筆跡識別對深度學習而言小菜一碟,但日語是截然不同的。這是因為日語中包含象形漢字字符,由可獨立讀取的部分組成,所以很難判斷字詞的開始和結束。日語中還有超過 2000 個象形文字,每個文字又有多個筆畫。Reactive 的算法利用神經網絡進行多次匹配,得出最準確的結果。該公司使用了大約 180 萬字符訓練該模型。
「就識別速度和可塑性而言,該技術在商業領域的應用於該領域的專家相比有着較大的優勢,」Fujitsu Laboratories Ltd 項目主管 Seishi Okamoto 説,他正在開發可識別漢語的軟件。「深度學習識別漢字書寫的準確率與人類相當,也許還會超越。」
傳統的編程是建立在固定的規則上的,寫 C 程序就必須按照 C 程序的語法結構來。但是深度學習人工智能是建立在人類處理信息的模式上。給定足夠的輸入信息,以及期望的結果,神經網絡負責中間流程。這就能解決傳統方式頭疼的問題,如語音指令和圖片標記。
這些都有可能推動人工智能技術的發展。市場研究機構 CB Insights 數據表明:2015 年,人工智能領域創業公司投資,從教育到零售業,再到農業,達到了 3.1 億美元,在五年內增長了 7 倍之多。
文章來源:bloomberg 由 TECH2IPO/創見 陳剛編譯,首發於創見科技,轉載請註明出處。
資料來源:TECH2IPO
雖然阿爾法狗在圍棋領域的實力讓人印象深刻,但是機器智能也進化到可供更多人使用。這也是為什麼四個幾乎完全不懂日語的碼農能在短短几個月的時間開發出可識別手寫日語的軟件。
這些程序員來自成立僅 18 個月的創業公司 Reactive,他們開發的手寫日語識別程序準確度高達 98.66%。這家位於東京的公司是一個由碼農和投資者組成的社區中的一員,該社區致力於利用神經網絡將人工智能用於更加實際的用途,而不是回答一些雞毛蒜皮的小事,或者在棋盤類遊戲中獲勝。
「僅僅在幾年前,只有天才才能開發出這類軟件,」David Malkin 説,他有着機器學習領域的博士學位,但不會説一句完整的日語。「而現在,利用這些工具你就能成為非常聰明的人。往後,就是關於如何運用想象力將這些工具應用在現實世界。」
曾經,人工智能是 Google、Facebook 等其他科技巨頭獨有的技術、現在,任何一家深度學習相關的創業公司都可以利用基於雲端的平台開發產品,微軟、英偉達和亞馬遜把人工智能當做工具一樣銷售。
Reactive 公司的技術表明,再小的團隊,在一點點專業知識的輔助下,也可以開發出複雜的應用。也許,產品不是問題,如果實現盈利才是需要認真思考的。Reactive 計劃利用該軟件幫助日本學校閲卷。
Malkin 和他的同事 Joe Bullard, Philippe Remy 和 Philip Irri——其中有兩個碩士,一個博士——的進展很快。年初,Bullard 就在 Google 日本總部的一次社交活動上向人工智能愛好者展示了公司的項目,表現堪稱完美。
在很多人看來,筆跡識別對深度學習而言小菜一碟,但日語是截然不同的。這是因為日語中包含象形漢字字符,由可獨立讀取的部分組成,所以很難判斷字詞的開始和結束。日語中還有超過 2000 個象形文字,每個文字又有多個筆畫。Reactive 的算法利用神經網絡進行多次匹配,得出最準確的結果。該公司使用了大約 180 萬字符訓練該模型。
「就識別速度和可塑性而言,該技術在商業領域的應用於該領域的專家相比有着較大的優勢,」Fujitsu Laboratories Ltd 項目主管 Seishi Okamoto 説,他正在開發可識別漢語的軟件。「深度學習識別漢字書寫的準確率與人類相當,也許還會超越。」
傳統的編程是建立在固定的規則上的,寫 C 程序就必須按照 C 程序的語法結構來。但是深度學習人工智能是建立在人類處理信息的模式上。給定足夠的輸入信息,以及期望的結果,神經網絡負責中間流程。這就能解決傳統方式頭疼的問題,如語音指令和圖片標記。
這些都有可能推動人工智能技術的發展。市場研究機構 CB Insights 數據表明:2015 年,人工智能領域創業公司投資,從教育到零售業,再到農業,達到了 3.1 億美元,在五年內增長了 7 倍之多。
文章來源:bloomberg 由 TECH2IPO/創見 陳剛編譯,首發於創見科技,轉載請註明出處。
資料來源:TECH2IPO