相互學習效率高,Google 讓14台機器人手臂相互學習
編者按:本文作者 Alex Brokaw。
Google 的研究人員正試圖讓機器人像人一樣認識世界,這意味着機器人要進行大量的練習。研究員 Sergey Levine 和他的團隊對 14 台機器人手臂進行試驗,這 14 隻手臂相互連接,研究人員使用卷積神經網絡讓這些機器人自主學習如何抓取小物體,如杯子、膠帶座和檸檬綠的玩具海豚。
經過一年訓練的手臂現在可以自己抓取並撿起小物體,但是讓不同的機器學習同一樣任務是很困難的。機器人的手臂的編程信息通常是用來識別物體並按照預定的程序做出反應,無法想人類一樣根據周圍的環境做出改變。對於發生在可預測地點的任務和機器已經學習過如何抓取的物體,這是一種好方法。但是機器人可以抓取訓練之外的其他從來沒有見過的物體嗎?
為了探究這一點,研究人員讓機器人手臂伸入隨機裝滿物體的盒子裏,讓它們憑藉運氣隨機抓取物體。在一天之後,研究人員收集機器人嘗試抓取物體的數據,然後用這些數據訓練神經網絡,讓抓取物體的結果更加理想。在 80 萬次抓取行動之後,機器人手臂就可以自動糾正自己的行動了。很快他們就可以更加順利地抓取物體了,甚至會採用某種策略,如推開一個物體去抓取另外一個物體,或者去抓取柔軟的物體而不是堅硬的物體等。
手臂的所有這些行動沒有研究人員編寫系統告訴它們怎麼抓取物體。使用反饋環路,它們可以將抓取物體的失敗率降低到 18%。這些研究人員打算將他們的研究擴展到更寬的領域中,然後在實驗室之外的其他多種真實環境中進行嘗試。
本文編譯自:theverge.com,如若轉載,請註明出處:http://36kr.com/p/5044415.html
“看完這篇還不夠?如果你也在創業,並且希望自己的項目被報道,請戳這裏告訴我們!”
資料來源:36Kr