用科技改善寵物生活,藉助Google技術和EdgeTPU訓練狗狗

當今科技在改善寵物生活方面極具潛力。

就拿我來說,我收養了一只叫 Adelle 的流浪貓。但由于要工作的緣故,和其他很多寵物家長一樣,白天我不得不將她獨自留在家中。因為不能一直陪伴,我也時常會擔心這只四歲的可愛貓咪,怕她會孤單寂寞或者無聊、有沒有按時進食喝水,會不會生病。

幸運的是,現有的技術產品讓我在外出時也能夠查看她的狀況。我有一臺寵物自動喂食器,每天會定時定量為 Adelle 投放兩餐,確保她每天的健康飲食;還有一個自動清潔貓砂盆,這樣她全天都有干凈的貓砂盆可以使用;我還為她戴上了 Whistle GPS 追蹤器,即便走失了,我也可以迅速定位到她。這些同時提升了我和她的幸福指數。

盡管現有的這些設備能幫我了解寵物狀態,確保她身體健康,但我一直在思考,如何進一步提升我們的幸福指數?怎樣通過技術與動物交流?當我們不在家時,是否能通過某些產品讓寵物保持開心并與之互動呢?數以百萬計的狗狗每天需要在家中獨處數小時,還有上百萬只被關在救助站里,很少受到一對一的照顧,我們能否妥善利用這些時間來改善人和動物之間的關系?這些都是我們 Companion 團隊有興趣解決的問題。

在過去的兩年間,我們成立了一支由動物行為專家和工程師組成的小型專業團隊,我們想要開發一款新設備,在主人不在家時與狗狗互動并能自主訓練狗狗。


我們的首款產品 CompanionPro 通過燈光、聲音和零食投喂機與狗狗互動,訓練狗狗的基本的服從行為,如:坐下 (sit)、趴下 (down)、定住 (stay)、召回 (recall) 等。

我們的用戶是流浪犬救助站和想要改善訓犬服務的公司。對于寵物救助站來說,盡管有證據表明,對基本命令有回應并服從的狗狗更有可能被人領養,但救助站通常資源緊張,無法為所照顧的狗狗提供訓練。狗狗日托 (Doggie daycares) 認為現有的訓犬師很難滿足機構中大量訓犬服務的需求。專業的訓犬機構則希望訓犬師能夠專注于指導狗狗完成有一定難度的任務,但他們卻不得不長時間重復教狗狗同樣的基礎動作,以確保狗狗對基本命令有回應且服從。幸運的是,機器具有完美的一致性和無限的耐心來執行重復任務,這讓我們走上了開發自主訓練設備的道路。

開發這一產品面臨很多挑戰。首先必須通過實驗證明我們可以在無訓犬師的房間中訓練狗狗,然后需要建立模型來理解狗狗的行為并確定如何回應他們,最后通過小型化技術,將系統植入到可向狗狗救助站和公司售賣的產品中。

使用 TensorFlow 理解動物

人與人之間的溝通始于良好的傾聽,同樣,犬類訓練更注重對狗狗釋放的信號和行為的良好理解。


為了解 TPU 能怎樣幫助我們解決感知類問題,我們需要了解在理解狗狗行為的過程中,訓犬師認為哪些信息很重要。以下是訓犬師在訓犬過程中可能會提出的一些問題:

狗狗在吃零食嗎?

狗狗在執行“坐下”的動作嗎?

狗狗是否已經知道“趴下”指令?

狗狗之前是否接受過訓練?

環境中的狗狗一般選擇呆在哪里?

狗狗離我有多遠?

狗狗在關注我嗎?

我訓練的狗狗是個“吃貨”嗎?

狗狗叫是因為開心還是悲傷?

為了回答上面這些問題,我們選擇使用機器學習,更確切地說是深度學習。深度學習擅長解決這些與人類感知有關的問題,并且會隨著時間推移尋找相關的行為模式。因此,深度學習也被廣泛應用于計算機視覺和自然語言處理等領域。

那么接下來的第一步,我們需要收集的所有信號,并中找出我們所感興趣的。我們的動物行為團隊列出了我們想要收集的所有身體姿勢和聲音,以便理解狗狗對訓練的準備情況。

為訓練我們強大的計算機視覺神經網絡,我們選擇使用 TensorFlow 作為深度學習平臺。對于同樣的任務,與使用多個 GPU 相比,使用 Google 的云 TPU 訓練我們的網絡既快又便宜。然后我們可以使用桌面設備在 GPU 上本地運行訓練出的模型,確定狗狗的實時行為并進行訓練。我們的模型通過分析狗狗的肢體語言和聲音,理解狗狗的當前狀態并與之互動。


與動物自主互動

當模型可以實時理解狗狗的行為后,我們開始確定所期待的狗狗回應,以進一步建立互動。我們的設備裝有零食投喂機、燈光和揚聲器,可以通過聲音和視覺信號與狗狗交互,并獎勵狗狗零食。Companion 采用基于獎勵的正強化訓練機制:只要狗狗做出了符合我們期望的動作,設備就會提供獎勵,從而提升此行為的頻率。

這些步驟與訓犬師采取的步驟相同。想象一下,我們正試著教狗狗在聽到“坐下”時坐下。第一步是讓狗狗適應 CompanionPro 設備,設備首先會無條件地給狗狗投喂零食。當狗狗的監護人確定狗狗對設備適應良好時就可以離開房間,讓狗狗與設備自主互動。截至目前,我們與救助站和日托機構的數百只狗狗一起工作,已讓其中 95% 以上不同品種和年齡的狗狗適應了我們的 CompanionPro 設備。


在整個訓練過程中,設備將通過尋找表示狗狗舒適并渴望互動的跡象,始終確保狗狗愿意配合。然后 CompanionPro 會等待狗狗自然坐下,并立即就此行為獎勵狗狗。當狗狗開始更頻繁地坐下時,設備就會發出“坐下”的指令。CompanionPro 使用適應性學習方法,可以延長狗狗坐著的持續時間,從而開始形成“定住”的行為。通過多次訓練,我們可以逐漸將“坐下不動”的持續時間從不到一秒延長到數分鐘。狗狗接受了多種行為訓練,經歷了多次這一過程后,我們就可以開始跟狗狗玩游戲,在一次訓練中發出多個行為口令,從而加深狗狗對口令的理解。例如,我們可以在“坐下”、“趴下”和“召回”這幾個指令間來回切換。

在大型桌面設備 GPU 上運行這一系統,我們已經可以讓狗狗參與 CompanionPro 訓練。犬類測試的監護人都報告說,他們的狗狗對口令的回應更加迅速,在家里訓練時通常也更專注。


SF SPCA 行為診所治療的最常治療的一種癥狀就是分離焦慮 (Separation Anxiety)。患有分離焦慮 的狗狗在獨處時會極度焦慮,在主人離家時還可能大叫、罹患緊張導致的胃腸疾病,或破壞家具。這種疾病很難治療,因為狗狗只有在獨處時(如周圍沒有人安慰他們)才會表現出癥狀。Companion 團隊與 SF SPCA 行為團隊合作,使用 Companion 訓練方法在主人離家時與患有分離焦慮的狗狗互動減少焦慮,并測試這一方法的效果。我們的早期結果表明,自動訓練方法可能緩解分離焦慮,從而提升狗狗的幸福指數和主人的生活質量。

成功完成訓練試驗,并且通過早期跡象表明我們的技術可以幫助減輕分離焦慮后,我們確認,自主訓練有效果并且可以讓狗狗及其主人受益。下一步是將我們的技術應用到可實際用于狗狗產業的產品中。

自主訓犬小型化

我們使用的測試系統需要裝有 TensorFlow 的桌面設備 GPU,這給我們服務的救助站和狗狗產業帶來了多重挑戰。我們的開發設備不僅重,還很貴,而且無法經受狗狗的破壞。為了產品的實用性,我們需要尋找解決方案——系統小型化。


我們在尋找合適的移動平臺,它要有支持我們神經網絡所必須的運算能力,以便實時理解并回應狗狗的行為。評估了幾個移動平臺后,我們選擇了 Google 的 EdgeTPU,我們可以在該平臺上運行 TensorFlow 的移動產品 TensorFlow Lite 。我們發現還可以在 Google EdgeTPU 上使用我們的移動計算機視覺模型,并且運行速度比以前的系統快 4 倍。

小型化后,我們就可以用移動平臺訓練更多狗狗,并且努力繼續完善我們的產品。現在我們宣布,Companion 將開啟 CompanionPro 設備的預訂,并將于 2020 年底交付。我們迫不及待地想要借助 TensorFlow Lite 幫助成千上萬只狗狗找到家,幫他們與主人建立持久的紐帶。


結論

在 Companion,我們開發了一種設備,借助 Google 的 TensorFlowLite(和 EdgeTPU)可以自主訓練狗狗,使其對坐下、趴下、定住、召回等多種行為做出高配合度回應。我們相信,這將以較低的成本訓練所有狗狗,同時豐富狗狗的生活,從而對經濟緊張的救助站與低領養率產生積極影響。Google EdgeTPU 能幫助我們在狗狗與設備互動時理解與學習狗狗的行為。CompanionPro 可以在狗狗做出符合期望行為時以食物獎勵,從而進行更精準的正強化訓練。最終,Companion 幫助我們理解并改善狗狗的生活。


如果您對Google Coral Edge TPU系列硬件產品感興趣,歡迎訪問Google Coral代理商Gravitylink在線商城(https://store.gravitylink.com/global)進行訂購。企業用戶也可通過郵件([email protected] / [email protected])咨詢獲取批量訂購優惠價格。

如果喜歡我們的文章,請即分享到︰

標籤: google  edge tpu  tensorflow  科技  寵物  Gravitylink