推薦美圖的 Pinterest,如何靠機器學習吸睛?
Freestocks / flickr
月活躍用户達 1 億的 Pinterest 越來越依賴機器學習,以幫助發現新的互聯網洞見。
世界各地的用户訪問 Pinterest 是為了探索、保存和分享照片及文章。幫助用户找到自己喜歡的內容,用户自然會被留住:Pinterest 上 30% 的互動和 25% 的 Pinterest 內購來自於 Pinterest 推薦的相關內容。為了推薦合適的內容,Pinterest 使用了由數據驅動的頂尖技術,還進行了大量試驗。
那麼,Pinterest 是如何利用機器學習實現的呢?
Pinterest 首席發現科學工程師(lead discovery science engineer) Mohammad Shahangian 表示:“我的主要工作是找到解決內容發現問題的方向。我們會對算法做非常小的改變進行試驗,每一次嘗試都有其改進或不好的地方。”
獨家優勢:基於興趣
thestreet
實際上,這和 Pinterset 的特點不無關係:它的優勢之一在於,Pinterset 是圍繞用户的興趣而建立的社區,用户會將自己從互聯網上找到的產品、文章和圖片按興趣分類。這意味着 Pinterest 不用像其他社交網站一樣,通過點擊模式或在某個頁面上花費的時間來猜測用户的興趣,而是可以直接用算法來衡量其數據庫中 750 億個條目之間的關係,因為這些條目很可能被歸在同一個興趣之下。
Mohammad Shahangian 説道:“許多公司試圖通過輸入或信號來推導用户興趣。但在 Pinterest,用户明確地給出了自己對什麼感興趣的信號。”
訪問 Pinterest 的用户們在不斷為這個由用户、蒐集到的條目以及收藏板所組成的社交圖景添磚加瓦。這些數據又可以讓 Pinterest 更精確地為用户主頁消息流、搜索結果以及相關內容推薦提供內容。單純根據用户關注的內容向用户推薦並不理想,而推薦相似內容又很容易重複。
在 Mohammad Shahangian 看來,“如果你收集了一個廚房水槽的條目,我們應該給你推薦更多水槽呢,還是推薦可以讓你的廚房煥然一新的條目?”
在實踐中不斷測試
為了作出這些決策,Pinterest 的工程師們試驗了多種機器學習算法。他們研究了這些算法在相關和不相關條目上的效果,以及它們如何影響真實用户的活躍度。
Mohammad Shahangian 説道:“我們確實會直接在 Pinterest 上做試驗,但很多時候我們都會先做很多準備工作再試驗。”
當然,如果不進行實際測試,就根本沒辦法知道某個用户是否會喜歡新的推薦內容。“我沒法花錢請人告訴我,某個用户是否會喜歡新的推薦內容,”Mohammad Shahangian 表示。但通過研究算法推薦的內容是否會被真實用户歸為某個興趣下,這就能得到相對靠譜的答案了。
此前,Pinterest 將用户主頁的消息流從純粹的按時間排列關注用户的消息,改成了由算法生成的消息流,這一舉措讓用户的活躍度提高了五分之一到十分之一,後續算法改進還會帶來額外提升。
Shahangian 表示:“在整個改進過程中,Pinterest 得到了長足發展。個性化極大地提高了用户活躍度。”
改進圖像搜索功能
Pinterest 還一直在改進圖像搜索,以幫助用户更好地找到相似圖片。Pinterest 的工程師們與加州大學伯克利分校視覺與研究中心的研究人員們合作開發了這一技術。現在它已經能通過深度學習算法來自動識別圖片中的物體了。這樣,用户就可以點擊這些物體來找到 Pinterest 中的相關條目。
Pinterest 視覺搜索工程師 Dmitry Kislyuk 説道:“這不是區分貓狗的分類算法。我們是想實時找到圖片間的相似性。”
他表示,這一視覺搜索工具在發現 Pinterest 中的家庭裝飾品和時尚用品上效果很好。未來 Pinterest 希望能改進其自動分類功能,以更好地滿足其他搜索需求,比如幫助用户找到相似的新食譜。
在談到用深度學習來更有效地進行圖片分類時,Pinterest 視覺搜索工程師 Andrew Zhai 説道:“我覺得我們的模型會變得更語義化,也會變得更好。”
Pinterest 的工程師們在專注於完善物體識別和搜索的同時,還打算開發一款應用,讓智能手機用户可以拍攝現實世界的物體,然後獲得 Pinterest 上的相關條目推薦。
Dmitry Kislyuk 表示道:“現如今的深度學習、計算機視覺領域令人激動人心。世界變化太快,頂尖技術每兩個月就會變一次。”
via fastcompany
推薦閲讀:
Pinterest 完成G輪融資,總額5.53億美元未達預期
造就了蘋果Mac經典模樣的設計師,將加盟Pinterest負責產品設計
資料來源:雷鋒網
作者/編輯:管策