Pinterest 憑什麼擁有那麼多用户?它背後的機器學習是答案

編者按:目前,Pinterest 月平均活躍用户量達到 100 萬,這家以圖片為主的公司是如何留住用户並盈利的呢?Pinterest 的主要目標是向用户推薦相關的圖片或內容,推薦的內容足夠精確才能提高用户黏性。近期,《快公司》發文表示,Pinterest 正從機器學習切入,向用户推薦更精準的內容,並拓展新的在線業務。

在 Pinterest 平台上,人們可以搜索、下載全網範圍內的圖片和文章,找到與自己喜好契合的內容自然能夠增加他們的用户忠誠度。Pinterest 推薦的相關內容提高了 30% 的參與度和 25% 的購買度。這些精準推薦都是依託尖端的數據驅動技術和大量實驗的結果。

用户可以通過 Pinterest 台的虛擬釘板收藏全網範圍的在線商品、帖子、圖片,就是説這個平台完全是基於用户興趣偏好建立的。Pinterest 無需像其他社交網絡一樣,根據用户的點擊模式或者特定頁面停留時間來猜測其興趣。這也意味着它的算法能推測到 750 億個收藏的內容數據庫中相互關聯的信息,因為相似的內容更容易被固定在同一個釘板上,從而輕易識別用户偏好。

Pinterest 可以説是一個社交圖,由數十億相互聯繫的用户、被不同用户收藏的同一個項目、收藏類似項目的虛擬釘板三部分構成,這樣的組成結構同時決定了其用户量將會不斷增長。

Pinterest 的高級發現科學工程師 Mohammad Shahangian 説,“我們通過數百次的實驗對我們的算法做出微小修正,確定發現問題的方向“。簡單地根據用户關注人羣決定為其推薦內容的模型是不理想的,假設一個用户正在策劃自己的婚禮,她的虛擬釘板添加了很多禮服款式的圖片,而她的關注者並不一定需要這類服飾,為他們推薦禮服可能造成無意義的重複。而 Pinterest 所有的數據可以讓 Pinterest 的用户獲得 。

Shahangian 表示,“ 如果你的虛擬釘板收藏了一個廚房水槽的鏈接,我們是否需要向你推送一萬多款廚房水槽,或啟發你怎麼能整體設計你的廚房呢?” 為了在這樣的情況下做出正確判斷,該公司的工程師們測試了多種機器學習算法,來研究不同公式如何執行對相似或不同的測試集的收藏,以及他們最終如何影響現實世界的用户的參與度。

然而,事實上,Pinterest 的技術研發缺乏實例測試,研究員無法通過給某個特定的用户付錢來測試他是否會接受一組新的推薦。雖然後面的測試過程無法進行,目前的算法已經基本可以實現通過用户的收藏內容來判定此人是否願意擔任人工測試者。Pintesrest 從自身的一路發展中收穫了不少啟發,個性化一直是提高用户參與度最大的影響因素之一。與此同時,該公司也一直致力於提高視覺搜索功能,幫助用户獲取與目標圖片相似的內容。 今年早些時候,Pinterest 的工程師們與來自伯克利加利福尼亞大學視覺與學習中心的研究人員一起開發了可自動檢測圖像內容的深度學習技術。

Pinterest 的高級視覺搜索工程師 Dmitry Kislyuk 説,當我們試圖去分辯圖片內容是一隻貓還是一條狗時,這並不算一個分類任務,關鍵在於保證實時性的前提下尋找圖像之間的視覺相似性。可視化搜索工具尤其適合收集家居裝飾和時尚類商品的信息。未來,公司希望提高將目標內容映射到其類別的能力,舉例來講,當用户想找同一種食材的新食譜時,就不要只提供這種食材的類似照片。

高級視覺搜索工程師 Andrew Zhai 指出, “我認為我們的模型可以更語義化,有效地將深度學習應用於映射更加概念化的圖像。與此同時,Pinterest 的的工程師們正在專注於完善目標的檢測和搜索開發一款應用程序,讓智能手機用户通過給現實世界中需求物品拍照,上傳到平台後,得到相關的推薦。


資料來源:36Kr

如果喜歡我們的文章,請即分享到︰