一個數學系高材生的約會大作戰


原文來自Wired,作者Kevin Poulsen為Wired的調查編輯,他同時還是《Kingpin : How One Hacker Took Over the Billion-Dollar Cyber​​crime Underground》一書的作者。

2012年六月的某天,凌晨三點,在洛杉磯UCLA數學系的某個角落裡,窩著一個年輕人,他正盯著計算機,為他的博士畢業論文而苦苦掙扎。但他心心念念的卻是他的OkCupid(美國知名婚介交友網站)收件箱裡,是否有新的消息。

他叫Chris McKinlay,35歲,單身九個月了。像其他4000萬美國人一樣,他正試圖通過OkCupid這樣的網站,來尋找下一個約會對象。可結果並不如人意。

在OkCupid裡頭,每個註冊用戶需要回答350道左右的問題,這些問題是隨機選取的,包含了政治、宗教、家庭觀、愛情觀、性、喜歡的書籍電影甚至智能手機等等。系統會根據問題的答案自動計算用戶間的匹配程度,匹配度高的,系統會優先推薦給你。

在這樣的算法下,McKinlay發現自己吃了大虧。他被分配到的那些問題明顯比較冷門,所以拿來跟他配對的女性的數量也少的可憐。只有不到100個勉強達到90%的match。而要知道,全洛杉磯,至少有8萬個女性在用OkCupid。他可是華麗​​麗的被無視了呢。

面對著滿屏的代碼與空空如也的約會日程表,他決定了,既然他是個數學家,那麼就要拿出專業一點的辦法來搞定約會這個難題。 McKinlay想到他可以通過抽樣與統計,知道那些他喜歡的女人們都會在意哪些問題。然後他可以根據這些問題,建立一個新的檔案,那些偏門的問題就不回答也罷。這樣就可以保證,全洛杉磯適合他的女人,都能到他的碗裡來了。

故事說到這裡,或者你會以為這個傢伙就是個死數學宅,那麼你錯了。 2001年,Chris McKinlay從Middlebury College(​​明德學院,美國頂級文理學院之一)中文系畢業。隨後,他在紐約世貿中心的91樓找到了一份翻譯工作(沒錯,就是倒掉了的那座)。在眾所周知的那一天,他沒有當班,在家睡覺而躲過了一劫。劫後餘生的他,決定重新規劃自己的人生。他應邀加入了大名鼎鼎的MIT-21點記牌團隊的一個分部,開始了他的職業賭徒生涯,不停的穿梭在紐約與拉斯維加斯各大賭場之間(注:MIT有個以學生為主的商業化計牌團伙,從80年代開始,專門出入各個賭場,賺得盆滿缽滿,事蹟被寫成了書,拍成了電影)。那幾年,他有高達6萬美金的年收入。而在這些算牌的日子裡,他發現自己已經深深的為數學這門藝術而傾倒。於是2006年,McKinlay毅然轉投UCLA,成為一個數學系的博士生。
現在,他的滿腔熱情被這個叫做OkCupid的網站給再次喚醒了。

Round 1:愛情就是數據分析?

為了獲取資料,McKinlay申請了12個OkCupid賬戶,胡亂填寫了資料,而後編了一個基於Python的腳本。利用這12個賬戶,該腳本自動搜索25至45歲之間的異性戀和雙性戀女性,訪問她們的主頁,蒐集她們的種種信息包括:種族,身高,是否吸煙,星座等等。可在收集了一千個左右的樣本之後,問題來了,OkCupid的防禦系統起作用了,McKinlay的程序因為快速的讀取被檢測出來而後被屏蔽掉了。

他必須再想個辦法,好讓他的系統像人一樣的干活。於是他想到了Sam Torrisi,他的一個神經學家朋友。最近這些日子,Sam教他音樂,他教Sam高數,兩人樂此不疲。 Sam也活躍在OkCupid上,他答應了讓McKinlay在他的電腦上安裝一個軟件,監視自己使用該網站的情況。於是McKinlay就有了一手的數據,讓他的程序可以模擬Sam的點擊率和打字速度來欺騙OkCupid。

僅僅三週,他收集到了600多個問題的答案,數據來自全美的數万個女性。現在,他已經顧不上自己的畢業論文了,全身心投入到了這些數據的分析中去。他甚至不回家,直接在書桌邊丟了塊床墊,就睡在實驗室裡了。

通過比較,McKinlay選擇了貝爾實驗室的K-Modes算法來給這些女人分類。於是乎,2萬個來自洛杉磯的待選女性被自動分成了七組。現在,他只要在七個群組裡頭挑出最適合他的那些個。綜合考慮了下,去掉太老太小太迷信的,兩隊人馬脫穎而出。一是二十出頭,特立獨行,愛音樂愛藝術的年輕姑娘們,他把她們叫做A組。二是年齡稍長,主要從事設計類工作的事業女性,他把她們叫做B組。他確信,這裡頭一定有最適合他的那一個。


Round 2:姑娘,我們很相配!

同樣在計算機的幫助下McKinlay了解了這兩撥姑娘的喜好,對此精挑細選了500個最讓她們關心的問題,如實填寫了自己的答案(他可不想用電腦替他撒謊,畢竟這關係到他的真實人生)。就這樣,他創建了兩份最終檔案,針對性的附上不同的照片:給A組年輕姑娘們看的是他正在攀岩的照片,而給B組秀的是他演奏吉他的樣子。

當這一切都完成的時候,他運行了OkCupid的配對搜索,結果很驚人:99% match的女人就有好多頁,滾也滾不完,一直拉到了第一萬個,都還有90%的匹配度。

有了匹配度,還得讓那些姑娘們注意到自己。他又寫了個程序,自動在對方的主頁上踩下痕跡。這樣姑娘們登陸OkCupid之後就會發現,有個超速配的帥哥關注過自己。之後,他的收件箱自然就被塞滿了。每天不停的有美女主動來跟他問候,閒聊,要求見面。

Round 3:約會見真章

完成了計算機上的工作,更考驗人的事來了。就在6月30日,McKinlay達成了他的首次約會。對象Sheila是個年輕的網頁設計師,來自A組,他們在咖啡館共進午餐,結果卻叫人沮喪,這簡直成了一次學術交流會。第二次約會是和一個網站編輯,來自B組。在他的構想中兩人會在公園湖畔浪漫的散步,可現實完全走樣。第三次約會的Alison是個學編劇的在校生,有紋身,很酷,他們約在了酒吧,結果他大醉了一場,怎麼回的家也不知道。

接下來的不說也罷。一次次的約會,一次次的失望。 McKinlay覺得自己必須調整戰略方向,他注意到A組的女人,常常會有很多紋身,並且多居住在洛杉磯東面。他毅然決定放棄掉她們,集中火力攻占B組。現在他已駕輕就熟,有一套自己的約會守則:約會都定在下午而不要一起吃飯;一天可以約會兩個對象;不去看電影或者聽音樂會……

就這樣,到夏季結束時,他約會了近百次,每一次約會他都詳細的記錄在一個筆記本上頭。這裡頭只有三個姑娘給了他第二次機會,而僅有一個約會了三次,然後統統沒有下文。


Final:謝謝愛神光顧

McKinlay大受打擊,他開始懷疑自己的人品以及程序。可就在這時,愛神丘比特終於眷顧到他了。一個叫Christine Tien Wang的28歲姑娘,主動在網站上跟他say hi。她也在UCLA,一個美術專業的碩士生。

他們在學校的花園碰了頭,又一起在壽司店吃了飯。他們談論了書籍,藝術和音樂,互相留下了深刻的印象。 McKinlay告訴她自己是如何利用OkCupid獲得約會機會的事,而姑娘也坦白說,在短消息他之前,她也稍微改了下自己的檔案。

Tien Wang是McKinlay的第88次約會,馬上,她又成了第89次,然後是一次又一次,兩週後,兩人都暫停了OkCupid的賬戶。

一年後,McKinlay已經拿到了他的博士學位,在大學裡做授課講師,可他同時也在進修音樂。而Tien Wang,拿到了一個為期一年的獎學金,在卡塔爾學習藝術。他們每天用Skype聯繫。直到有一天,McKinlay在視頻聊天時,拿出一隻鑽石戒指,然後,她點頭了,說好的。接下來,他可能需要再編個程序,讓計算機幫他們挑個黃道吉日來舉行婚禮了。

前些日子,McKinlay出了本關於OkCupid的書:Optimal Cupid: Mastering the Hidden Logic of OkCupid。有興趣的朋友不妨找來讀讀,看看能不能在我們自己的世紀佳緣或者百合網之類的,搗鼓點什麼出來。

[本文編譯自:wired.com]


資料來源:36Kr

如果喜歡我們的文章,請即分享到︰