用電腦預測犯罪，小學生柯南可以退休了？

http://images.ifanr.cn/wp-content/uploads/2016/08/conan.jpg

圖片來源：images.ifanr.cn

引用對不起，電腦説你的數據顯示你有犯罪的可能性，請跟我到警察局走一趟。

電腦居然有比名偵探柯南還神的邏輯推理能力，光數據就可以看出誰是兇手？

的確可以，美國一位教授就教會了電腦預測犯罪的能力。

http://images.ifanr.cn/wp-content/uploads/2016/08/richard-berk.jpg

圖片來源：images.ifanr.cn

（圖：PennCurrent）

賓夕法尼亞大學（University of Pennsylvania）的犯罪統計學（Criminology and Statistics）教授 Richard A.Berk 稱可以用統計學的算法預測犯罪行為。
而 Berk 的這項工作建立在機器學習的基礎上。

http://images.ifanr.cn/wp-content/uploads/2016/08/machine-learning.jpg

圖片來源：images.ifanr.cn

（圖：AItists）

Berk 稱只要把數據輸入電腦——被逮捕的次數、犯罪類型、人口統計信息……，人工智能就能算出犯罪可能性指數。而這個想法在於建立一個不依據無意識偏見、審判者情緒和人類缺點的指標來確定罪犯。

如何預測犯罪，以家庭暴力為起點

Richard A.Berk，Susan Sorenson 和 Geoffrey Barnes 共同撰寫了研究論文，於今年 2 月發表在《實證法律研究雜誌（Journal of Empirical Legal Studies）》上。
論文中以家庭暴力為研究對象，考察了計算機通過算法預測“未來犯罪的風險程度”。

論文中他們將 28000 則發生在城市地區面臨指控的家暴案例輸入計算機，並假設了三種在兩年內被指控家暴後可能發生的結果：因發生肢體傷害的家暴被逮捕；因其它類型傷害的家暴被逮捕；不會因再次家暴被逮捕。

輸入的數據包括：年齡、性別、所在地郵政編碼、初次犯罪的歲數及其被指控的犯罪類型，如謀殺、酒駕、家暴、虐待動物、金融詐騙等。

除此之外，還有個人被捕的次數、擁有的前科次數、在監獄中的表現記錄、同高犯罪率鄰居的接近性和 IQ 指數。

並參考 1984 年的保釋修正案（1984 Bail Reform Act）。

http://images.ifanr.cn/wp-content/uploads/2016/08/richard-berk-paper-tablet.jpg

圖片來源：images.ifanr.cn

（圖表：《Forecasting Domestic Violence: A Machine Learning Approach to Help Inform Arraignment Decisions》）

研究以案件為觀察對象，而不是個人，所以某個人有可能在研究案例中出現多次。

相對以往將種族和社會經濟差距作為犯罪評判的標準，Berk 認為無關種族問題，並將種族因素排除在算法之外。

人工智能運用算法來預測犯罪的準確性則取決於數據前後關聯的緊密程度。

預測犯罪，他已經花了幾十年

據彭博科技報道，Berk 這項成果被運用在監獄內來確定哪個犯人處在限制的條件內；假釋委員會應該在什麼程度下監視出獄人員；還有警察確定家暴犯人是否有再次犯罪的可能性。

實際上，Berk 這項研究從 1960 年開始，至今已經進行了數十年， 90 年代中期，他開始專注於機器學習，Berk 將數據輸入電腦中進行處理計算。2013 年他在 Chicago Ideas Week 節目上就表示了犯罪和天氣一樣可以被預測。

http://images.ifanr.cn/wp-content/uploads/2016/08/richard-berk-chicago.jpg

圖片來源：images.ifanr.cn

（圖：YouTube）

此前，Berk 也為馬里蘭和賓夕法尼亞的州假釋制度設計了相似系統。

依賴 AI 抓出潛在犯罪分子？還不是時候

在 Berk 實驗中，算法可以非常準確地算出有低犯罪性的個人。但是對於準確預測有高犯罪性的個人還遠不能達標：

預測一個人是否會從事不當行為，準確性為 9%；
預測假釋或處於社會監控下的罪犯，是否會再犯殺人罪，準確性為 7%；
預測在保釋期間的家暴者，是否會在開庭日前再次作案，準確性為 31%。

所以可以看出，將 Berk 的實驗應用在實踐中的方式是：將實驗結果中低犯罪性的人分流出來，以節省多餘的監控資源，再將資源集中運用在潛在高犯罪性的人身上。

http://images.ifanr.cn/wp-content/uploads/2016/08/caution.jpg

圖片來源：images.ifanr.cn

（圖：123RF）

但是如何用數據來準確指出誰是潛在的犯罪分子存在兩個明顯的問題：

Berk 的實驗中本身存在缺陷；
人類是具有自由意志的，自身能夠判斷犯罪是不是應該做的事情。只要沒有真正地做出壞事，在刑事司法系統中他們就不構成犯罪，不能算犯罪分子。

另外，Berk 希望根據兒童及其父母的檔案數據來判斷兒童是否會在 18 歲成年前犯罪。但這就存在着一個很大的問題，每個人成長影響因素非常多，而新生嬰兒還未做過任何事情，不可能只通過其出身環境和父母經歷來判斷其犯罪的可能性。

同時個人的檔案數據分散在國家的各個機構，收集起來也非常麻煩。

以此來看，人工智能要真正準確地預測出犯罪分子還有一段相當長的路要走，即便在未來發展成熟，也未免就不會出現其它問題。

http://ifanr-cdn.b0.upaiyun.com/wp-content/uploads/2016/08/detective-conan.gif

圖片來源：b0.upaiyun.com

目前狀況來看，還是需要萬年小學生柯南幫我們指出：

引用兇手只有一個！

題圖：Google

資料來源：愛範兒（ifanr）

用電腦預測犯罪，小學生柯南可以退休了？

如果喜歡我們的文章，請即分享到︰