機器學習漫遊指南 最完整的入門書單(外文版)


編者注:澳大利亞機器學習專家、暢銷書作者 Jason Brownlee,對機器學習領域的各類優質書籍進行了盤點,彙總成這份閲讀指南。在雷鋒網(公眾號:雷鋒網)所篩選的學習資源中,這堪稱是迄今為止最全面、最完整、權威性比較高的一份 ML 書單,涵蓋了最值得學習者、從業者、開發者認真研讀的精品書目。這份指南適合多樣背景的讀者:從想要了解機器學習的普通人,到入門新手,再到高階開發者和學術研究人員。因此,雷鋒網對其進行編譯整理,特來與大家分享。

友情提醒:該指南只考慮了英文市場的機器學習圖書,適合大家作為國際 ML 讀物的參考。而例如周志華老師 《機器學習》等國內優秀著作並沒有體現,請讀者見諒。

Jason Brownlee:

我喜歡書,對於搞到的每一本機器學習書籍,我都要去讀。

我認為,有好的參考資源,是對你心中機器學習謎題進行“解惑”的最快方式。閲讀多本書,你就有了看待疑難問題的多種角度。

這份指南中,你會發現機器學習領域最值得一讀的好書。

有許多原因促使人們想要機器學習書籍。因此,我採用了三種不同方式對機器學習書籍進行分類、排列,使讀者們能按圖索驥快速查找。比方説:

  • 依據類別(難易):教材,科普等。
  • 依據話題:Python,深度學習
  • 依據出版商:Packt,O’Reilly 等

所有書都包括了亞馬遜或京東鏈接,你可以點擊鏈接了解更多。

如何使用這份指南?

  1. 找到一個你最感興趣的話題
  2. 瀏覽所選類別的書目
  3. 購書、借書、下載
  4. 從頭讀到尾
  5. 重複以上過程

把書擺在家裏、辦公室顯眼的地方,跟你讀過那本書是兩碼事。別瞎搞收藏。

1.0 依據難易水平



1.1 機器學習科普讀物

這是面向普通大眾的機器學習書目。它們讓你體會到機器學習和數據科學的優點和益處,但免去了理論和應用細節。我還加入了一些個人非常喜歡的、偏“統計思維”的流行科普讀物。


該類別的首選是: The Signal and the Noise


與上述讀物的樂觀相比,提供了反面觀點的是:Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy.

1.2 初學者書籍



真正面向零基礎初學者的機器學習書籍,基本上是一片市場空白。下面的這些書,既包含了科普讀物(見 1.1)中使用機器學習的益處,也部分包含了多見於入門書籍(見 1.3)的應用細節。


該類別的首選是:Data Mining: Practical Machine Learning Tools and Techniques (數據挖掘:實用機器學習工具與技術)


1.3 機器學習入門書籍


下面是菜鳥入門的首選書單。相當於本科生級別的機器學習資源,適合基礎學習者以及開發者新手。它們覆蓋了廣泛的機器學習話題,傾向於“怎麼做”,而非“為什麼”或是探討理論


該類別的首選是:An Introduction to Statistical Learning: with Applications in R (統計學習導論:基於R應用)


1.4 (國外)機器學習教科書

下面是世界一流機器學習教材的列表。這些是研究生課程中會使用到的教科書,覆蓋了一系列方法和背後的理論。


該類別的首選是: The Elements of Statistical Learning: Data Mining, Inference, and Prediction (統計學習基礎:數據挖掘、推理與預測)


2.0 依據話題



2.1 與 R 語言相關

R 語言平台的應用機器學習書目。


該類別的首選是:Applied Predictive Modeling(應用預測建模)

2.2 與 Python 相關



使用 Python 或 SciPy 語言平台的應用機器學習書目。


該類別的首選是: Python Machine Learning (Python 語言構建機器學習系統)


2.3 深度學習

深度學習書目。現在沒幾本深度學習的好書,所以我只得用數量彌補質量。其中有許多專門針對 Tesnorflow 的教程。雷鋒網注:該類推薦書目“全軍覆沒”——沒有一本書有中文譯本。這或許是因為深度學習領域理論框架尚不完善,缺乏影響力巨大的著作。


該類別毫無疑問的首選是:Deep Learning.


另外,Michael Nielsen 的免費電子書 Neural Networks and Deep Learning 簡單易懂,深受許多入門學習者的喜愛,雷鋒網將其添加在這裏,以作補充。

2.4 時間序列預測

時間序列預測領域最值得一讀的書目。在該技術的應用方面,目前 R 語言是霸主。


該類別的入門首選是:Forecasting: principles and practice.


該類別的首選教材是:Time Series Analysis: Forecasting and Control.


3.0 依據出版商

有三個出版商在機器學習領域下了大力氣,並且在認真出版圖書。

它們是: O'Reilly, Manning 和 Packt。它們的焦點是應用書籍。該榜單上的書籍質量參差不齊:從嚴謹設計、編排的圖書到裝訂在一起的博文。

3.1 O'Reilly 機器學習書籍

在它們的“數據”類別,O'Reilly 有超過 100 本圖書,許多與機器學習相關。以下是最暢銷的幾本:


這些書中,Programming Collective Intelligence: Building Smart Web 2.0 Applications (集體智慧編程) 或許是開創了 O'Reilly 該目錄的書,一直很受歡迎。


3.2 Manning 機器學習書籍

Manning 的書偏實用,並且質量還行,雖然數量沒 O’Reilly 和 Packt 那麼多。


Manning 目錄裏較突出的一本是 Machine Learning in Action(機器學習實戰),這也許同樣是因為,它是該出版社在機器學習和數據科學領域的第一本出版物。


3.3 Packt 機器學習書籍

感覺上 Packt 全面擁抱了數據科學和機器學習領域的圖書出版。他們有一大堆針對晦澀難懂機器學習庫的書。在流行話題上面,比如 R 和 Python,也有不少書籍出版。雷鋒網注:可惜的是,Packt 似乎不重視漢語市場,旗下主要機器學習圖書並沒有中文譯本。

以下是一些較流行的書目:


相關文章:
開發者入門必讀:最值得看的十大機器學習公開課

2016十大 AI 演講盤點,大牛們都發表了什麼真知灼見?

雷鋒網版權文章,未經授權禁止轉載。詳情見轉載須知



資料來源:雷鋒網
作者/編輯:三川

如果喜歡我們的文章,請即分享到︰