Thomas Wolf 談自學人工智慧/機器學習/自然語言背後的數學基礎

Thomas Wolf 是 Hugging Face 創辦人兼首席科學官(Chief Science Officer, CSO)分享他自學現在人工智慧領域背後的機率統計數學基礎的知識來源

我是在下面這則 X 看到在介紹 Thomas Wolf 分享他自學 NLP, AI, ML 的相關資源,覺得提到的內容很不錯,所以整理成一篇文章記錄一下:

基本上 X thread 是整理自他記錄於個人網站的 My self-educational approach is usually to get a few rather exhaustive books and read them for cover to cover. 這個檔案

書籍

  1. 由人工智慧領域的知名教授 Ian Goodfellow, Yoshua BengioAaron Courville 三人合著的 Deep Learning,這本書對當代深度學習領域的技巧與工具給出很不錯的概述。

  2. Stuart RusselPeter Norvig 合著的 Artificial Intelligence: A Modern Approach(簡稱 AIMA),是 AI 專業領域的學院權威教科書已有將近三十年歷史,第一版出版於 1995 年,2009 年的第三版包含了神經網路問世之前,所有用來處理 AI 的工具與方法,2020 年的第四版補充近年神經網路發展相關知識進來。

  3. Kevin Murphy 撰寫的 Probabilistic Machine Learning(PML) 系列,介紹機率方法及貝氏推論工具,該系列分成以下三冊:

  4. 由 David MacKay 撰寫 Information Theory, Inference, and Learning Algorithms 以再淺顯易懂不過的方式介紹機率論及資訊理論。

  5. Judea Pearl 撰寫的 The Book of Why: The New Science of Cause and Effect 清楚解說因果推斷的概念。

  6. Richard S. Sutton 和 Andrew G. Barto 合著的 Reinforcement Learning: An Introduction 是一本能幫助你初步了解「強化學習」概念的好書。

  7. Kyunghyun Cho 整理的 Lecture notes on "Natural Language Processing with Representation Learning" 能幫助你學習「自然語言處理」概念。

  8. 由 Yoav Goldberg 所寫的 Neural Network Methods in Natural Language Processing 也是學習「自然語言處理」概念很不錯的一本書,舊版本是一篇論文,如果不想買書的話看論文就好。

  9. Jacob EisensteinNatural Language Processing 也是一本相當詳盡,值得一讀的教科書。

課程

如果想要更深入研究相關領域,補充以下兩門線上課程也會很有幫助:

  1. 由 MIT 整理,放在 edX 上的 Computational Probability and Inference

  2. 由 Stanford 整理,放在 Coursera 上的 Probabilistic Graphical Models(PGM) Specialization

Thomas Wolf 介紹

他在個人網站自述其學經歷蠻有趣的,從很年輕時就有用 C/C++ 和組合語言寫過軟體和遊戲,但在求學和初入職場時都不是電腦資訊相關,而是物理領域。在巴黎高等師範學院畢業後先去勞倫斯柏克萊國家實驗室做雷射電漿交互作用研究。先被 MIT 錄取攻讀博士,最後選擇在巴黎索邦大學和 ESPCI 取得統計與量子物理博士學位,期間也替法國國防部及 Thales 做超導材料研究。

在取得博士學位後,因物理需要長時間實驗,他做出改變跑道的決定,加入了一間智財專利事務所並取得法學學位,擔任了五年專利師,協助許多新創公司及大企業建立和保護其智財資產。在 2015 年替許多深度學習/人工智慧/機器學習的新創公司提供顧問服務時認知到 AI 革命的數學基礎,其中大部分的方法其實只是將統計物理重新包裝而已,這引起他的興趣於是開始透過閱讀書籍和參加線上課程自學。又過了一年他的朋友就詢問他是否願意一同創辦 Hugging Face。

另外也可以看一下Thomas Wolf 所發表的論文