【機器學習】機器學習的學習經(jīng)驗總結(jié)!
本文分享了機器學習概念,學習路線和知識體系,希望幫助大家更好地入門機器學習。
Part 1 機器學習相關(guān)概念

現(xiàn)如今,關(guān)于人工智能(AI)領(lǐng)域出現(xiàn)了很多眼花繚亂的名詞,包括機器學習,統(tǒng)計學習,數(shù)據(jù)科學,數(shù)據(jù)分析,數(shù)據(jù)挖掘,深度學習等。這些名詞都是什么意思?有什么作用?這里區(qū)分介紹下。
如果大家沒有接觸過人工智能的話,大家可能最熟悉的就是統(tǒng)計學了,在大學期間就學習的概率論就是統(tǒng)計學的相關(guān)知識,所以首先我們介紹一下統(tǒng)計學和統(tǒng)計學習。統(tǒng)計學和統(tǒng)計學習并非承接或者包含關(guān)系,兩者可以看作兩個不同的學科,不過統(tǒng)計學習中運用到了很多統(tǒng)計學的相關(guān)基礎(chǔ)數(shù)學知識。
后臺回復關(guān)鍵詞'210531'可下載完整PPT


在介紹完這兩個區(qū)別后,我們進一步來看一下機器學習,什么是機器學習,能不能用一句話來概括?

我們用一個脫離具體算法的視角來看:機器學習就是一套計算機機器利用數(shù)據(jù)來學習規(guī)則/映射關(guān)系的固定算法/方法。每一種機器用來從數(shù)據(jù)學習規(guī)則的方法,我們都可以視為一種機器學習算法,而機器學習最初的發(fā)展是由統(tǒng)計學習方法支撐的,所以很多時候機器學習(除開深度學習之外)和統(tǒng)計學習基本是等同的。
而數(shù)據(jù)科學,數(shù)據(jù)分析的概念可以大概解釋如下:

對于統(tǒng)計學習和機器學習,深度學習的一些區(qū)別和性質(zhì),我們可以大體介紹如下:

Part 2 機器學習的整體學習流程
在對于機器學習的名詞基本概念有了理解后,我們來介紹一下機器學習的整體學習流程,我們可以把機器學習分為三個板塊,數(shù)學基礎(chǔ),機器學習算法和編程實踐。
但大家需要注意的是,三個版本并非承接關(guān)系,也就是說并非學完了數(shù)學才能學算法,學了算法才能編程實踐——這也是極其不推薦的路徑,除非本身是數(shù)學系的同學或者今后期望進行相關(guān)方面理論研究的同學,否則這條路徑是很不友好的。
舉個例子,我們其實可以先了解相關(guān)算法的概念和應用的方面然后直接學編程實踐,在實踐過程中學習理論,不清楚的理論知識再補充相應的數(shù)學基礎(chǔ),或者先學習相關(guān)機器學習算法理論,然后過程中進行實踐和相關(guān)數(shù)學基礎(chǔ)補充。
所以,可以把三者視為相互關(guān)聯(lián)的,數(shù)學基礎(chǔ)有助于我們更好的理解機器學習算法,而對于機器學習算法的理解能指導我們更好第進行編程實踐。

數(shù)學基礎(chǔ)部分

在學習算法理論的同時再進一步補充相關(guān)知識,例如決策樹,優(yōu)化方法等就涉及到的信息論中的信息熵,最優(yōu)化中的梯度下降法,SVM涉及到對偶問題,KKT條件等。
一般機器學習算法理論的數(shù)學基礎(chǔ)學習到基礎(chǔ)數(shù)學衍生這一層就可以了,而如果大家有興趣涉獵機器學習理論的研究,例如可學性,復雜度,泛化性,穩(wěn)定性等的研究或者變分方法,隨機分析方法等相關(guān)研究,那大家就需要學習進階的相關(guān)知識了。
機器學習算法部分

對于機器學習算法部分,我們可以把整體的機器學習算法分為傳統(tǒng)機器學習部分和深度學習部分,兩個部分可以獨立的學習,而傳統(tǒng)機器學習部分,我們又可以分為多個模型,每個部分也可以單獨學習,例如可以學習完最小二乘方法后學習邏輯回歸。每個部分都是相對較為獨立的。
對于深度學習領(lǐng)域,一般是先學習機器學習的基礎(chǔ)網(wǎng)絡ANN, CNN, RNN,然后結(jié)合一個具體的領(lǐng)域深入研究的。
編程實踐部分

對于編程實踐部分,對于機器學習的實踐來說,個人認為現(xiàn)在Python是最容易上手和對于機器學習的相關(guān)學習支持最好的編程語言,大家可以先從python的基礎(chǔ)語法入門,了解一些Numpy,Pandas的常規(guī)函數(shù),然后學習scikit-learn機器學習算法框架,而對于深度學習部分可以從keras入門,然后在后續(xù)的學習中轉(zhuǎn)移到另外的框架。
在學習過程中也建議大家邊學習邊實踐,然后專心學1-2個系統(tǒng)的資料和書籍就好,一點一點學習,不斷補充自己的知識體系。

Part 3 機器學習的知識體系
大家對于機器學習有一定的學習后就要形成自己的相關(guān)學習體系,同之前的我也把整體的學習體系分為了三部分,機器學習理論,機器學習算法和機器學習實踐,對于各個部分,我也列出了推薦和Datawhale團隊在相應部分做的項目實踐(文字版課程鏈接見下方),希望能有助于大家的學習。

鑰匙書(機器學習理論導引補充):https://github.com/datawhalechina/key-book
南瓜書(周志華西瓜書詳細解讀補充):https://github.com/datawhalechina/pumpkin-book
Easy-RL(深度強化學習教程):https://github.com/datawhalechina/easy-rl
LeeML-Notes(李宏毅老師-機器學習課程筆記):https://github.com/datawhalechina/leeml-notes
往期精彩回顧
本站qq群851320808,加入微信群請掃碼:
