機器學習學習中,數學最重要!

dicksonjyl560101發表於2018-10-24

機器學習學習中,數學最重要!

 

01. 機器學習工程師的邊界是什麼?

 

大多數的事物都是有邊界的。那機器學習的邊界又是什麼呢?

對,就是數學。掌握了數學這個機器學習的底層基礎,不僅可以加深對演算法的理解,還能在模型最佳化階段更加遊刃有餘。

 

 

02. 如何打破邊界?

希望以下的內容能給你參考思路。

 

     機器學習中的數學基礎

方法建議:將實際意義與興趣賦予看似枯燥的學習之後,儘量死磕最少必要知識。

 

 

上圖是個使用邏輯迴歸判斷一個男生是否是一位合適的女婿的例子。

 

其中,Y=w1*身高+w2*品德+w3*財富+w4*顏值+w5*就可以表達為多項式Y=w1*x1+w2*x2+w3*x3+w4*x4+w5*5,透過Sigmoid函式後,轉化為該男生可能成為優秀女婿的機率問題。

 

這裡會涉及 sigmoid函式、求導演算法、梯度下降、正則項控制過擬合 等數學知識。遇到問題解決問題,死磕關鍵點,才不會鑽入牛角尖,陷入數學知識的汪洋大海中孤立無援。

 

•   機器學習中的線性代數

方法建議:儘量將線性代數與現實意義結合起來

 

對於線性代數,理解它與機器學習的關鍵在於:理解線性代數與現實世界的巧妙的耦合。

 

 

上圖中的x,y可以分別代表觀察事物的2個維度。x,y各自有大量的線性組合,意味著事物的2個維度有大量不同的看法,將這些看法用機器來進行計算、歸納、演繹,並組合大量個別的看法,抽離出符合大多數的平衡點,從而得出普遍適用的結論。這不就是一件奇妙的巧妙而耦合的事件嘛~

 

•   機器學習中的機率統計

方法建議:儘量將看似無味的機率統計知識與感興趣的話題結合起來理解

 

隱馬爾科夫(HMM)演算法是機器學習中的一個機率圖模型,也是很多演算法崗位面試中的考察難點。來自知乎的王蒟蒻,就用一個遊戲的場景清楚的解釋了隱馬爾科夫(HMM)演算法的原理。

( 連結)

 

我是一戰士,修煉出了三種戰鬥形態,分別為暴怒態,正常狀態和防禦態。同時我也會三個被動技能,分別是普通平A,爆擊(攻擊傷害翻倍),吸血(生命汲取)。


我在暴怒狀態下打出暴擊的機率是80%,打出吸血機率為5%;
在平衡形態下,打出暴擊的比率為30%,打出吸血的機率是20%;
在防禦形態下,暴擊成功機率為5%,吸血機率為60%。


總結一下,戰士在不同狀態下能打出技能的機率不一樣。

 

本來,戰士這個職業在暴怒態時,身邊會有一圈紅光環;防禦態時,會有一圈藍光環。但是,現在我正在玩遊戲,遊戲突然出了個bug:有個傻x程式設計師改了遊戲的程式碼,他給寫崩了,從此戰士身邊光環都看不見了。那我沒法透過看腳下的光環知道戰士在爆什麼狀態了。

 

話說,現在問題來了:由於看不到腳下光環,我只能估計“戰士”在爆什麼狀態;但我現在打一boss,砍10次,發現8次都是暴擊,血嘩嘩地翻倍在掉,你覺得我這戰士最可能是爆了什麼狀態?

 

所以,透過自己感興趣的話題來理解深奧的機率問題,就輕鬆很多了。

 

 

03. 打破邊界的誤區

 

也許你早已意識到高等數學、線性代數、機率統計對做機器學習的重要性,也在積極補課中,於是一頭扎進大學的教材中。但埋頭死磕了好多次,每次都半途而費,學了很多,學到的很少。

 

因為教材始終更偏向理論。優點是每一步都可靠,邏輯嚴謹;但缺點就是很難理解。

 

古語有云:“獨學而無友則孤陋而寡聞”,多人學習,協作學習能較快認識到打破機器學習邊界的誤區,儘可能的使用合適的學習方法。

 

 

 

https://mp.weixin.qq.com/s/VnTeccReWUiuFA1Z5H6L6A

 

 

 

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29829936/viewspace-2217306/,如需轉載,請註明出處,否則將追究法律責任。

相關文章