漫畫:什麼是機器學習
轉載自 漫畫:什麼是機器學習
故事一:瑞雪兆豐年
我們中國有一句關於農業生產的古老諺語:瑞雪兆豐年。
就是說,如果前一年冬天下雪很大很多,那麼第二年莊稼豐收的可能性比較大。
這條諺語是怎麼來的呢?我們可以想象當時的情景:
第一年冬天
第二年收穫時節
第二年冬天
第三年收穫時節
第三年冬天
第四年收穫時節
年復一年,若干年後的冬天......
這就是瑞雪兆豐年的故事。頭年的瑞雪和來年的豐收,本是兩個看起來並不相關的現象,但是智慧的農民伯伯通過幾十年甚至幾代人的經驗,總結出了兩個現象之間的規律。
現代的農業學家通過科學的分析,弄清了瑞雪兆豐年規律背後的本質原理。但是對於古代農民伯伯來說,知道規律就足夠了,可以通過規律來為下一年的生產生活做出有效的調整。
故事二:啤酒和尿布
上個世紀90年代,沃爾瑪超市已經是美國最大的零售企業,擁有大量的顧客資源。那時候的沃爾瑪已經採用了先進的計算機技術,隨時記錄著每天眾多顧客購物車中所挑選的商品明細。
在其中一個普通的日子裡:
就這樣經年累月,沃爾瑪積累了大量的顧客購物資料。直到某一天,沃爾瑪的技術專家發現:
於是,這一嘗試實行以後......
從此,沃爾瑪的銷售額得到了顯著提升,啤酒尿布的故事也廣為流傳,成為了銷售界和IT界津津樂道的成功典範......
這就是沃爾瑪啤酒和尿布的故事。顧客購買啤酒的行為和顧客購買尿布的行為,原本是兩個看起來沒什麼關聯的現象。但是沃爾瑪的技術專家以大量的使用者購物資料為樣本,通過先進的演算法,最終尋找到了兩者之間的重要關聯和規律。
為什麼購買啤酒的人更有可能同時購買尿布呢?是因為有了小孩的男人比別人更愛喝啤酒?還是因為愛喝啤酒的男人比別人更顧家?這些臆測似乎都有些牽強。
但是沃爾瑪不需要關心規律背後的本質。對企業來講,利用發現的規律,獲得實實在在的利益就足夠了。
以下是小灰根據個人理解說畫的流程圖:
以下是大黃基於小灰的流程圖所做的補充:
以下是大黃對流程圖結果部分作出的調整。其中假設模型可以理解成訓練出來的降雪和收穫的規律,通過假設模型,從新一年降雪情況推斷出下一年收穫情況的過程叫做迴歸。至於啤酒尿布的例子,屬於截然不同的機器學習型別,只需要找出關聯關係,並不需要進行迴歸。
機器學習按照方式不同主要分為三大類,有監督學習(Supervised learning)、無監督學習(Unsupervised learning)以及半監督學習(Semi-supervised learning)。
監督學習:通過已有的一部分輸入資料與輸出資料之間的對應關係,生成一個函式,將輸入對映到合適的輸出。在瑞雪兆豐年的例子中,頭年降雪量就是輸入,來年畝產量就是輸出。
非監督學習:直接對輸入資料集進行建模,尋找關聯。例如啤酒尿布的例子,只需要尋找關聯性,並不需要什麼明確的目標值輸出。
半監督學習:綜合利用有輸入輸出的資料,和只有輸入的資料來進行訓練。可以簡單理解成監督學習和非監督學習的綜合。
這裡所介紹的相關知識,只是作者對於機器學習領域的淺層次理解。通過這篇漫畫,希望沒有從過IT行業,或者不瞭解機器學習的朋友們能夠對機器學習有一些初步的認知。
故事一:瑞雪兆豐年
我們中國有一句關於農業生產的古老諺語:瑞雪兆豐年。
就是說,如果前一年冬天下雪很大很多,那麼第二年莊稼豐收的可能性比較大。
這條諺語是怎麼來的呢?我們可以想象當時的情景:
第一年冬天
第二年收穫時節
第二年冬天
第三年收穫時節
第三年冬天
第四年收穫時節
年復一年,若干年後的冬天......
這就是瑞雪兆豐年的故事。頭年的瑞雪和來年的豐收,本是兩個看起來並不相關的現象,但是智慧的農民伯伯通過幾十年甚至幾代人的經驗,總結出了兩個現象之間的規律。
現代的農業學家通過科學的分析,弄清了瑞雪兆豐年規律背後的本質原理。但是對於古代農民伯伯來說,知道規律就足夠了,可以通過規律來為下一年的生產生活做出有效的調整。
故事二:啤酒和尿布
上個世紀90年代,沃爾瑪超市已經是美國最大的零售企業,擁有大量的顧客資源。那時候的沃爾瑪已經採用了先進的計算機技術,隨時記錄著每天眾多顧客購物車中所挑選的商品明細。
在其中一個普通的日子裡:
就這樣經年累月,沃爾瑪積累了大量的顧客購物資料。直到某一天,沃爾瑪的技術專家發現:
於是,這一嘗試實行以後......
從此,沃爾瑪的銷售額得到了顯著提升,啤酒尿布的故事也廣為流傳,成為了銷售界和IT界津津樂道的成功典範......
這就是沃爾瑪啤酒和尿布的故事。顧客購買啤酒的行為和顧客購買尿布的行為,原本是兩個看起來沒什麼關聯的現象。但是沃爾瑪的技術專家以大量的使用者購物資料為樣本,通過先進的演算法,最終尋找到了兩者之間的重要關聯和規律。
為什麼購買啤酒的人更有可能同時購買尿布呢?是因為有了小孩的男人比別人更愛喝啤酒?還是因為愛喝啤酒的男人比別人更顧家?這些臆測似乎都有些牽強。
但是沃爾瑪不需要關心規律背後的本質。對企業來講,利用發現的規律,獲得實實在在的利益就足夠了。
以下是小灰根據個人理解說畫的流程圖:
以下是大黃基於小灰的流程圖所做的補充:
以下是大黃對流程圖結果部分作出的調整。其中假設模型可以理解成訓練出來的降雪和收穫的規律,通過假設模型,從新一年降雪情況推斷出下一年收穫情況的過程叫做迴歸。至於啤酒尿布的例子,屬於截然不同的機器學習型別,只需要找出關聯關係,並不需要進行迴歸。
機器學習按照方式不同主要分為三大類,有監督學習(Supervised learning)、無監督學習(Unsupervised learning)以及半監督學習(Semi-supervised learning)。
監督學習:通過已有的一部分輸入資料與輸出資料之間的對應關係,生成一個函式,將輸入對映到合適的輸出。在瑞雪兆豐年的例子中,頭年降雪量就是輸入,來年畝產量就是輸出。
非監督學習:直接對輸入資料集進行建模,尋找關聯。例如啤酒尿布的例子,只需要尋找關聯性,並不需要什麼明確的目標值輸出。
半監督學習:綜合利用有輸入輸出的資料,和只有輸入的資料來進行訓練。可以簡單理解成監督學習和非監督學習的綜合。
這裡所介紹的相關知識,只是作者對於機器學習領域的淺層次理解。通過這篇漫畫,希望沒有從過IT行業,或者不瞭解機器學習的朋友們能夠對機器學習有一些初步的認知。
相關文章
- 漫畫版:什麼是機器學習?機器學習
- 漫畫:什麼是氣泡排序?排序
- 漫畫:什麼是計數排序?排序
- 漫畫:什麼是單例模式?單例模式
- 漫畫 | 什麼是區塊鏈?區塊鏈
- 漫畫:什麼是大資料?大資料
- 漫畫:什麼是架構師架構
- 漫畫:什麼是人工智慧人工智慧
- 漫畫版:什麼是深度學習?深度學習
- 漫畫版:什麼是人工智慧?人工智慧
- 漫畫:什麼是LRU演算法?演算法
- 漫畫:什麼是HashMap?(底層原理)HashMap
- 漫畫:容器技術docker是什麼?Docker
- 漫畫:什麼是動態規劃?動態規劃
- 漫畫版:什麼是神經網路?神經網路
- 漫畫演算法:什麼是 B 樹?演算法
- 漫畫 | 程式設計師的悲哀是什麼?程式設計師
- 用漫畫的形式展現——什麼是webWeb
- 漫畫演算法:什麼是跳躍表?演算法
- 漫畫 | 到底是什麼讓IT人如此苦逼???
- 漫畫演算法:輾轉相除法是什麼鬼?演算法
- 什麼是機器學習機器學習
- 什麼是機器學習治理?機器學習
- 機器學習到底是什麼?機器學習
- 漫畫:為什麼不能打斷程式設計師?程式設計師
- 漫畫:什麼是字符集和編碼?ASCII、UTF-8、UTF-16、UTF-32 又是什麼?ASCII
- 區塊鏈到底是個什麼鬼?一幅漫畫讓你秒懂!區塊鏈
- 漫畫:為什麼搞計算機工作的人總是看上去很清閒計算機
- 漫畫:為什麼程式設計師會死不瞑目程式設計師
- 什麼是機器學習MLOps? - kdnuggets機器學習
- 腐漫網,腐女漫畫網,漫畫網站網站
- 江民科普漫畫第二期來啦~帶你瞭解什麼是病毒特徵庫!特徵
- 什麼是AI、機器學習與深度學習?AI機器學習深度學習
- 什麼是 AI、機器學習與深度學習?AI機器學習深度學習
- 機器學習可解釋性系列 - 是什麼&為什麼&怎麼做機器學習
- 什麼是物理畫素、虛擬畫素、邏輯畫素、裝置畫素,什麼又是 PPI, DPI, DPR 和 DIP
- 【程式設計師漫畫】猜猜他是誰?程式設計師
- 手繪漫畫:Google 是如何運作的?Go