這段機器學習基礎視訊將幫助您瞭解什麼是機器學習,機器學習有哪些型別-有監督,無監督和強化學習,如何通過簡單的示例學習機器學習以及如何在各個行業中使用機器學習。
什麼是機器學習?
我們知道人類從過去的經驗中學習,機器遵循人類的指示
如果人類能夠訓練機器從過去的資料中學習呢?嗯,這被稱為機器學習,但它不僅僅是學習,它還涉及理解和推理,所以今天我們將學習機器學習的基礎知識。 插一段《Python3入門機器學習經典演算法與應用》這門課程中的解釋:人類是怎麼學習的?通過給大腦輸入一定的資料,經過學習總結得到知識和經驗,有當類似的任務時可以根據已有的經驗做出決定或行動。
機器學習(Machine Learning)的過程與人類學習的過程是很相似的。機器學習演算法本質上就是獲得一個 f(x) 函式表示的模型,如果輸入一個樣本 x 給 f(x) 得到的結果是一個類別,解決的就是一個分類問題,如果得到的是一個具體的數值那麼解決的就是迴歸問題。 機器學習與人類學習的整體機制是一致的,有一點區別是人類的大腦只需要非常少的一些資料就可以歸納總結出適用性非常強的知識或者經驗,例如我們只要見過幾只貓或幾隻狗就能正確的分辨出貓和狗,但對於機器來說我們需要大量的學習資料,但機器能做到的是智慧化不需要人類參與。簡單的示例
保羅聽新歌,他根據歌曲的節奏、強度和聲音的性別來決定喜歡還是不喜歡。
為了簡單起見,我們只使用速度和強度。所以在這裡,速度是在 x 軸上,從緩慢到快速,而強度是在 y 軸上,從輕到重。我們看到保羅喜歡快節奏和高亢的歌曲,而他不喜歡慢節奏和輕柔的歌曲。 現在我們知道了保羅的選擇,讓我們看看保羅聽一首新歌,讓我們給它命名這首歌 A,歌曲 A 速度快,強度飆升,所以它就在這裡的某個地方。看看資料,你能猜出球在哪裡會喜歡這首歌?對,保羅喜歡這首歌。
通過回顧保羅過去的選擇,我們能夠很容易地對未知的歌曲進行分類。假設現在保羅聽了一首新歌,讓我們把它貼上 B 的標籤,B 這首歌就在這裡的某個地方,節奏中等,強度中等,既不放鬆也不快速, 既不輕緩也不飛揚。
現在你能猜出保羅喜歡還是不喜歡它嗎?不能猜出保羅會喜歡或不喜歡它,其他選擇還不清楚。沒錯,我們可以很容易地對歌曲 A 進行分類,但是當選擇變得複雜時,就像歌曲B 一樣。機器學習可以幫你解決這個問題。
讓我們看看如何。在歌曲 B 的同一個例子中,如果我們在歌曲 B 周圍畫一個圓圈,我們會看到有四個綠色圓點表示喜歡,而一個紅色圓點不喜歡。
如果我們選擇佔大多數比例的綠色圓點,我們可以說保羅肯定會喜歡這首歌,這就是一個基本的機器學習演算法,它被稱為 K 近鄰演算法, 這只是眾多機器學習演算法之一中的一個小例子。
但是當選擇變得複雜時會發生什麼?就像歌曲 B 的例子一樣,當機器學習進入時,它會學習資料,建立預測模型,當新的資料點進來時,它可以很容易地預測它。資料越多,模型越好,精度越高。
機器學習的分類
機器學習的方式有很多,它可以是監督學習、無監督學習或強化學習。
監督學習
讓我們首先快速瞭解監督學習。假設你的朋友給你 100 萬個三種不同貨幣的硬幣,比如說一個是 1 歐元,一個是 1 歐元,每個硬幣有不同的重量,例如,一枚 1 盧比的硬幣重 3 克, 一歐元重 7 克,一歐元重 4 克,你的模型將預測硬幣的貨幣。在這裡,體重成為硬幣的特徵,而貨幣成為標籤,當你將這些資料輸入機器學習模型時,它會學習哪個特徵與哪個結果相關聯。
例如,它將瞭解到,如果一枚硬幣是三克,它將是一枚盧比硬幣。根據新硬幣的重量,你的模型將預測貨幣。因此,監督學習使用標籤資料來訓練模型。在這裡,機器知道物件的特徵以及與這些特徵相關的標籤。
無監督學習
在這一點上,讓我們看看與無監督學習的區別。假設你有不同球員的板球資料集。當您將此資料集送給機器時,機器會識別玩家效能的模式,因此它會在 x 軸上使用各自的 Achatz 對這些資料進行處理,同時在 y 軸上執行
在檢視資料時,你會清楚地看到有兩個叢集,一個叢集是得分高,分較少的球員,而另一個叢集是得分較少但得分較多的球員,所以在這裡我們將這兩個叢集解釋為擊球手和投球手。
需要注意的重要一點是,這裡沒有擊球手、投球手的標籤,因此 使用無標籤資料的學習是無監督學習。因此,我們瞭解了資料被標記的監督學習和資料未標記的無監督學習。
強化學習
然後是強化學習,這是一種基於獎勵的學習,或者我們可以說它的工作原理是反饋。
在這裡,假設你向系統提供了一隻狗的影像,並要求它識別它。系統將它識別為一隻貓,所以你給機器一個負面反饋,說它是狗的形象,機器會從反饋中學習。最後,如果它遇到任何其他狗的影像,它將能夠正確分類,那就是強化學習。
讓我們看一個流程圖,輸入給機器學習模型,然後根據應用的演算法給出輸出。如果是正確的,我們將輸出作為最終結果,否則我們會向火車模型提供反饋,並要求它預測,直到它學
機器學習的應用
你有時不知道在當今時代,機器學習是如何成為可能的,那是因為今天我們有大量可用的資料,每個人都線上,要麼進行交易,要麼上網,每分鐘都會產生大量資料,資料是分析的關鍵。
此外,計算機的記憶體處理能力也在很大程度上增加,這有助於他們毫不拖延地處理手頭如此大量的資料。
是的,計算機現在擁有強大的計算能力,所以有很多機器學習的應用。
僅舉幾例,機器學習用於醫療保健,在醫療保健中,醫生可以預測診斷,情緒分析。
科技巨頭在社交媒體上所做的推薦是另一個有趣的應用。金融部門的機器學習欺詐檢測,並預測電子商務部門的客戶流失。
小測驗
我希望你已經理解了監督和無監督學習,所以讓我們做一個快速測驗,確定給定的場景是使用監督還是非監督學習。
- 場景 1: Facebook 從一張標籤照片相簿中識別出你的朋友
- 場景 2: Netflix 根據某人過去的電影選擇推薦新電影
- 場景 3: 分析可疑交易的銀行資料並標記欺詐交易
場景 1: Facebook 在一張標籤照片相簿中的照片中識別你的朋友解釋: 這是監督學習。在這裡,Facebook 正在使用標記的照片來識別這個人。因此,標記的照片成為圖片的標籤,我們知道當機器從標記的資料中學習時,它是監督學習。
場景 2: 根據某人過去的音樂選擇推薦新歌解釋: 這是監督學習。該模型是在預先存在的標籤 (歌曲流派) 上訓練分類器。這是 Netflix,Pandora 和 Spotify 一直在做的事情,他們收集您已經喜歡的歌曲/電影,根據您的喜好評估功能,然後根據類似功能推薦新電影/歌曲。
場景 3: 分析可疑交易的銀行資料並標記欺詐交易解釋: 這是無監督學習。在這種情況下,可疑交易沒有定義,因此沒有 “欺詐” 和 “非欺詐” 的標籤。該模型試圖通過檢視異常交易來識別異常值,並將其標記為 “欺詐”。