人工智慧-科普-人工智慧是什麼?

hly990990發表於2020-11-17

人工智慧在商業中的應用是通過機器學習演算法來實現的。機器學習是電腦科學的一部分,專注於計算機系統學習執行特定任務,而不使用明確的指令,而是依靠模式和推理。

機器學習演算法通過處理資料,而不是通過接收明確的程式設計指令('if-then'迴圈)來檢測模式並學習如何做出預測和建議。隨著時間的推移,演算法會隨著新資料的到來而改進,通過例項進行 "學習"。

機器學習主要用於:

  • 預測:將會發生什麼。
  • 決策方案:為實現目標應該做什麼。
  • 描述:發生了什麼。

監督學習使用訓練資料和人的反饋來學習給定輸入與給定輸出的關係(例如,輸入 "日期 "和 "銷售 "如何預測客戶的偏好)。如果你已經知道如何對輸入資料進行分類以及你想預測的行為型別,但你想在新的資料上進行分類,就可以使用它。

無監督學習在輸入資料時,不賦予明確的輸出變數(例如,預測客戶銷售資料以識別模式並對其進行分類)。當你想對資料進行分類,但你不確定如何自己給資料打標籤,或者你想發現隱藏的模式時,可以使用它。

強化學習通過嘗試最大化為它的行為規定來學習執行任務(例如,最大化投資組合的回報)。當你的訓練資料有限,而且你無法明確定義最終目標,或者你想探索各種可能性,而不假設解決方案可能是什麼時,就可以使用它。

最常見的做機器學習的框架是Python作為程式語言。機器學習模型的實驗通常需要使用強大的計算機來 "訓練 "演算法。這就是為什麼做人工智慧的額外成本是資料科學家訓練模型時的雲成本。這些費用可能從每月幾百元到數百萬不等,這取決於資料和機器學習架構有多重。對於大多數企業來說,成本不會超過每月幾千元,除非他們想在人工智慧能力上大量投資,並訓練自己的模型,而不是大多使用預先訓練的開源解決方案。

機器學習演算法最常見的架構是神經網路。你可以把它們想象成不同尺寸和顏色的樂高積木,你可以將它們混合起來構建一個特定的結構。神經網路的基本引數是它有多少層以及這些層之間如何相互作用。

深度學習是機器學習的一個子領域,它專注於至少有3層的神經網路。深度學習是當今人工智慧如此流行的實際原因,因為它在影像或語音識別方面的應用遠勝於經典方法。神經網路結合足夠的計算能力,在真實世界的資料上能給出出色的結果。

'大資料'是近十年來經常使用的另一個熱詞。大資料從來沒有一個合適的定義,總是意味著擁有超過使用一臺個人電腦所能處理的資料。這就是為什麼我們今天所理解的大資料(PB級資料)與10年前的大資料(TB級資料)相去甚遠,以及未來10年它將如何變化(Exabytes)。

由於資料對機器學習演算法至關重要,"大資料 "作為探索人工智慧能力的一個基本術語,又回到了組織中。機器學習需要將正確的資料集應用到學習過程中。你不需要大資料來使用機器學習演算法,但大資料可以幫助你提高演算法的準確性。

這就是為什麼很多時候,你並不一定需要大量的資料才能開始實驗人工智慧。尤其是隨著強化學習等技術的提出,AI對於每一個組織來說都是觸手可及的。從AI中獲益的第一步是準備資料,通過清洗資料並按人類同事進行分類。然後,機器學習工程師和資料科學家將能夠處理剩下的事情。

相關文章