機器學習這10年我們能在各自的領域做點什麼?

dicksonjyl560101發表於2018-10-30

機器學習這10年我們能在各自的領域做點什麼?


為什麼要學習和了解機器學習?

Benedict Evans 認為,最終幾乎所有的東西都會有機器學習,到那時人們對機器學習已經是習以為常、見怪不怪了。到這一步還有多久呢?10-15年。

這不禁讓人思考:這10年,我們能利用這個契機在各自的領域做點什麼呢?正如以往的各種技術浪潮興起時,比如工業革命、電力革命、網際網路、移動網際網路,還有作者在文中說到的關聯式資料庫技術等,那時各領域的創新者們都是如何響應的呢?

如果希望10年後能在自己的領域有所影響力的,利用機器學習應該是一個好的機會。跟自己相關的是學習領域,所以如何利用機器學習來提升學習的效率,是這一年多來在探索的命題。

假若10年機器學習技術真的對人類的學習方式、方法及效率帶了本質的改變,希望其中能有一點自己的貢獻。

下面是學習 Benedict Evans 這篇文章記的筆記以及自己的一點思考。

討論機器學習務實方式

機器學習又被稱作“人工智慧 (AI)”。這個名字有好有不好。好的方面是,很容易抓眼球,獲得大家(包括投資人)的注意力。不好的是,容易跑偏。大家容易想象成一種具有通用智慧的東西。

作者舉了很好的例子:

在自動化的每一波浪潮中,我們都想象我們正在創造一些擬人化的東西或具有通用智慧的東西。在上世紀20、30年代,我們想象鋼鐵俠拿著錘子在工廠裡走來走去,在50年代,我們想象人形機器人在廚房裡走來走去做家務。但我們沒有機器人僕人,我們有用來清洗的機器。

所以“人工智慧將接管所有的工作” “資料是新的石油” 類似的話題都過於高屋建瓴,對深入理解機器學習並無益處。

更務實且有助於理解和解決問題的方式應該是:機器學習可以看作是另一種意義上的自動化,在概念上跟傳送帶或取放機並沒有什麼不同。它每次只能解決一個單一問題,每個問題都需要不同的實現方式、不同的資料、不同的路徑,而且往往需要不同的公司。洗碗機洗碗,洗衣機洗衣服,機器學習跟它們一樣,都是自動化的一部分。

找到機器學習應用場景的兩套工具

作者在文中提供了兩個思維角度,來尋找具體產品中機器學習的應用場景。

工具一:從資料和要解決的問題的型別上來思考,主要有三類:

(1)如果你有相關資料,機器學習可以提供更好的結果(資料分析)

比如:Instacar 公司建立了一個系統,來最佳化個人購物者在超市中的路線,結果是相關超市有50%的提升。這是由三名工程師利用谷歌的開源工具 Keras 和 Tensorflow 建立的。

(2)機器學習可以對已有資料提出新的問題(資料探勘)

比如:就像正在找線索的律師,可以透過尋找有關“憤怒的”或“焦慮的”以及其他異常的線索,帶來新的發現。

(3)機器學習可以用來直接分析音訊、影像或影片資料,以前無法做到。這意味著影像感測器和麥克風變成了一種全新的輸入機制(增加可分析資料型別)

比如:一家為汽車公司提供座椅的公司,在一個便宜的DSP晶片上安裝了一個神經網路,並配有一個便宜的智慧手

機影像感測器,用來檢測面料是否有褶皺。

作者還特意指出,這個識別面料是否有褶皺,跟識別一張圖是否是貓並不是同一個問題。我想他的意思應該是, 用於工業界和實際產品中技術,並不需要像識別一張照片是否是貓這種認知層面的技術。能低成本地解決環節中任何一個哪怕是細小的問題,都是好的。至於能不能叫“人工智慧”又有什麼關係,它的本質是將以前無法自動化的任務給自動化了。

工具二:自動化的感覺(上面講的這種自動化)

這個似乎有點虛無渺茫。你要想象這種自動化是一種低層次的自動化,並不需要像有20年經驗的專家那樣。

作者打了一個比方,還挺有意思的。他說有了機器學習這個工具,就像是給了你無數個可以用的實習生,或者是10歲的孩子。

5年前,機器能區分只能是照片的大小。一位10歲的孩子,可以分出男女。一位15歲的青少年可以分出酷或者不酷。一位實習生則能區分出有趣的人或無趣的人。現在的機器學習,已經可以達到10歲孩子甚至是15歲青少年的能力,但也許永遠達不到實習生的水平。

那麼問題來了:在這種情況下,如果你有一百萬15歲青少年(即機器學習)來幫忙看照片,你會怎麼做呢?同理,你會怎麼透過他們來聽電話,來識別圖片,來監測信用卡轉賬資訊呢?

(也許可以想一想再看答案...)

我們可以要求“他們” 聽完所有的電話,找出其中聽起來有些生氣的那些;讀完所有的郵件找到顯得“焦慮”的那些;看完所有照片,找出酷的(至少是‘有點怪’)的,而在這之後的事情可以交給人來處理。所以,機器學習並不需要成為專家本身。

而這本質上就自動化一直在做的事,就像是 Excel 和 Photoshop 一直在為我們做的事情一樣。

將一個重複多次的獨立任務自動化,這同樣是機器學習要做的。

當然上面這個比喻也有不適用的時候,比如機器在有的領域會超越人類,比如圍棋。AlphaGo 就是一個很好的例子。但是這種領域足夠狹窄,有具體且有限的規則,機器透過規則推演可以看到全部資料,而人類反而做不到的情況,是非常少見的。所以絕大多數的機器學習應用,還是上面說的“自動化”。

最後,結合自己的一點實際經驗,說一說自己的體會,主要有兩個方面。

第一,先摘低垂的果實

“低垂的果實” 是從萬維鋼的得到專欄《精英日課》聽來的譯法,英文是low hanging fruit,指的是相對不需要費太大力氣就能獲得的。

不是所有的人或公司都要追求10倍創新,那些讓希望賦予機器認知能力的事情可以由大公司來做。對於一個直接面向使用者的產品來說,什麼能提升體驗、能創造新的使用者價值,就用什麼。不為所謂“人工智慧”之名所累,一切以解決問題和提升效率為優先,是更務實的態度。

第二,機器學習在使用者量級大的系統解決方案型產品中更能發揮出效能

一是因為機器學習是靠資料驅動,使用者量級大,收集的資料多,訓練和迭代模型都更有利。另一個原因是,因為機器學習最佳化的可能是整個體系的一個環節,其效能需要在多次重複使用中發揮出來。這種回報後置要求,一在獲得成效前要有長遠眼光,二在取得成效後,需要系統將其效能放大。

比如,一個自適應的英語水平測評做得非常精準,但人們不一定願意持續為測評付費。更好的情況是,測評後面還有一整體套提升英語水平的付費課程。

總之,機器學習是一個我們不想也不能忽視的趨勢。它已經被應用於各行各業的各個環節,也將被應用於更多的場景,以此來提升效率。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29829936/viewspace-2217990/,如需轉載,請註明出處,否則將追究法律責任。

相關文章