【人工智慧】順豐科技資料總監餘何:人工智慧“江湖”
演講人 | 餘何 整理|物流麻將胡 來源 | 物流沙龍
編者按:
“縱觀整個人工智慧的發展歷程可以發現,我們是站在過往先輩的肩膀上在做這件事情”,順豐科技資料總監餘何在物流沙龍2018數字化供應鏈峰會既LOG年會上的演講開頭如此強調。作為順豐資料中心、服務中心,基礎的IT設施資料負責管理者,理論與實踐並重,他從人工智慧的定義說起,緊接著從人工智慧的發展歷程、技術框架以及應用場景等內容延伸開來,闡釋了人工智慧在供應鏈數字化下的應用。
在業內有著“大師兄”暱稱的餘何,令人忍不住聯想到武俠小說里門派中的大師兄,接下來,我們一起來看一看他的人工智慧“江湖”,學個一招半式。
人工智慧是什麼?
人工智慧是什麼?餘何給出了自己的解讀——人工智慧是指計算機能夠替代人類實現識別、認知、分析和決策的多種功能,它主要包括三個階段,依次分別是:邏輯計算、學習認知與意識情感。
1)邏輯計算。通過運用布林代數、符號邏輯建立演算法公式,再通過計算機進行計算,以達到釋放人腦計算的目的。
2)學習認知。包括時空感知、經驗抽象與想象創造三個部分。
3)意識情感。什麼是意識情感?我知道我就是我,我知道自己的存在。我們在電影中看到的人工智慧是什麼?就是機器人有自己的意識會毀滅人類。而在餘何看來,人工智慧是可以模擬滿足人類的情感需求,對人類自己缺乏的情感進行補充,要能證明自己的意識以及滿足人類的情感才是真正的人工智慧。
人工智慧的發展歷程
“縱觀整個人工智慧的發展歷程可以發現,我們是站在過往先輩的肩膀上在做這件事情,很多偉大的科學家都在無關乎商業的象牙塔裡做過研究。”餘何表示。
人工智慧的發展經歷了三個階段:
1、第一階段:人工智慧起步期
整個人工智慧是從1956年開始的,當時最年輕的科學家只有29歲,名氣最大的科學家當時不是討論有什麼樣的科研結果或者什麼產出?而只是做了一些假設:即什麼是人工智慧,可以通過哪些方式實現,有無相關標準?1956年,馬文·明斯基組織達特茅斯會議標誌AI誕生。
實際上,關於如何模擬人工智慧當時分為兩派,一派認為可以通過邏輯符號、布林代數模擬;一派則主張完全打破原來計算的結構,仿造人類的大腦做神經網路。
1957年,心理學家羅森布拉特發明了神經網路模型Perceptron感知機,論文發表後引起了社會轟動,並得到商業界諸多投資。但與此同時,整個學術界亦對其進行非常激烈的批評,其中以馬文·明斯基尤甚,馬文·明斯基將對羅森布拉特的批評直接寫到書中。
直至1970年,整個對人工智慧的投資就像2000年網際網路一樣被打入寒冬。但無論如何,他們仍舊是人工智慧的先驅。
2、第二階段:機器學習時期
1982年,霍普菲爾德提出複合型的神經網路遞迴(復發型)網路,但當時投入到工業和商業的價值並不是很大;1986年,Rumelhar、Hinton等人提出了反向傳播BP演算法,解決了兩層神經網路所需要的複雜計算量問題;90年代,DARPA人工智慧計算機研究失敗,SVM(Support Vector Machines,支援向量機)演算法誕生,迅速打敗了神經網路演算法成為主流。
3、第三階段:深度學習時期
2006年,Geoffrey Hinton發表了論文,首次提出了“深度學習”神經網路,人工智慧在此興起;2010年,舉辦ImageNet挑戰賽;2012年,Andrew Ng建造最大的神經網路,骨骼大腦;2013深度學習演算法在語音和視覺識別上都有重大突破;2016,AlphaGo擊敗人類職業圍棋選。
尤其值得一提的是,1986年,“深度學習之父”Geoffrey Hinton當時在一所大學當教授,在這個時期,由於計算能力能夠滿足之後,他把人類的神經網路進行擴張,並且帶出了很多學生,其中包括華裔李非非。
李非非做了一件事,她將1500多萬張圖片放到網際網路上,通過分散式的管理方式讓學生和科學家對這些圖片進行標註,分成2200個分類,通過神經網路來快速識別圖片,識別圖片的正確率提高了2倍。“可以發現它不是一個演算法的問題,而是資料問題,只要資料量足夠大,正確率就高。”餘何這樣說道。
目前基本上是到了這樣的階段,我們的資料量已經足夠,有了雲端計算的資源來支撐,至少在某個專業領域已經取得相應的成功。
人工智慧的技術框架
很多人想自己做人工智慧,或者成立一個團隊去做和人工智慧這個行業的相關工作,在這個行業中整個技術框架是怎樣的?
1、大資料、雲端計算
大資料和雲端計算是整個AI的基礎,先要資訊化、數字化,這兩個基礎是最難的。和以往相比,現在獲取資料的手段更多速度更快;在計算能力這塊有順豐雲,在單位空間中計算能力越強越好。
2、演算法、模型
在演算法和模型這塊,可以發現很多科學家採用的方式完全不一樣,比如在神經網路這塊,在沒有計算能力和資料量的情況下可能是劍走邊鋒。
演算法主要包括三種型別,分別為:無監督學習、監督學習和強化學習。
無監督學習是給定資料,從資料中發現資訊。通過對這些事情分析後發現神經網路中只要看到有貓的視訊存在,某部分神經元就會產生反應,自動辨別哪個是貓,這個時候是沒有人去幹預的。
監督學習會給定資料,預測這些資料的標籤。它會告訴我們大量的資訊是什麼,並進行歸類,比如前面李非非做的專案,1500萬圖片都是經過大量的人工去處理和達標的,識別率達到90%。
強化學習是給定資料,選擇動作以最大化長期激勵,是這幾個階段中最複雜的。類似於在玩一個遊戲,這個時候不需要任何人告訴他遊戲的規則,整個激勵和角度在於是否做得好。
3、技術方向
技術方向比較明確的是計算機視覺,人臉現在也非常普及,此外還包括語言工程、自然語言處理以及決策規劃。
4、瓶頸與研究
當前應用這些技術會遇到很多問題,如計算機視覺和語音工程會有很多噪音和干擾,這樣的情況下通過什麼方式讓你的機敏度更高?機器與自然語言翻譯這一塊要求語量的資訊要足夠豐富;決策規劃方面,目前我們要做的是,把應用場景中基於原來資訊化、資料化和不斷在變化的內容糅合在一起。
人工智慧的應用場景
人工智慧在物流領域有哪些應用?餘何總結歸納了四個應用場景,包括收派、中轉、運輸、倉儲。
其中,收派做了手寫體的識別,原來是有人工跟單的,要去識別各種各樣的人的字型,識別率可能在60%左右,現在完成第一輪的翻譯後,結合現有的技術庫歷史資料進行識別,識別率可能是90%。
中轉主要是網路的選址和路徑規劃。這是一個決策系統,要將整個全國全網的網點整個大的資料實現整個流轉流向非常難。
當時做了一個切割,比如分為華東、華北,根據具體的業務場景做摸索,原來的人工智慧也可以很好的運用,如計算機視覺可以在整個中轉場有整套人工智慧的識別系統,可以快速看到包裹的真實物流位置、捕捉單號;甚至可以在整個中轉場看到人工作業的情況,如有無高空拋物或者按照制定位置認真工作;也可以通過計算機系統去完成具體場景,只要大的整套系統明確便可以很快運用。
此文系作者個人觀點,不代表物流沙龍立場
深度學習應用中需要思考的問題
我在這兒只是列出了一部分該考慮的問題,各位小夥伴們可以在下面留言區進行補充。演算法學習的過程不要想當然,從實際角度切入可能會讓你少走很多彎路。
對於下列問題,我們無法給出統一的回答,因為答案取決於您想要解決的具體問題。但是,我們希望本文中列出的各項因素能引導您在初期系統地思考如何選擇演算法和工具:
我要解決的是有監督學習問題,還是無監督問題?如果是有監督學習,那麼是分類問題還是迴歸問題?有監督學習是有“老師”的。這位“老師”就是一個確定輸入和輸出資料之間關聯的訓練資料集。例如,您可能需要標記影像。在這種分類問題中,輸入是原始畫素,而輸出則是圖片中的事物的名稱。而在迴歸問題中,您可能需要教授神經網路如何預測連續值,例如根據住房面積這樣的輸入資料來判斷房子的價格。無監督學習則能通過分析未標記的資料來檢測相似性或異常狀況。無監督學習沒有“老師”;具體應用包括影像搜尋和欺詐檢測等。
如果是有監督學習,需要處理的標籤數量有多少?需要準確標記的標籤數量越多,問題的計算強度也就越大。ImageNet的訓練資料集約有1000個類別;而鳶尾花資料庫則只有3個類別。
每個批次應當包含多少資料?一個批次指的是資料集中的一組樣例或例項,比如一組影像。在訓練過程中,一個批次的例項全部輸入神經網路,網路對這些例項進行預測,然後依據所有預測誤差的平均值來更新模型的權重。批次越大,兩次更新之間的等待時間(或稱學習步驟)就越長。批次較小意味著網路從每個批次中學到的與問題資料集相關的資訊較少。如果您有大量資料,一開始不妨將批次大小設定為1000,對於一些問題可以取得較好的學習效果。
需要處理的特徵數量有多少?特徵數量越多,需要的記憶體也越大。就影像而言,第一層的特徵數量等於影像所包含的畫素數。所以MNIST資料集中的28 x 28畫素的影像有784個特徵。醫療診斷中的影像則可能有14兆畫素。
同樣的問題,另一種表述是:應當選擇哪種網路架構?微軟研究院開發的Resnet網路在最近的ImageNet大賽中獲得冠軍,該網路有150個層。在其他條件相同的情況下,層數越多,需要處理的特徵越多,所需要的記憶體也就越大。多層感知器(MLP)中的一個稠密層的特徵密集度要遠高於一個卷積層。人們之所以使用包含二次抽樣層的卷積網路,正是因為這樣可以大刀闊斧地“修剪”需要運算的特徵。
要用怎樣的方法來除錯神經網路?許多人可能還對神經網路除錯感到有些雲裡霧裡。具體的操作方式有以下幾種。可以根據實踐經驗來除錯:觀察網路的F1值,然後調整超引數。您也可以用超引數優化工具來實現一定程度的自動化除錯。最後,您還可以採用示意性方法,比如用一個GUI來明確顯示誤差下降的速度以及啟用分佈的狀況。
模型訓練需要多少資料?怎樣找到這些資料?
硬體:使用GPU、CPU還是兩者並用?用單一GPU系統還是分散式系統?目前許多研究是用1~4個GPU的系統開展的。企業級解決方案通常需要更多資源,因此還必須使用大型CPU叢集。
要使用哪種資料加工管道?如何進行資料的提取、轉換和載入(ETL)?資料是在Oracle資料庫中嗎?還是在Hadoop叢集上? 資料是在本地還是雲端?
如何提取資料中的特徵?雖然深度學習可以自動提取特徵,但您可以用不同形式的特徵工程來減輕計算負荷,加快訓練速度,尤其是在特徵比較稀疏的情況下。
應使用何種非線性函式、損失函式和權重初始化方式?非線性函式是與深度神經網路中每個層相對應的啟用函式,可能是sigmoid函式、修正線性單元或其他函式。每種非線性函式通常與特定的損失函式搭配。
解決這個問題的最簡架構是什麼?並非所有人都願意或有能力用Resnet來進行影像分類。
網路在哪裡進行訓練?模型要部署到哪裡?需要與哪種平臺整合?大多數人直到完成一個的原型時才開始思考這些問題,此時他們往往得用可擴充套件性更強的工具來重寫自己的網路。您應當提前考慮最終需要使用的是Spark、AWS、Hadoop,還是別的平臺。
我在這兒只是列出了一部分該考慮的問題,各位小夥伴們可以在下面留言區進行補充。演算法學習的過程不要想當然,從實際角度切入可能會讓你少走很多彎路。
原文:DL4J(https://deeplearning4j.org/cn/questions)
人工智慧賽博物理作業系統
AI-CPS OS
“人工智慧賽博物理作業系統”(新一代技術+商業作業系統“AI-CPS OS”:雲端計算+大資料+物聯網+區塊鏈+人工智慧)分支用來的今天,企業領導者必須瞭解如何將“技術”全面滲入整個公司、產品等“商業”場景中,利用AI-CPS OS形成數字化+智慧化力量,實現行業的重新佈局、企業的重新構建和自我的煥然新生。
AI-CPS OS的真正價值並不來自構成技術或功能,而是要以一種傳遞獨特競爭優勢的方式將自動化+資訊化、智造+產品+服務和資料+分析一體化,這種整合方式能夠釋放新的業務和運營模式。如果不能實現跨功能的更大規模融合,沒有顛覆現狀的意願,這些將不可能實現。
領導者無法依靠某種單一戰略方法來應對多維度的數字化變革。面對新一代技術+商業作業系統AI-CPS OS顛覆性的數字化+智慧化力量,領導者必須在行業、企業與個人這三個層面都保持領先地位:
重新行業佈局:你的世界觀要怎樣改變才算足夠?你必須對行業典範進行怎樣的反思?
重新構建企業:你的企業需要做出什麼樣的變化?你準備如何重新定義你的公司?
重新打造自己:你需要成為怎樣的人?要重塑自己並在數字化+智慧化時代保有領先地位,你必須如何去做?
AI-CPS OS是數字化智慧化創新平臺,設計思路是將大資料、物聯網、區塊鏈和人工智慧等無縫整合在雲端,可以幫助企業將創新成果融入自身業務體系,實現各個前沿技術在雲端的優勢協同。AI-CPS OS形成的數字化+智慧化力量與行業、企業及個人三個層面的交叉,形成了領導力模式,使數字化融入到領導者所在企業與領導方式的核心位置:
精細:這種力量能夠使人在更加真實、細緻的層面觀察與感知現實世界和數字化世界正在發生的一切,進而理解和更加精細地進行產品個性化控制、微觀業務場景事件和結果控制。
智慧:模型隨著時間(資料)的變化而變化,整個系統就具備了智慧(自學習)的能力。
高效:企業需要建立實時或者準實時的資料採集傳輸、模型預測和響應決策能力,這樣智慧就從批量性、階段性的行為變成一個可以實時觸達的行為。
不確定性:數字化變更顛覆和改變了領導者曾經仰仗的思維方式、結構和實踐經驗,其結果就是形成了複合不確定性這種顛覆性力量。主要的不確定性蘊含於三個領域:技術、文化、制度。
邊界模糊:數字世界與現實世界的不斷融合成CPS不僅讓人們所知行業的核心產品、經濟學定理和可能性都產生了變化,還模糊了不同行業間的界限。這種效應正在向生態系統、企業、客戶、產品快速蔓延。
AI-CPS OS形成的數字化+智慧化力量通過三個方式激發經濟增長:
創造虛擬勞動力,承擔需要適應性和敏捷性的複雜任務,即“智慧自動化”,以區別於傳統的自動化解決方案;
對現有勞動力和實物資產進行有利的補充和提升,提高資本效率;
人工智慧的普及,將推動多行業的相關創新,開闢嶄新的經濟增長空間。
給決策制定者和商業領袖的建議:
超越自動化,開啟新創新模式:利用具有自主學習和自我控制能力的動態機器智慧,為企業創造新商機;
迎接新一代資訊科技,迎接人工智慧:無縫整合人類智慧與機器智慧,重新
評估未來的知識和技能型別;
制定道德規範:切實為人工智慧生態系統制定道德準則,並在智慧機器的開
發過程中確定更加明晰的標準和最佳實踐;
重視再分配效應:對人工智慧可能帶來的衝擊做好準備,制定戰略幫助面臨
較高失業風險的人群;
開發數字化+智慧化企業所需新能力:員工團隊需要積極掌握判斷、溝通及想象力和創造力等人類所特有的重要能力。對於中國企業來說,創造兼具包容性和多樣性的文化也非常重要。
子曰:“君子和而不同,小人同而不和。” 《論語·子路》雲端計算、大資料、物聯網、區塊鏈和 人工智慧,像君子一般融合,一起體現科技就是生產力。
如果說上一次哥倫布地理大發現,擴充的是人類的物理空間。那麼這一次地理大發現,擴充的就是人們的數字空間。在數學空間,建立新的商業文明,從而發現新的創富模式,為人類社會帶來新的財富空間。雲端計算,大資料、物聯網和區塊鏈,是進入這個數字空間的船,而人工智慧就是那船上的帆,哥倫布之帆!
新一代技術+商業的人工智慧賽博物理作業系統AI-CPS OS作為新一輪產業變革的核心驅動力,將進一步釋放歷次科技革命和產業變革積蓄的巨大能量,並創造新的強大引擎。重構生產、分配、交換、消費等經濟活動各環節,形成從巨集觀到微觀各領域的智慧化新需求,催生新技術、新產品、新產業、新業態、新模式。引發經濟結構重大變革,深刻改變人類生產生活方式和思維模式,實現社會生產力的整體躍升。
產業智慧官 AI-CPS
用“人工智慧賽博物理作業系統”(新一代技術+商業作業系統“AI-CPS OS”:雲端計算+大資料+物聯網+區塊鏈+人工智慧),在場景中構建狀態感知-實時分析-自主決策-精準執行-學習提升的認知計算和機器智慧;實現產業轉型升級、DT驅動業務、價值創新創造的產業互聯生態鏈。
長按上方二維碼關注微信公眾號: AI-CPS,更多資訊回覆:
新技術:“雲端計算”、“大資料”、“物聯網”、“區塊鏈”、“人工智慧”;新產業:“智慧製造”、“智慧金融”、“智慧零售”、“智慧駕駛”、“智慧城市”;新模式:“財富空間”、“工業網際網路”、“資料科學家”、“賽博物理系統CPS”、“供應鏈金融”。
官方網站:AI-CPS.NET
本文系“產業智慧官”(公眾號ID:AI-CPS)收集整理,轉載請註明出處!
版權宣告:由產業智慧官(公眾號ID:AI-CPS)推薦的文章,除非確實無法確認,我們都會註明作者和來源。部分文章推送時未能與原作者取得聯絡。若涉及版權問題,煩請原作者聯絡我們,與您共同協商解決。聯絡、投稿郵箱:erp_vip@hotmail.com
相關文章
- 何為人工智慧?人工智慧
- 科技企業的幕後推手,人工智慧究竟有何魔力人工智慧
- 資料探勘,人工智慧,機器學習會議總結人工智慧機器學習
- 【人工智慧】面對人工智慧的發展,人類該何去何從?人工智慧
- 人工智慧與海量資料使科技巨頭難以被超越人工智慧
- 《人工智慧》總結人工智慧
- 大資料和人工智慧大資料人工智慧
- 害怕人工智慧的Musk,為何投資這家人工智慧公司?人工智慧
- 人工智慧資料標註案例之人臉識別 | 景聯文科技人工智慧
- 疫情過後,走出寒冬後的人工智慧何去何從人工智慧
- 人工智慧賦能數字經濟,順豐科技智慧物流系統透過新興產業扶持計劃驗收人工智慧產業
- 科技雜談:人工智慧從娃娃抓起人工智慧
- 資料標註員:人工智慧行業的“築夢師”丨曼孚科技人工智慧行業
- 人工智慧 (01) 資料預處理人工智慧
- 大資料如何幫助人工智慧?大資料人工智慧
- 人工智慧+大資料+雲端計算人工智慧大資料
- 人工智慧:大資料賜予生命人工智慧大資料
- 大資料、人工智慧如何助力市場監管?專家們這樣說大資料人工智慧
- 餘凱:深度學習,推進人工智慧的夢想深度學習人工智慧
- CDGA|資料監管越來越嚴,資料治理髮展何去何從?
- 大資料有何特點?_光點科技大資料
- 專家縱論:2017年人工智慧將何去何從?人工智慧
- 人工智慧 (07) 時間序列資料分析人工智慧
- 大資料和人工智慧的關係大資料人工智慧
- 人工智慧將如何改變資料安全人工智慧
- 小資料人工智慧的巨大潛力人工智慧
- 基於大資料的人工智慧象棋大資料人工智慧
- 人工智慧領域經典資料集人工智慧
- 讀人工智慧時代與人類未來筆記07_人工智慧往何處去人工智慧筆記
- 交通銀行資訊科技管理部副總經理張漫麗:交通銀行“大資料+人工智慧”應用研究...大資料人工智慧
- DeepMind難以盈利,人工智慧該走向何處去?人工智慧
- 人工智慧資料標註領域五大核心需求痛點丨曼孚科技人工智慧
- 人工智慧資料標註這些年:從幕後到前臺丨曼孚科技人工智慧
- 奇智科技、親哥智慧“牽手”AI人工智慧開啟血糖監測新紀元AI人工智慧
- 曼孚科技:人工智慧,真的需要不少“人工”人工智慧
- 資料管理簡史:從人工到人工智慧人工智慧
- 人工智慧與大資料的完美結合人工智慧大資料
- 【人工智慧】深度學習、資料庫選擇和人工智慧的革命;人工智慧是解鎖IoT潛力的鑰匙人工智慧深度學習資料庫