一圖看懂新一代人工智慧知識體系大全
來源:財經頭條
摘要:人工智慧的發展離不開基礎支援層和技術層,基礎支援層包括大資料、計算力和演算法;技術層包括計算機視覺、語音識別和自然語言處理。人工智慧的技術本質是什麼,本文會詳細分析。
人工智慧的發展離不開基礎支援層和技術層,基礎支援層包括大資料、計算力和演算法;技術層包括計算機視覺、語音識別和自然語言處理。人工智慧的技術本質是什麼,本文會詳細分析。
總覽人工智慧技術圖譜
基礎支撐層的演算法創新發生在20世紀80年代末,是大資料和計算力將人工智慧推到鎂光燈之下,而建立在這之上的基礎技術便是計算機視覺、語音識別和自然語言理解,機器試圖看懂、聽懂人類的世界、用人類的語言和人類交流,研究人類智慧活動的規律。
1.計算機視覺技術(Computer Vision)
1)·什麼是計算機視覺
“人的大腦皮層的活動, 大約70%是在處理視覺相關資訊。視覺就相當於人腦的大門,其它如聽覺、觸覺、味覺那都是頻寬較窄的通道。視覺相當於八車道的高速, 其它感覺是兩旁的人行道。如果不能處理視覺資訊的話,整個人工智慧系統是個空架子,只能做符號推理,比如下棋、定理證明, 沒法進入現實世界。計算機視覺之於人工智慧,它相當於說芝麻開門。大門就在這裡面,這個門打不開, 就沒法研究真實世界的人工智慧。”——朱鬆純,加州大學洛杉磯分校UCLA統計學和電腦科學教授根據科普中國撰寫的對計算機視覺的定義,這是一門研究如何讓機器“看”的科學,更進一步的說,是指用計算機代替人眼對目標進行識別、跟蹤和測量的機器視覺,並進一步做圖形處理,使計算機處理成為更適合人眼觀察或傳送給儀器檢測的影象。
2)·計算機視覺 VS 機器視覺
計算機視覺更關注影象訊號本身以及影象相關交叉領域(地圖、醫療影像)的研究;機器視覺則偏重計算機視覺技術工程化,更關注廣義上的影象訊號(鐳射和攝像頭)和自動化控制(生產線)方面的應用。
3)計算機視覺識別技術的分類
物體識別分為“1 VS N”對不同物體進行歸類,以及“1 VS 1”對同型別的物體進行區分和鑑別;物體屬性識別,結合地圖模型讓物體在視覺的三維空間裡得到記憶的重建,進而進行場景的分析和判斷;物體行為識別分為3個進階的步驟,移動識別判斷物體是否做了位移,動作識別判斷物體做的是什麼動作,行為識別是結合視覺主體和場景的互動做出行為的分析和判斷。
4)·計算機視覺的識別流程
計算機視覺識別流程分為兩條路線:訓練模型和識別影象。
訓練模型:樣本資料包括正樣本(包含待檢目標的樣本)和負樣本(不包含目標的樣本),視覺系統利用演算法對原始樣本進行特徵的選擇和提取訓練出分類器(模型);此外因為樣本資料成千上萬、提取出來的特徵更是翻番,所以一般為了縮短訓練的過程,會人為加入知識庫(提前告訴計算機一些規則),或者引入限制條件來縮小搜尋空間。
識別影象:會先對影象進行訊號變換、降噪等預處理,再來利用分類器對輸入影象進行目標檢測。一般檢測過程為用一個掃描子視窗在待檢測的影象中不斷的移位滑動,子視窗每到一個位置就會計算出該區域的特徵,然後用訓練好的分類器對該特徵進行篩選,判斷該區域是否為目標。
5 )計算機視覺技術模式圖和對應企業圖
目前世界上影象識別最大的資料庫,是史丹佛大學人工智慧實驗室提供的ImageNet,針對諸如醫療等細分領域也需要收集相應的訓練資料;Google、Microsoft此類科技巨頭會面向市場提供開源演算法框架,為初創視覺識別公司提供初級演算法。
2.語音識別(Automatic Speech Recognition)
1)什麼是語音識別
語音識別是以語音為研究物件,通過訊號處理和識別技術讓機器自動識別和理解人類口述的語言後,將語音訊號轉換為相應的文字或命令的一門技術。由語音識別和語音合成、自然語言理解、語義網路等技術相結合的語音互動正在逐步成為當前多通道、多媒體智慧人機互動的主要方式。
2)語音識別的流程
語音識別流程分為訓練和識別兩條線路。
語音訊號經過前端訊號處理、端點檢測等預處理後,逐幀提取語音特徵,傳統的特徵型別包括有MFCC、PLP、FBANK等特徵,提取好的特徵會送到解碼器,在訓練好的聲學模型、語言模型之下,找到最為匹配的此序列作為識別結果輸出。
3)語音識別技術模式圖和對應企業圖
基礎層:包含大資料、計算力和演算法三塊,其中大資料等接入的是相應領域的第三方服務商。機器在識別人類的語音指令後接入、提供相應的服務。諸如影視、電影票、餐飲等;
技術層:以科大訊飛為首的語音技術提供商;
應用層:傳統家居環境中的電視、音響廠商都給加上了語音識別功能,新增互動方式;還有智慧車載採用語音互動讓手不離開方向盤提高安全係數;還有搜尋廠商基於搜尋做出來的語音助手等。
3.自然語言理解(Natural Language Understanding)
1)什麼是自然語言理解
自然語言理解即文字理解,和語音影象的模式識別技術有著本質的區別,語言作為知識的載體,承載了複雜的資訊量,具有高度的抽象性,對語言的理解屬於認知層面,不能僅靠模式匹配的方式完成。
2)自然語言理解的應用:搜尋引擎+機器翻譯;
自然語言理解最典型兩種應用為搜尋引擎和機器翻譯。搜尋引擎可以在一定程度上理解人類的自然語言,從自然語言中抽取出關鍵內容並用於檢索,最終達到搜尋引擎和自然語言使用者之間的良好銜接,可以在兩者之間建立起更高效,更深層的資訊傳遞。
3)自然語言理解技術在搜尋引擎中的應用
4)自然語言理解技術在機器翻譯中的應用
事實上搜尋引擎和機器翻譯不分家,網際網路、移動網際網路為其充實了語料庫使得其發展模態發生了質的改變。網際網路、移動網際網路除了將原先線下的資訊(原有語料)進行線上化之外,還衍生出來的新型UGC模式:知識分享資料,像維基百科、百度百科等都是人為校準過的詞條,噪聲小;社交資料,像微博和微信等展現使用者的個性化、主觀化、時效性,可以用來做個性化推薦、情感傾向分析、以及熱點輿情的檢測和跟蹤等;社群、論壇資料,像果殼、知乎等為搜尋引擎提供了問答知識、問答資源等資料來源。另一方面,因為深度學習採用的層次結構從大規模資料中自發學習的黑盒子模式是不可解釋的,而以語言為媒介的人與人之間的溝通應該要建立在相互理解的基礎上,所以深度學習在搜尋引擎和機器翻譯上的效用沒有語音影象識別領域來得顯著。
一圖看懂新一代
人工智慧知識體系大全
未來智慧實驗室是人工智慧學家與科學院相關機構聯合成立的人工智慧,網際網路和腦科學交叉研究機構。
未來智慧實驗室的主要工作包括:建立AI智慧系統智商評測體系,開展世界人工智慧智商評測;開展網際網路(城市)雲腦研究計劃,構建網際網路(城市)雲腦技術和企業圖譜,為提升企業,行業與城市的智慧水平服務。
如果您對實驗室的研究感興趣,歡迎加入未來智慧實驗室線上平臺。掃描以下二維碼或點選本文左下角“閱讀原文”
相關文章
- Android知識體系大全!Android
- web前端知識體系圖Web前端
- [MongoDB知識體系] 一文全面總結MongoDB知識體系MongoDB
- [Redis知識體系] 一文全面總結Redis知識體系Redis
- 一圖看懂騰訊安全新一代雲防火牆防火牆
- RabbitMQ知識體系的腦圖結構MQ
- MySQL 索引知識大全MySql索引
- 收藏!一張圖幫你快速建立大資料知識體系大資料
- KGB知識圖譜完善保險行業的知識應用體系行業
- Android所需的Java基礎知識體系圖AndroidJava
- 轉:Android 思維導圖 一張圖幫你複習Android知識體系Android
- 史上最全的人工智慧知識圖譜人工智慧
- 8張圖瞭解JAVA整體構架知識體系!Java
- 前端知識體系思維導圖(持續更新...)前端
- 實驗室資訊管理系統(LIMS)知識大全
- 計算機硬核知識大全計算機
- HTTP協議冷知識大全HTTP協議
- Python知識體系-Python2基礎知識Python
- 知識圖譜系統在人工智慧領域的應用與前景人工智慧
- 一網打盡JVM垃圾回收知識體系JVM
- 如何熟悉一個系統?(內含知識大圖)
- Babel知識體系淺談Babel
- 磁碟知識體系結構
- 構建自己知識體系
- babel知識體系漫談Babel
- 校招前端面試知識大全前端面試
- web開發知識體系中必要的知識點Web
- 【知識圖譜】知識圖譜實體連結無監督學習框架框架
- 一文讀懂分散式架構知識體系(內含超全核心知識大圖)分散式架構
- mysql show open tables相關知識體系之一MySql
- 【全面】Linux基礎知識和基本操作語句大全(一)Linux
- 【知識圖譜】 一個有效的知識圖譜是如何構建的?
- 知識圖譜之知識表示
- 架構知識體系總結架構
- 大資料的知識體系大資料
- 構建自己的知識體系
- Web前端知識體系精簡Web前端
- 淺談如何搭建知識體系