目前,深度學習已成功運用於這三大領域

dicksonjyl560101發表於2019-04-08


目前,深度學習已成功運用於這三大領域

隨著人工智慧的不斷髮展,人工智慧技術的定義也在不斷擴充。雖然除開深度學習之外,專家們還研究了其他機器學習技術和傳統分析技術,但遷移學習、強化學習和深度學習是人工智慧中中應用最多的技術

深度學習源於人工神經網路的研究。含多隱層的多層感知器就是一種深度學習結構。深度學習透過組合低層特徵形成更加抽象的高層表示屬性類別或特徵,以發現資料的分散式特徵表示。

深度學習是機器學習研究中的一個新的領域,其動機在於建立、模擬人腦進行分析學習的神經網路,它模仿人腦的機制來解釋資料,例如影像,聲音和文字。

在美國,谷歌在圍繞深度強化學習的研究與應用中取得多項開創性進展。22018年中旬,谷歌宣佈推出一個新的基於Tensorflow的強化學習框架,稱為Dopamine,旨在為強化學習研究人員提供靈活性、穩定性和可重複性,這個強大的新框架有力地推動強化學習研究取得根本性的新突破。

同年,麻省理工學院和Google Cloud的研究人員提出AutoML模型壓縮技術,利用強化學習將壓縮流程自動化,完全無需人工,而且速度更快,效能更高。模型壓縮是在計算資源有限、能耗預算緊張的移動裝置上有效部署神經網路模型的關鍵技術。

而日益豐富的影像內容更為深度學習演算法提供了大量的資料支撐。據全球領先的網路解決方案供應商"思科公司"評估,2021年單月上傳至全球網路的影片總時長將超過500萬年,每秒將誕生1百萬分鐘的網路影片內容,網路影片流量將佔據全球所有網路使用者流量的81.44%。

不僅如此,深度學習在更加廣泛的領域上,產生了足夠深遠的影響。

目前,深度學習已成功運用於這三大領域

計算機視覺與醫療領域

毫不誇張的說,深度學習在計算機視覺領域(CV)的成就是令人驚喜的!CV 主要研究影像和影片理解,處理目標分類、檢測和分割等任務,這些在判斷病人射線照片中是否包含惡性腫瘤時非常有用。卷積神經網路(CNN) 用來處理具備空間不變性的資料(如影像,它們的意義不會發生改變),也因此成為該領域的重要技術。

拿醫療成像來說,它從影像分類和目標檢測的近期進展中受益良多。很多研究在皮膚科、放射科、眼科、病理科的複雜診斷中取得了不錯的結果。

深度學習方法在大量診斷任務上取代了醫生級別的準確率,包括識別黑痣和黑色素瘤,從眼底影像和光學相干斷層掃描 (OCT) 影像中檢測糖尿病性視網膜病變、判斷心血管風險,提供轉診建議,以及從乳房 X 光片中檢測乳腺病變、使用核磁共振成像進行脊柱分析。甚至有研究證明單個深度學習模型在多個醫療模態中都很有效 (如放射科和眼科)。

目前,深度學習已成功運用於這三大領域

人臉識別與公安服務領域

人臉識別,是基於人的臉部特徵資訊進行身份識別的一種生物識別技術。它也隸屬於深度學習領域,它主要是用攝像機或攝像頭採集含有人臉的影像或影片流,並自動在影像中檢測和跟蹤人臉,進而對檢測到的人臉進行臉部識別的一系列相關技術。

人臉識別技術能夠對公安服務領域產生重大影響,在公交車、火車站、酒店等人員經常出入的場所出入口安裝人臉識別攝像機,對出入人員抓拍人臉識別查證,將抓拍人員圖片或識別結果上傳公安網路,為公安提供可靠的人員資訊。店鋪、賓館酒店、出租屋等場所可以對不同人員做自己的標識分類(如VIP、本出租屋人員、黑名單等),進行預告或預警,並採取相應的管控措施。

這很大程度的減少了公安部門的工作壓力,更是精準的對一些不法分子的行蹤進行了強有力的把控。

目前,深度學習已成功運用於這三大領域

語音圖形與日常生活

深度學習在語音圖形也有很深刻的造詣。像SmileVector 一個推特機器人,它可能比這些美圖功能還要強大。因為藉助人工智慧技術,它可以將任何一張人臉圖片轉化成帶有微笑表情的照片。如果輸入一張人臉圖片,它可以透過深度學習神經網路生成它們微笑的表情。

雖然這些圖片也許並不完美,但它們完全是自動生成的,這是人工智慧在影像處理領域的又一進步。

也許在不久的未來,當圖片、聲音和影片造假都將變得容易。想象一下,這個世界將會如何被顛覆?

而在語音方面,市面上海爾、TCL等已經推出了所謂的可進行語音搜尋的人工智慧電視。小米電視最重磅的功能是支援人工智慧語音控制,號稱老人孩子都能使用,可以用很自然的語言對電視進行聲控。

智慧語音正在向著私人助理機器人方向快速發展,在大資料、人工智慧、機器學習等技術的支撐下,可為每個人量身定製自己的個性化私人助理。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29829936/viewspace-2640604/,如需轉載,請註明出處,否則將追究法律責任。

相關文章