AI告你侵權?別慌,都是人訓練出來的

shi04發表於2022-06-01

  前段時間

  

  一位軟體工程師

  

  Ben Dickson

  

  “破獲”一家

  

  由AI“開辦”的

  

  詐騙律師事務所

  

  著實讓小編看到人工智慧的強大

  

  或者說“人工”的強大

  

  上期,我們談到人工智慧變成人工智障的趣事,這一期我們來聊聊這些人工智障背後的那些小秘密——人工神經網路。話不多說,我們先從Ben的視角看看這起離奇的案子。

  

  某天,坐在家中的Ben Dickson收到一封名為“DMCA版權侵權通知”的郵件,聲稱他所使用的一張圖片涉嫌侵權,這就讓Ben有點摸不到頭腦了,作為一名論壇老江湖,他深知版權的重要性,明明自己使用的圖片來自於一個免費的線上相簿Pexels,為什麼這張圖突然就有了法律上的“主人”了呢?

  

  老辣的Ben Dickson一頓追根溯源,調查到了一家名為Arthur Davidson的法律事務所,開啟其官網,整個官網做的有模有樣,甚至連域名都是正規的,這家律所自2009年到現在,總共參與過420起案件,其中有380場勝訴,勝訴率高達90%。

  

  但奇怪的是,這家如此厲害的律所卻從未上過新聞,甚至連谷歌都沒有相關的資訊和報導。除此以外,儘管這家律所已經成立了13年,但官網所用域名卻是在2022年2月才剛剛建立的。當然,僅憑這些疑點去斷定這家律師是假的顯然不夠嚴謹。而在開啟這些律師的詳情頁面後,他已經可以確定這家Arthur Davidson絕對是一家假的律所。

  

  Ben在經過對比律師的照片後發現,包括與他聯絡的律師在內,這些名校出身的律師全部都是AI的“傑作”:他們的照片全部都是由生成對抗網路GAN建立的圖片,也就是說這些人根本不存在。

  

  

  既然這些人全都不存在,那麼這起侵權郵件的騙局也不攻自破,而這其中所運用的人工智慧技術讓身邊滿是“人工智障”的小編感到驚訝,這些新奇AI換臉技術是依靠什麼實現的呢?這就不得不提到是時下大熱的深度學習了。

  

  深度學習是機器學習領域的一個分支,20多年來,透過一系列的商業應用主導了人工智慧的研究,而深度學習的概念則來自於人工神經網路的研究。與人腦的認知結構相似,深度學習也是根據層次化的概念體系來理解世界,透過不同層次中概念的關係來定義這些概念。

  

  說人話就是:像嬰兒認識這個世界一樣,由淺入深的學習。比如人們區別棕櫚樹和椰子樹,同樣是由樹幹、樹枝、樹葉組成的植物,人們會先透過一些顯著的特徵進行區別,再次細化後會透過樹皮、葉片裂紋等資訊判斷,如果想要再深入一點,還會有花期、種植適宜溫度等,深度學習也是如此。

  

  而隨著訓練資料量以及計算機軟硬體水平的飛速發展,深度學習的規模也逐漸擴大,精度也在不斷提高,在著名的ImageNet競賽上,AI在識別約1000類物體的準確率上已達到95%。當然,也有大量的深度學習模型被不斷地被開發出來,例如:

  

  卷積神經網路

  

  (Convolutional Neural Network, CNN)

  

  第一個解決重要商業應用的神經網路,適用於諸多領域且表現優異。

  

  迴圈神經網路

  

  (Recurrent Neural Network, RNN)

  

  用於處理序列資料的神經網路,能以很高的效率對序列的非線性特徵進行學習 。

  

  遞迴神經網路

  

  (Recursive Neural Network)

  

  主要用於自然語言處理和計算機視覺,與迴圈神經網路不同,它的結構並非鏈狀而是樹狀結構。

  

  生成式對抗網路

  

  (Generative Adversarial Nerwork,GAN)

  

  一種基於可微生成器網路的一種生成式建模方法,主要解決的問題是從訓練樣本中學習新的樣本。

  

  好的模型是深度學習能否成功的關鍵之一,透過這些優秀的模型,人們已在商業領域成功實現了深度學習的部分價值,例如語音助手、刷臉支付、自動翻譯、圖片識別等等。但就在深度學習實現價值的同時,我們可以發現,深度學習的訓練資料量以及引數量也在以驚人的勢頭增長:支撐深度學習,或者說人工智慧的重要因素就是算力規模以及基礎設施。

  

  

  這堵無形的牆在制約著人工智慧發展的同時,也是促使其逐漸成熟的動力之一。在這方面,作為未來科技領航者的戴爾,擁有十分豐富的人工智慧解決方案以及諸多適用於AI的基礎設施,助力企業在AI時代破浪前行。

  

  例如新一代戴爾PowerEdge伺服器,充分利用最新第三代英特爾 至強 Platinum處理器的優勢,在提供極高可靠性的同時,兼顧高算力、高穩定性和敏捷性,幫助PowerEdge為至關重要的工作負載提供支援,PCle Gen 4.0也極大的提高了吞吐效能;每臺伺服器最多可配置最多六個GPU加速器,能夠滿足嚴苛的資料密集型工作負載。

  

  

  值得一提的是,戴爾PowerEdge伺服器也擁有強大的自主智慧,其內部嵌入的OpenManage Enterprise系統管理控制檯能夠減少落地步驟,節約開發人員寶貴的時間,幫助使用者實現自主部署、配置以及管理的基礎架構。

  

  當然,訓練人工智慧需要應對各種不同的工作負載,除了算力以外,海量的資料以及資料的實時處理也是人工智慧訓練的重中之重。對此,戴爾PowerScale作為橫向擴充套件的NAS儲存,可在單個檔案系統中擴充套件PB級容量,它搭載的新一代OneFS系統,能夠確保開發人員加快分析速度,更快的獲取訓練結果。

  

  面對極為嚴苛的人工智慧工作負載,戴爾PowerScale可以憑藉強大的自動分層技術以及橫向擴充套件結構,消除傳統儲存解決方案的效能瓶頸,為海量訓練資料及引數提供一致、可靠的效能。

  

  人類大腦的進化是為了適應不斷變化的外部環境以及由其引起的一系列新的挑戰,人工智慧就像人類大腦在新時代的一次全新的進化方向。目前,人工智慧正在以迅猛的勢頭不斷髮展,而戴爾科技也將以自身的科技優勢支援企業在這片未知的領域中不斷前行。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69954543/viewspace-2898512/,如需轉載,請註明出處,否則將追究法律責任。

相關文章