AI告你侵權?別慌,都是人訓練出來的
前段時間
一位軟體工程師
Ben Dickson
“破獲”一家
由AI“開辦”的
詐騙律師事務所
著實讓小編看到人工智慧的強大
或者說“人工”的強大
上期,我們談到人工智慧變成人工智障的趣事,這一期我們來聊聊這些人工智障背後的那些小秘密——人工神經網路。話不多說,我們先從Ben的視角看看這起離奇的案子。
某天,坐在家中的Ben Dickson收到一封名為“DMCA版權侵權通知”的郵件,聲稱他所使用的一張圖片涉嫌侵權,這就讓Ben有點摸不到頭腦了,作為一名論壇老江湖,他深知版權的重要性,明明自己使用的圖片來自於一個免費的線上相簿Pexels,為什麼這張圖突然就有了法律上的“主人”了呢?
老辣的Ben Dickson一頓追根溯源,調查到了一家名為Arthur Davidson的法律事務所,開啟其官網,整個官網做的有模有樣,甚至連域名都是正規的,這家律所自2009年到現在,總共參與過420起案件,其中有380場勝訴,勝訴率高達90%。
但奇怪的是,這家如此厲害的律所卻從未上過新聞,甚至連谷歌都沒有相關的資訊和報導。除此以外,儘管這家律所已經成立了13年,但官網所用域名卻是在2022年2月才剛剛建立的。當然,僅憑這些疑點去斷定這家律師是假的顯然不夠嚴謹。而在開啟這些律師的詳情頁面後,他已經可以確定這家Arthur Davidson絕對是一家假的律所。
Ben在經過對比律師的照片後發現,包括與他聯絡的律師在內,這些名校出身的律師全部都是AI的“傑作”:他們的照片全部都是由生成對抗網路GAN建立的圖片,也就是說這些人根本不存在。
既然這些人全都不存在,那麼這起侵權郵件的騙局也不攻自破,而這其中所運用的人工智慧技術讓身邊滿是“人工智障”的小編感到驚訝,這些新奇AI換臉技術是依靠什麼實現的呢?這就不得不提到是時下大熱的深度學習了。
深度學習是機器學習領域的一個分支,20多年來,透過一系列的商業應用主導了人工智慧的研究,而深度學習的概念則來自於人工神經網路的研究。與人腦的認知結構相似,深度學習也是根據層次化的概念體系來理解世界,透過不同層次中概念的關係來定義這些概念。
說人話就是:像嬰兒認識這個世界一樣,由淺入深的學習。比如人們區別棕櫚樹和椰子樹,同樣是由樹幹、樹枝、樹葉組成的植物,人們會先透過一些顯著的特徵進行區別,再次細化後會透過樹皮、葉片裂紋等資訊判斷,如果想要再深入一點,還會有花期、種植適宜溫度等,深度學習也是如此。
而隨著訓練資料量以及計算機軟硬體水平的飛速發展,深度學習的規模也逐漸擴大,精度也在不斷提高,在著名的ImageNet競賽上,AI在識別約1000類物體的準確率上已達到95%。當然,也有大量的深度學習模型被不斷地被開發出來,例如:
卷積神經網路
(Convolutional Neural Network, CNN)
第一個解決重要商業應用的神經網路,適用於諸多領域且表現優異。
迴圈神經網路
(Recurrent Neural Network, RNN)
用於處理序列資料的神經網路,能以很高的效率對序列的非線性特徵進行學習 。
遞迴神經網路
(Recursive Neural Network)
主要用於自然語言處理和計算機視覺,與迴圈神經網路不同,它的結構並非鏈狀而是樹狀結構。
生成式對抗網路
(Generative Adversarial Nerwork,GAN)
一種基於可微生成器網路的一種生成式建模方法,主要解決的問題是從訓練樣本中學習新的樣本。
好的模型是深度學習能否成功的關鍵之一,透過這些優秀的模型,人們已在商業領域成功實現了深度學習的部分價值,例如語音助手、刷臉支付、自動翻譯、圖片識別等等。但就在深度學習實現價值的同時,我們可以發現,深度學習的訓練資料量以及引數量也在以驚人的勢頭增長:支撐深度學習,或者說人工智慧的重要因素就是算力規模以及基礎設施。
這堵無形的牆在制約著人工智慧發展的同時,也是促使其逐漸成熟的動力之一。在這方面,作為未來科技領航者的戴爾,擁有十分豐富的人工智慧解決方案以及諸多適用於AI的基礎設施,助力企業在AI時代破浪前行。
例如新一代戴爾PowerEdge伺服器,充分利用最新第三代英特爾 至強 Platinum處理器的優勢,在提供極高可靠性的同時,兼顧高算力、高穩定性和敏捷性,幫助PowerEdge為至關重要的工作負載提供支援,PCle Gen 4.0也極大的提高了吞吐效能;每臺伺服器最多可配置最多六個GPU加速器,能夠滿足嚴苛的資料密集型工作負載。
值得一提的是,戴爾PowerEdge伺服器也擁有強大的自主智慧,其內部嵌入的OpenManage Enterprise系統管理控制檯能夠減少落地步驟,節約開發人員寶貴的時間,幫助使用者實現自主部署、配置以及管理的基礎架構。
當然,訓練人工智慧需要應對各種不同的工作負載,除了算力以外,海量的資料以及資料的實時處理也是人工智慧訓練的重中之重。對此,戴爾PowerScale作為橫向擴充套件的NAS儲存,可在單個檔案系統中擴充套件PB級容量,它搭載的新一代OneFS系統,能夠確保開發人員加快分析速度,更快的獲取訓練結果。
面對極為嚴苛的人工智慧工作負載,戴爾PowerScale可以憑藉強大的自動分層技術以及橫向擴充套件結構,消除傳統儲存解決方案的效能瓶頸,為海量訓練資料及引數提供一致、可靠的效能。
人類大腦的進化是為了適應不斷變化的外部環境以及由其引起的一系列新的挑戰,人工智慧就像人類大腦在新時代的一次全新的進化方向。目前,人工智慧正在以迅猛的勢頭不斷髮展,而戴爾科技也將以自身的科技優勢支援企業在這片未知的領域中不斷前行。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69954543/viewspace-2898512/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 關於AI訓練資料侵權的碎碎念AI
- 預訓練是AI未來所需要的全部嗎?AI
- 都是學 AI,為什麼別人薪資比你高?AI
- 祕籍在手,訓練不愁!特斯拉AI負責人Karpathy的超全神經網路訓練套路AI神經網路
- 告別生硬翻譯!AI谷歌翻譯:讓你的文字"說人話"AI谷歌
- Nature封面:AI訓練AI,越訓越離譜AI
- 都是遊戲代理,為何別人賺錢你賠錢遊戲
- 適合AI訓練的遊戲框架AI遊戲框架
- vue經驗(從別的文章裡拼湊來的,不希望有人看,防止侵權)Vue
- 【人臉識別】Gartner 釋出中國 AI 初創企業報告AI
- 特斯拉AI主管給你的33條深度學習訓練建議AI深度學習
- AI的生態圖景:模型、訓練資料、硬體和人員AI模型
- 換種方式學程式設計:如何訓練你的機器人程式設計機器人
- 國內首個雲遊戲侵權案!騰訊狀告兩家國內公司涉嫌雲遊戲侵權遊戲
- AI打遊戲-肆(模型訓練)AI遊戲模型
- 預訓練模型時代:告別finetune, 擁抱adapter模型APT
- 儲存圖和訓練好的權重
- OpenAI擊敗Dota 2世界冠軍後記:如何訓練你的AIOpenAI
- 【AI】Pytorch_預訓練模型AIPyTorch模型
- 遇到網路問題?別慌!MTR來幫您
- 用Mac訓練個機器人疊衣服,HuggingFace開源全套教程,開源AI機器人革命要來了?Mac機器人AI
- A Memory of Tomorrow: 人工智慧AI,都是反人類的人工智慧AI
- 識別特定影象的AI玻璃來了,未來或可用於人臉識別AI
- 懲罰性賠償究竟是如何讓遊戲侵權者付出更大侵權成本的?遊戲
- 遊戲直播侵權不侵權?廣東高院指引認真讀了麼遊戲
- AI打遊戲-貳(收集訓練圖片)AI遊戲
- 通過NMT訓練出通用的語境詞向量:NLP中的預訓練模型?模型
- 透過NMT訓練出通用的語境詞向量:NLP中的預訓練模型?模型
- 實戰 | 讓機器人替你聊天,還不被人看出破綻?來,手把手教你訓練一個克隆版的你機器人
- 誤刪GreatSQL資料?別慌,Binlog來幫忙SQL
- Epoch AI:硬體佔訓練前沿AI模型成本的47-67%AI模型
- 4分鐘訓練ImageNet!騰訊機智創造AI訓練世界紀錄AI
- Yolov8訓練識別模型YOLO模型
- 聯盟訓練在遊戲AI多樣化的探索遊戲AI
- 萬人齊聚共話AI,WAIE帶你看清AI未來5年!AI
- 雲原生的彈性 AI 訓練系列之一:基於 AllReduce 的彈性分散式訓練實踐AI分散式
- 作為獨立開發者 別人不會告訴你的事
- 如何改善你的訓練資料集?(附案例)