人工智慧新應用:英特爾讓你妙變藝術大師

玄學醬發表於2018-04-17

許多孩子天生就是藝術家,他們的蠟筆畫被父母掛在冰箱上。隨著年齡漸長,他們往往失去用藝術表達自我的自由靈感。當一個同事說她整個週末都在塗塗抹抹時,大部分人不會認為她在畫畫,而是以為她在粉刷房屋。

讓手機攝影愛好者能夠把自己的照片與名畫模式相融合,從而創造出獨一無二的數字藝術作品,這種天生的才能是人工智慧(AI)設計師植入 Pikazo應用的一個特點。

  Pikazo圖片  

 Pikazo圖片  

Pikazo是在被其創始人稱作“深度神經網路”的基礎上開發的,這是一個模仿人腦和神經系統的計算機系統。充分利用人工智慧並通過強大的英特爾計算效能而實現,這款應用讓人們重新獲得自己與生俱來的創造力並創作出具有大師風範的藝術作品。

與那些在人們記憶中轉瞬即逝的Snapchat或Instagram圖片不同,Pikazo所創作的作品更像是藝術品。

Pikazo聯合創始人Noah Rosenberg表示:“人們會說:‘哇哦,我想再看看這幅圖。’”

Pikazo之所以獨特,是因為它不只是對圖片進行過濾。相反,這款應用的神經網路會以意想不到的方式重新安排原始圖片的元素——就像把面孔重鑄到抽象肖像中。

Pikazo利用這種神經風格傳輸演算法,把一個圖片的風格融合到另一張圖片中,從而創作出全新的作品——這個作品既有兩幅原始圖片的神韻,但是又與原圖有天壤之別。

來自人和機器的藝術——它的運作原理是什麼

Pikazo應用融合的兩張圖片,一張圖片是“被畫的”主題(例如一張自拍),另一張圖片則顯示畫圖的風格——可以是達芬奇的《蒙娜麗莎》也可以是畢加索的立體主義風格。

Rosenberg解釋道:“如果我給它一張我的圖片,再給它一張梵高的《星空》,它就會把這兩張圖融合到一起。”

  原始圖片  

 原始圖片  

這就是它的運作原理。神經網路,或者模仿人腦的軟體,包含經過訓練可識別圖片的探測器層。當Pikazo識別一個具體形狀時,它啟用一個特定的神經路徑。檢測器層讓它能夠對一幅圖片進行深入理解。

  Pikazo圖片  

 Pikazo圖片  

英特爾優化Torch深度學習框架 助力Pikazo實現飛躍性突破

Pikazo的程式碼最初充分利用Visual Geometry Group和Torch現有的開源神經網路專案,這個機器學習框架可通過圖形處理單元(GPU)來渲染圖片。

這也是一個複雜的流程,神經網路必須執行在雲中,而不是使用者移動裝置上。在雲中可用的GPU只允許Pikazo處理300萬畫素的圖片,需要花30-45分鐘來建立,而渲染一張3.5兆的圖片需要大概一個小時,這也幾乎是GPU可以渲染的極限,這動輒數十分鐘的渲染時間無疑非常影響使用者體驗。

為了尋找一個能夠縮短渲染時間的解決方案,Rosenberg找到了英特爾。

英特爾幫助Pikazo遷移其神經網路程式碼庫,使其執行在英特爾至強處理器和英特爾雲服務上。並幫助其對Torch進行優化,實現飛躍性突破,

通過優化的軟體,Pikazo能夠不再依賴那些用來為應用生成藝術作品的昂貴的專用硬體。降低成本意味著Rosenberg能夠降低通過該應用建立更大的海報尺寸版本的藝術作品的成本,從而大大加速了Pikazo的廣泛普及。

正如Rosenberg所說:深度學習框架Torch的優化使得我們的成本降低了14倍,把在英特爾CPU上處理高解析度圖片的時間從超過1個小時縮短到大約5分鐘。縮短低解析度圖片的處理時間也降低了免費處理圖片的開銷。大大提升的響應速度和更低的成本已經大大改善了Pikazo的業務。例如,Pikazo在2016年8月4日的一週內就處理了超過20萬張圖片。

Pikazo免費建立基本圖片,並銷售可建立更高解析度影像的增強功能。一開始,高清圖片的價格是15美元。現在,使用者只需花1美元就能創作高清圖片。

這幫助Pikazo增加了使用者群並擴大了藝術創作的規模。Pikazo最初生成的圖片列印出來只有3英寸——比智慧手機的螢幕還小。Rosenberg說,現在Pikazo的記憶體容量足以支援大得多的圖片。

Pikazo的成功,是英特爾積極佈局人工智慧領域的有力驗證。英特爾公司軟體與服務事業部副總裁開發者及產品部總經理Bill Savage 表示:為了推動AI應用的普及,英特爾注重開拓行業上游市場,增強行業影響力。而通過與開發源頭的軟體所有者合作,能夠幫助其改善和優化產品,從而引導人工智慧社會效益最大化。

英特爾正充分利用自身技術和產品創新的整合優勢,為人工智慧提供全面的、極為靈活的端到端解決方案產品組合:構建於業界領先的基於英特爾架構的涵蓋至強處理器、至強融核處理器、Nervana平臺和FPGA、Omni-Path網路、3D XPoint儲存等技術的硬體平臺,結合英特爾針對深度學習/機器學習而優化的英特爾數學函式庫(Intel® MKL)、英特爾資料分析加速庫(Intel® DAAL)等,和致力於為多節點架構提供卓越效能的開源軟體框架如Spark、Caffe、Theano以及Neon等,及可推動前後端協同人工智慧發展佈局的Saffron、TAP、Nervana 系統、Movidius等工具和平臺,以上這些產品組合將最終幫助廣泛的行業和企業更方便地獲取、開發和部署人工智慧應用,將人工智慧潛能在各個領域中充分釋放,如智慧工廠、無人駕駛汽車、體育、欺詐檢測、生命科學等等。

本文出處:暢享網
本文來自雲棲社群合作伙伴暢享網,瞭解相關資訊可以關注vsharing.com網站。


相關文章