拋棄李飛飛論文自研演算法,Versa能否打破Prisma們曇花一現的魔咒

王藝發表於2017-12-27

開啟 Versa,很容易讓人想起 Prisma,這個曾經一夜爆紅的影象風格遷移軟體。

它們同樣幫使用者一鍵完成照片的風格化渲染,無論是梵高的「星空」風格、日本風俗畫「浮世繪」風格、還是野獸派代表畫家「Raoul Dufy」風格等。

拋棄李飛飛論文自研演算法,Versa能否打破Prisma們曇花一現的魔咒

圖為 Versa 使用者——設計師蘇澳修作品

儘管產品功能與形態幾乎一致,但 Prisma 等多數同型別產品的底層技術,是基於李飛飛在 ECCV 2016 上發表的論文「Perceptual Losses for Real-Time Style Transfer and Super-Resolution」。

「為什麼 Prisma 做不下去,因為李飛飛不在他們公司啊。」Versa 聯合創始人兼 CTO 趙維傑調侃道。

Versa 想要靠自己的技術來改變爆紅後曇花一現的命運。

在趙維傑看來,他所主導研發的表示理論框架 ConceptNet 技術就是 Versa 的驅動力。今年 4 月上線產品背後同樣使用了風格遷移技術,但僅五個月之後,Versa 又把人景分離技術融入產品中,後者是指將人物與背景區分開來的畫素級技術。

拋棄李飛飛論文自研演算法,Versa能否打破Prisma們曇花一現的魔咒

Versa 人景分離技術實現過程

「所有做深度學習方向人都知道這個東西難,當大家看到我們能把頭髮絲都分出來的這個時候都很驚訝,都覺得我們在這個方向又往前走了一步。」趙維傑說。

根據趙維傑提供的資料,Versa 註冊使用者已超 400 萬,其中不乏專業攝影師的身影,他們使用 Versa 的技術設計海報。

訓練更快、更少資料依賴的 ConceptNet

技術之外,從產品體驗的角度來看,照搬李飛飛論文中的演算法有兩個難以改變的問題:

它適用於風景而非人臉,畫作風格遷移至人臉後會出現面部斜紋以及網格,效果不好;

在影象風格遷移功能之後,無法迭代新功能持續吸引使用者持續使用。

很顯然,大多數中國人更願意自拍。「人臉上全是一道道的斜紋,有網格狀的東西。這種應用在中國根本火不起來,就想要自己做一個。」趙維傑說。

藝術化圖片的處理,本質上和人畫畫一樣,需要有詳有略的手法。在同一種風格下,眼睛有眼睛的畫法,鼻子有鼻子的畫法,背景有背景的畫法,背景要用三分抽象七分寫實的方法去畫。

而趙維傑所說的 ConceptNet 基於表示理論,表示理論著眼於對世界的理解。在表示理論的支援下,ConceptNet 能夠認清人物鼻子、眼睛、嘴巴所在何處。

「Prisma 只是做全域性的紋理替換,我們能做得更好。」趙維傑說。他將 Prisma 的風格遷移技術比做一把大刷子,將照片全部塗抹上某一種風格。

拋棄李飛飛論文自研演算法,Versa能否打破Prisma們曇花一現的魔咒

採用 Versa 技術處理的人像照片

除影象處理效果外,ConceptNet 在訓練速度以及對資料的依賴方面也有優勢。在 Prisma 等其它 APP 的演算法下,實現一種風格的遷移需要至少 8 萬張圖片,8 個小時左右的學習。

但 Versa 整個產品的訓練過程中只用了 100 張訓練圖片,40 分鐘便可收斂,即它將圖片深度學習樣本數量降低了 800 倍。

「以理論作發動機,讓它不斷地產生新應用點,再通過產品打出去」

能夠將這一核心技術應用於 Versa 得益於趙維傑在創業之前的研究積累。2012 年,趙維傑加入華為,任演算法工程師。在華為的前兩年,趙維傑和同事圍繞著表示理論進行了大量的基礎研究。

當時,在華為手機的技術使用場景下,開發人員面臨兩個問題。首先,由於使用者隱私保護條例,華為不能蒐集使用者資訊,因此華為的資料收集能力相對較弱;其次,華為的演算法需要在終端手機晶片上落地,因此演算法需要適應計算能力有限的場景。

這兩個限制被趙維傑稱為兩個「緊箍咒」,也正是由於這兩個「緊箍咒」的存在,ConceptNet 才得以被仔細打磨。

「我們在華為做的事情是這套理論的初級想法,離開之後,我們把這套理論重新整理了一遍,稱之為 ConceptNet。所以說不存在智慧財產權相關的問題。」針對智慧財產權方面的擔憂,趙維傑解釋稱。

拋棄李飛飛論文自研演算法,Versa能否打破Prisma們曇花一現的魔咒

圖為 Versa 使用者——設計師蘇澳修作品

技術儲備為產品功能的不斷迭代準備了彈藥。「C 端產品是我們永不落幕的釋出會。」

產品這一端,與趙維傑是大學室友的 Versa 創始人兼 CEO 蔡天懿有豐富經驗。蔡天懿曾在巴黎微軟任售前工程師,並於 2012 年在矽谷創辦了幫助創業者匹配合夥人的產品 Dreamstorm,兩年後被 EFACTOR 收購。2014 年回國後他加入格瓦拉任產品合夥人,主導了移動端產品的開發。

Versa 具有明晰的三年規劃路線圖,還有很多與影象風格遷移、人景分離類似的小節點正等待逐一上線。一旦這些技術實現有效融合,使用者隨意拍攝的圖片、視訊等內容,都可以一鍵完成藝術化再造。

「對於小公司來說,速度快非常重要。以理論作發動機,讓它不斷地產生新的應用點,這些應用點再通過產品打出去,是小公司能在這個時代贏的最重要的原因。」趙維傑說。

拋棄李飛飛論文自研演算法,Versa能否打破Prisma們曇花一現的魔咒

當前 Versa 團隊

在今年烏鎮世界網際網路大會上,Versa 釋出了面向企業的 OpenAPI,試圖通過企業合作的方式向 C 端使用者賦能。另一方面,為合作伙伴輸出技術解決方案,也為 Versa 實現商業變現提供可能性。

「說到底我們還是希望能賦能整個行業的。」趙維傑說,「我們希望每一個使用者,不論是藝術家還是對藝術不那麼敏感的使用者,都能通過我們的技術創造出藝術作品來。」

事實上,把技術隱藏在產品背後,讓任何人都能在簡單操作下完成內容創作,這一點也是快速打動真格基金創始人徐小平的燃點。

今年 4 月,Versa 獲得了來自真格基金和臻雲創投的 600 萬人民幣天使輪投資;並於 10 月完成了由紅杉中國領投,真格基金、臻雲創投跟投的 3000 萬人民幣等值美金的 Pre-A 輪融資。拋棄李飛飛論文自研演算法,Versa能否打破Prisma們曇花一現的魔咒

相關文章