達摩院探訪,機器視覺之髮絲級摳圖技能解析?
視覺技術作為人工智慧之眼還在不斷地認識世界,認識的事物從少到多,從模糊到清晰,從認識到理解。每一階段都是一座里程碑,從人工智慧流行之初,達摩院就對這個人工智慧之眼有著深厚的興趣。本次向大家介紹,達摩院之計算機視網膜修復工程。
摳圖(matting)-作為計算機視覺理解認識事物的第一步,指的是從圖片中精確分割出其中的目標區域,計算機視覺需要從平面,3D等影像中扣出它需要認識的區域並且加以識別,而摳圖的精度則是其識別準確度的基礎,就像手不是人,車輪不是汽車,雲不是天空一樣,很好理解。摳圖的精度通常要求達到髮絲級處理精度,而傳統的摳圖,需要輸入額外的語義資訊作約束,通常為trimap(前景、背景和不確定區域),且互動成本都極大。
達摩院又是如何走出從最佳化到應用的這一質變的過程?
蛻變
傳統摳圖是互動式摳圖,要求輸入trimap作為約束,即已包含有較準備的語義資訊,如下圖2(b)所示,所需估計的是trimap中的灰色區域。對於無互動的人像摳圖,則是直接從輸入影像中不帶任何約束地估計正確的語義資訊及精準的alpha細節。提升模型效果的一個重大因素即大量精準標註的訓練資料,如果訓練資料不充分或分佈不均,極容易導致估計的語義資訊不準從而影響最後摳圖結果的精度,如下圖2(d)所示。據此,達摩院提出了一種在不降低訓練效果前提下最大限度降低資料標註成本的方法,該方法使用了獲取成本較低的粗標註資料,以及部分精度較高的標註資料,實驗結果表明該模型的可以更好的估計語義資訊,同時對髮絲細節的處理精度也很好,如下圖2(e)所示。
圖2: (a)輸入圖; (b)trimap(前景、背景、不確定區域); (c)Deep Image Matting結果; (d)不使用粗標註資料結果; (e)同時使用粗標註資料和精確標註資料結果; (f)真實值。
破繭
為了在精確摳圖中使用非精確標註的資料,達摩院提出瞭如下的網路框架。提出的模型框架分為三部分:粗mask估計網路(MPN)、質量統一化網路(QUN),以及精確alpha matte估計網路(MRN)。該部分的設計理念為:複雜問題拆解,先粗分割(MPN)再精細化分割(MRN)。學術界有大量易獲取的粗分割資料,可以利用起來。但在實操過程中發現,粗分割資料和精分割資料不一致導致預期GAP很大,故而又設計了質量統一化網路(QUN)。MPN的用途是估計粗語義資訊(粗mask),使用粗標註資料和精標註資料一起訓練。QUN是質量統一化網路,用以規範粗mask質量,QUN可以統一MPN輸出的粗mask質量。MRN網路輸入原圖和經過QUN規範化後的粗mask,估計精確的alpha matte,使用精確標註資料訓練。
圖3:演算法框架圖
演算法框架包括三個部分:
- MPN,粗mask估計網路;
- QUN,mask質量規範化網路;
- MRN,精確alpha matte估計網路
實驗結果
Baseline的對比:對比方法包括傳統的matting方法以及最新基於神經網路的方法。訓練資料中包括一半精標註資料,一半粗標註資料。對比方法(除deeplab)由於演算法限制只能使用精標註資料,因而只使用了精標註資料訓練。而達摩院的方法分別用只使用精標註資料以及同時使用精標註資料和粗標註資料進行了實驗。如下圖4結果表明,達摩院的方法在使用了粗標註資料之後,對複雜case的語義資訊估計的要更準確,同時細節資訊也估計的更好。
圖4: 實驗結果對比圖
在真實圖片結果的測試結果如下:
圖5:真實應用場景下人像摳圖的效果
達摩院的方法還可以應用到資料的精細化中,如果給定了粗 mask,輸入達摩院的 QUN+MRN 網路,可以直接得到精細化之後的資料,如下圖 6 所示,達摩院分別對公開資料集 coco 和 pascal 中的人像資料做了精細化。另外,達摩院也將達摩院的方法應用到其他類目的分割當中去,如商品分割、頭像分割等,也取得了不錯的效果,如圖7所示。
圖 6: 粗標註資料用達摩院網路進行 refine 後的結果
圖 7: 其他場景的分割效果
化蝶
當一個技術在精度上有了質的提升,並且解決了成本問題,那麼它就達到了應用的門檻,達摩院將上述方法擴充到了商品、動物、汽車等行業做主體分割,並將技術落地成應用遍佈市場,單阿里巴巴集團內已覆蓋 9 大 BU(優酷、淘寶、天貓、CBU/ICBU、阿里健康、Lazada、影片雲、釘釘、支付寶)9 大 BU,魯班場景的商品摳圖轉化率高達 80%+。
阿里雲視覺 AI 開發者創意應用賽向社會各界免費開放所有視覺 AI 技術介面,如人像分割、商品分割、頭像摳圖等。開發者可以任意使用達摩院的技術打磨自己的產品,或者將自己的產品在大賽中展出,作為主辦方,阿里雲將會為優秀的作品對接創業資源和孵化環境,更有總計近百萬的獎金和獎品等你來拿。
體驗地址:
大賽平臺: https://developer.aliyun.com/ai/activity/viapi?spm=a211p3.14921014.J_2252694630.5.514a46a07ZMiqM
文章來源: https://developer.aliyun.com/article/765478?groupCode=aliyunmit
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69956605/viewspace-2699342/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 機器視覺系統的典型結構之照明解析視覺
- 機器視覺VisionPro之PMAlign視覺
- 線上摳圖網站速摳圖sukoutu.com全面技術解析之canvas應用網站Canvas
- 達摩院視覺AI課程重磅上線,多種AI應用場景精彩紛呈!視覺AI
- 【機器視覺】機器人及視覺檢測系統在螺絲檢測包裝生產線上的應用視覺機器人
- 達摩院以色列實驗室引入世界級AI科學家,構建機器智慧全球研發網路AI
- 【機器視覺】FANUC機器人視覺功能詳解;智慧工廠對機器視覺有啥需求?視覺機器人
- 達摩院:2020十大科技趨勢
- 達摩院:2022十大科技趨勢
- 達摩院:2023十大科技趨勢
- 達摩院:2021十大科技趨勢
- 機器視覺相比智慧生物視覺的區別視覺
- 視覺化圖形制作之關係圖視覺化
- 探祕金融級雲原生髮布工作負載 CafeDeployment負載
- 阿里達摩院:2019十大科技趨勢阿里
- 【機器視覺】基於機器視覺的工業機器人定位系統;機器視覺技術在印刷包裝行業中的應用視覺機器人行業
- 大規模整合Transformer模型,阿里達摩院如何打造WMT 2018機器翻譯獲勝系統ORM模型阿里
- 阿里達摩院連夜研發智慧疫情機器人,已在浙江等多地免費投用阿里機器人
- 來聽聽達摩院技術專家是怎麼講智慧外呼機器人技術機器人
- Finder Windows for Mac(訪達視窗查詢器)WindowsMac
- 資料視覺化圖表之折線圖視覺化
- CCD視覺上料、機器人擺盤、視覺擺盤視覺機器人
- 剛上線的阿里達摩院官網,從前端角度看圈點之處阿里前端
- 機器視覺應用例項視覺
- 機器視覺原理及特點視覺
- 正在消失的機器視覺公司視覺
- 達摩院懸壺,看醫療 AI 如何濟世AI
- 從達摩院想什麼,到阿里要做什麼阿里
- 雷達探測,無人機探測,無人機干擾原理及國內外情況解析無人機
- telegram髮卡機器人機器人
- 阿里達摩院機器人“穀神星”上崗 能幫餐廳服務員幹80%體力活阿里機器人
- 機器視覺(12)淺說機器視覺系統概述及其國內外的現狀視覺
- “中國芯”雄起!阿里達摩院自主研發AI晶片阿里AI晶片
- 達摩院:2022十大科技趨勢(附下載)
- 公佈!達摩院2020年十大科技趨勢
- canvas畫素點操作 —— 視訊綠幕摳圖Canvas
- Mac圖片摳圖軟體InPixio Photo Cutter輕鬆摳圖Mac
- 知識圖譜的器與用(一):百萬級知識圖譜實時視覺化引擎視覺化