在這個特別日子裡,舉國歡慶,什麼都可以缺席,大禮包不行。
本次開源針對CelebAMask-HQ中髮絲部分進行細化的資料集。
該資料集可用於髮絲分割等方向的研究和探索。
在過去的一年時間裡,疫情改變很多人的工作和生活,
博主自然免不了也成為其中一員,非常有幸成為了一名無業遊民。
不是別的原因,只是覺得過去近一年過得有點蒙圈,暫時稍微停下來休整一下。
過去一年裡,大部分精力,紮在一個讓人頭疼的領域,
手機上實時髮絲級別語義分割裡做研究。
真的好南!
前期看了半年多的論文和專案資料,最後還是決定自己探索,
這裡面最核心的問題就是很多論文的實時效能根本達不到,
當然指的是cpu實時,別扯gpu實時。
不過很多論文的思路還是很好的,很多思路和做法都值得借鑑然後深入思考。
這個過程非常煎熬,經常半夜睡醒,爬起來寫程式碼,然後訓練驗證。
在接近一年左右的不分晝夜地改良,國慶前終於解決最後一個問題。
當然這個工作還沒最終完成,因為博主又開始進行半監督訓練的研究了。
不過第一期目標,已經達到了,最終可以實現在手機端進行實時髮絲級別的語義分割。
髮絲分割這個方向,很多資料集並沒有能很好地細緻到髮絲級別的標註,這就迫使研究困難重重。
所以很有必要存在一個髮絲級別的資料集來推動這方面的研究。
既然沒有人提供,那俺就為大家造一個。
上預覽圖:
由於博主算力有限,目前是租的智星雲GPU雲訓練的模型.
當前開源的這個資料集版本,精度還不夠好,就作為一個嚐鮮版本的資料集放出來給大家玩耍和進行相關的技術研究。
如果有機構或者組織能提供免費的算力資源推進博主的研發,歡迎郵件gaozhihan@vip.qq.com。
後續有時間精力允許的話,
會寫博文,為大家一一展開這個領域下的一些實現細節和經驗見解。
谷歌這個資源,推薦一下,待後續博文展開一些有意思的玩法,敬請期待。
https://github.com/tensorflow/graphics/blob/master/tensorflow_graphics/image/matting.py
CelebAHairMask-HQ 嚐鮮版資料集下載
專案地址
https://github.com/cpuimage/CelebAHairMask-HQ
Version 1.0, early released on 10/02/2020
相關工作
-
CelebA dataset: Ziwei Liu, Ping Luo, Xiaogang Wang and Xiaoou Tang, "Deep Learning Face Attributes in the Wild", in IEEE International Conference on Computer Vision (ICCV), 2015
-
CelebA-HQ was collected from CelebA and further post-processed by the following paper : Karras et. al, "Progressive Growing of GANs for Improved Quality, Stability, and Variation", in Internation Conference on Reoresentation Learning (ICLR), 2018
-
CelebAMask-HQ dataset: Lee, Cheng-Han and Liu, Ziwei and Wu, Lingyun and Luo, Ping, "MaskGAN: Towards Diverse and Interactive Facial Image Manipulation", in IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2020
資料集協議
-
The CelebAHairMask-HQ dataset is available for non-commercial research purposes only.
-
You agree not to reproduce, duplicate, copy, sell, trade, resell or exploit for any commercial purposes, any portion of the images and any portion of derived data.
-
You agree not to further copy, publish or distribute any portion of the CelebAHairMask-HQ dataset. Except, for internal use at a single site within the same organization it is allowed to make copies of the dataset.