從使用者需求來看,人工智慧基礎資料採標服務市場需求主要來源於自動駕駛——包括車內駕駛艙以及車外道路環境感知等場景、AI技術提供商和智慧安防。此外,網際網路行業、智慧終端行業也依然是AI基礎資料服務的投資主體。隨著傳統行業對人工智慧技術的引入,金融、醫療、工業領域也開始在垂深場景的AI應用中引入資料採標服務。發展到現在,市場對於AI基礎資料服務的需求已基本清晰:標註質量要高、標註效率要快、知識經驗要多、資料安全有保障、整體成本具有較高價效比。
當前人工智慧資料服務市場的產業鏈並不冗長,市場參與主體(下圖所示)主要為已成規模的資料標註服務商。當然,在資料標註平臺背後,還存在諸多提供資料採標服務的小型團隊。隨著傳統行業開始自研AI,傳統的人力資源服務商也開始參與市場競爭。隨著市場的競爭,規模化效應將更加突出——成規模的平臺型廠商將佔據越來越高的市場份額。
根據IDC追蹤的人工智慧基礎資料採標服務市場規模,在2020-2021H1的市場格局中,百度在中國AI基礎資料服務市場持續保證市場份額第一;其次是海天瑞聲。其他值得關注的廠商包括雲測、Appen、龍貓資料、資料堂、標貝資料等。
資料採標需求範圍更廣:資料採標服務需滿足的AI應用場景比以往明顯更加廣泛。
資料標註精度要求更高:在自動駕駛等諸多場景中,為進一步提升AI系統的準確度,要求資料標註精度不斷提升。
交付效率要求更高:快速變化的市場環境要求企業必須提高研發效率,進而對AI基礎資料的交付效率也提出更高要求。
資料標註複雜度提升:隨著AI應用場景日益融合、複雜,對資料標註的難度和複雜度也帶來了一定的挑戰。有經驗有實力的企業才能適應這一市場變化。
資料安全相關風險:根據法律規章的更新要求,及時調整現行業務開展方式、資料安全管理體系等。
標註人員培養模式轉變:過去通過扶貧、再就業、產學研等方式快速降低了人工標註的成本,需要進一步探索職業教育、優化標註工具。