在資料隱私保護條例不斷完善、國家大舉培育資料要素市場、資料流通持續改善的今天,IDC首次釋出中國人工智慧基礎資料服務市場追蹤報告。報告預測,到2025年,中國人工智慧資料採標服務市場規模將達到123.4億元人民幣。市場的發展驅動力一方面來源於人工智慧市場的迅猛發展,另一方面來源於行業使用者加大資料採集力度。

市場構成

從使用者需求來看,人工智慧基礎資料採標服務市場需求主要來源於自動駕駛——包括車內駕駛艙以及車外道路環境感知等場景、AI技術提供商和智慧安防。此外,網際網路行業、智慧終端行業也依然是AI基礎資料服務的投資主體。隨著傳統行業對人工智慧技術的引入,金融、醫療、工業領域也開始在垂深場景的AI應用中引入資料採標服務。發展到現在,市場對於AI基礎資料服務的需求已基本清晰:標註質量要高、標註效率要快、知識經驗要多、資料安全有保障、整體成本具有較高價效比。

市場生態

當前人工智慧資料服務市場的產業鏈並不冗長,市場參與主體(下圖所示)主要為已成規模的資料標註服務商。當然,在資料標註平臺背後,還存在諸多提供資料採標服務的小型團隊。隨著傳統行業開始自研AI,傳統的人力資源服務商也開始參與市場競爭。隨著市場的競爭,規模化效應將更加突出——成規模的平臺型廠商將佔據越來越高的市場份額。

市場格局

根據IDC追蹤的人工智慧基礎資料採標服務市場規模,在2020-2021H1的市場格局中,百度在中國AI基礎資料服務市場持續保證市場份額第一;其次是海天瑞聲。其他值得關注的廠商包括雲測、Appen、龍貓資料、資料堂、標貝資料等。

展望未來人工智慧行業發展不斷湧現出新技術新趨勢,例如聯邦學習、大模型等都對AI基礎資料採標服務提出新要求:

資料採標需求範圍更廣:資料採標服務需滿足的AI應用場景比以往明顯更加廣泛。

資料標註精度要求更高:在自動駕駛等諸多場景中,為進一步提升AI系統的準確度,要求資料標註精度不斷提升。

交付效率要求更高:快速變化的市場環境要求企業必須提高研發效率,進而對AI基礎資料的交付效率也提出更高要求。

資料標註複雜度提升:隨著AI應用場景日益融合、複雜,對資料標註的難度和複雜度也帶來了一定的挑戰。有經驗有實力的企業才能適應這一市場變化。

資料安全相關風險:根據法律規章的更新要求,及時調整現行業務開展方式、資料安全管理體系等。

標註人員培養模式轉變:過去通過扶貧、再就業、產學研等方式快速降低了人工標註的成本,需要進一步探索職業教育、優化標註工具。

IDC中國助理研究總監盧言霞表示:“ 市場競爭瞬息萬變,引入AI基礎資料服務有助於幫助企業快速進入AI模型開發。在選擇外部資料採標服務時,確保基礎的資料安全保障的同時,亦應多考慮標註質量、標註效率、知識經驗的積累,也應考慮為AI構建專有資料集管理系統。”