人工智慧資料標註領域五大核心需求痛點丨曼孚科技

曼孚科技發表於2020-06-16
人工智慧資料標註領域五大核心需求痛點丨曼孚科技

隨著人工智慧落地商業化進入快車道,無人駕駛、人臉識別、智慧安防等領域成為了熱門的應用場景,AI公司關注的重點開始聚焦於產業落地能力上。

作為人工智慧行業的基礎,資料是實現這一能力的決定性條件之一。因此,為機器學習演算法訓練提供高質量的標註資料服務成為了決定人工智慧應用高度的重要條件之一。

相關資料統計顯示,2025年產生的資料量將高達163ZB,其中90%是非結構化資料。這些非結構化資料只有經過清洗與標註才能被喚醒價值,這就產生了源源不斷的清洗與標註需求。資料標註行業因此得以迅速繁榮擴張。

隨著產業落地成為行業發展大勢,更具前瞻性的海量資料集產品和高度定製化服務成為了資料標註行業的主要服務形式。然而,由於資料標註行業存在門檻較低、服務質量參差不齊等問題,需求方在選擇資料服務時往往會遇到資料質量、服務效率、資料安全、管理能力、服務能力等痛點,這些痛點已成為阻礙行業發展的核心問題。

1. 資料質量

監督學習下的深度學習演算法訓練十分依賴於標註資料,資料集質量的高低將直接決定演算法模型的效果。

然而,目前資料標註行業存在很嚴重的資料質量問題。相關資料顯示,當下資料標註行業單次交付達標率低於50%,三次內交付達標率低於90%,遠遠不能滿足AI企業的需求。

需求方希望資料服務公司可以提高首次交付專案的準確率,並大幅減少返工情況。

2. 服務效率

目前資料標註行業主流的專案運營方式是以“眾包”以及“轉包”為主,資料服務企業很難對標註團隊做到直接有效的管理,因此專案延期成為了一種常態。

對於需求方來說,專案延期意味著在激烈的商業競爭中喪失先發優勢,所以對於需求方來說,希望資料服務公司擁有高效的專案執行系統,提高工作效率,可以按時甚至提前完成專案。

3. 資料安全

資料標註行業的特殊性意味著要經常接觸到很多敏感的資料,比如人臉資料、車牌資料等等,這些資料的儲存、傳輸等對於安全性的要求極高。

因此,需求方希望基礎資料服務商有明確具體的安全管理流程,對資料傳輸、儲存,以及結項後的資料銷燬等環節足夠重視。

4. 管理能力

“眾包”以及“轉包”模式下,管理能力較弱的公司很難在兼顧多個專案時做到精力集中、高質量地服務客戶,這樣的後果就是專案延期、資料質量差。

因此,需求方希望資料服務企業能夠建立完善的內部管理流程,最佳化專案流程體驗,達到效率與質量的雙提升。

5. 服務能力

資料標註業務從本質上來講也屬於一種服務業務,從專案對接到最終專案的完結,每一個環節都需要需求方與資料服務企業不斷地商討,從而做出最優解。

所以,需求方希望資料服務公司能夠在專案進行中做到積極配合、快速響應,並可以對專案提出一定的最佳化建議。

以上五點是需求方對資料標註企業的核心訴求,如果這五點分別對應相應分數的話,那麼總體得分越高就意味著越契合需求方的要求,就越能在激烈的競爭中佔據排他性的優勢。

對於資料標註企業而言,單純依據客戶專案的訴求進行執行略顯被動,主觀能動性低、行業邊界有限,各家資料標註企業的產品和服務就將趨於同質化,競爭也會加劇,不僅不利於自身發展,同時也會制約著AI基礎資料服務行業的發展。

所以,主動做出改變,迎合需求方的核心訴求,資料服務企業才能在激烈的市場競爭中建立差異化的優勢,尤其在AI商業化落地加快的大背景下,能夠在垂直場景中建立一套完整的資料整體解決方案,將在未來的市場競爭中增添重要的優勢砝碼。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69956378/viewspace-2698737/,如需轉載,請註明出處,否則將追究法律責任。

相關文章