自建資料標註團隊,品牌資料服務商的下一個戰略高地丨曼孚科技

曼孚科技發表於2020-06-09
自建資料標註團隊,品牌資料服務商的下一個戰略高地丨曼孚科技

隨著AI商業化程式的加快,更具前瞻性的海量資料集產品和高度定製化服務成為了AI基礎資料服務行業的主要服務形式。這對資料服務供應商的資料交付能力提出了新的要求。

目前,資料標註行業主流的業務進行方式主要有三種:供應商轉包模式、眾包模式、自建團隊模式。

一.轉包模式

轉包模式的運作方式是資料供應商接到專案後,將專案分發給合作的供應商來進行專案的執行。

這種運營方式的主要優勢有:

1. 運營風險小。透過將專案分發給供應商,有效規避資料斷檔等問題;

2. 成本可控,現金壓力小。轉包的結算方式都是以實際資料交付量來計算,支出成本比例較小,且無需承擔標註團隊工資,現金壓力很小。

但是轉包模式也存在很多問題:

1. 資料質量問題。轉包模式下,資料標註質量的高低主要由供應商決定,如果供應商在管理培訓上存在問題,那麼將很難保證資料集的質量;

2. 工期無法保證。資料標註行業具有從業人員高流動性的特點,供應商容易出現缺人的情況導致專案的延期。

二.眾包模式

眾包模式是將個人以及供應商整合到一個平臺上,完成一個專案的模式。

這種運營方式的主要優勢有:

1.靈活適配專案需求,為特定的專案配置相應的專業人員;

2.成本低,直接對接標註員,不存在中間商。

存在的問題主要有:

1.質量難以把控。眾包模式下,標註員的整體素質難以把控,很容易出現各種質量問題;

2.現金流壓力大。平臺的運營以及人員的留存需要投入大量的費用;

3.工期難以保證。個人參與到專案中,很難統一有效管理,工作時間也很難統一,專案延期情況嚴重。

三.自建標註團隊

自建標註團隊是資料服務商建立專屬的資料標註團隊,統一進行管理,由自建團隊完成所有標註任務的一種模式。

自建資料標註團隊,品牌資料服務商的下一個戰略高地丨曼孚科技

曼孚科技標註團隊

這種運營方式的主要優勢有:

1.資料質量高。自建標註團隊在內部培訓管理方面有著得天獨厚的優勢,且不存在中間商,需求轉達更為明確,資料質量有保證;

2.標註效率高。自建團隊內部人員穩定,組織架構明確,可以高效的完成既定任務。

但自建團隊也有一定風險,主要體現在專案斷檔情況下的成本控制問題等。

四.自建標註團隊才是資料服務商的未來

目前資料標註行業常見的專案執行方式主要以轉包模式和眾包模式為主,絕大部分資料服務商並沒有將自建標註團佇列到發展規劃之內。

然而轉包模式與眾包模式在資料質量以及標註效率上存在很大問題,尤其在AI大規模商業化應用的大背景下,較低質量的資料集以及較低的標註效率已經嚴重拖累了AI行業的發展,成為了行業發展的絆腳石。

與這兩種方式相比,自建標註團隊顯然可以更好的滿足AI大規模商業化應用的實際需求。透過統一培訓與管理,並在內部建立有效的多層級質量管理體系,不僅可以有效提高標註資料集的質量,還可以大幅提升自身資料服務交付能力。

隨著上一輪AI創業熱潮的平息,需求方市場由粗獷向精細化過渡,專案要求提高、利潤壓縮、管理成本上升等問題迫使了一眾中小型資料服務商提前離場,在未來一到兩年內行業將再次迎來洗牌。

這對於品牌資料服務商的生產力、精細化管理能力、利潤把控能力等都帶來了巨大的考驗,透過自建標註團隊提升自身在質量與效率方面的優勢,提前佈局建立行業深度壁壘,是一眾品牌資料服務商需要著重關注並搶佔的下一個戰略高地。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69956378/viewspace-2697239/,如需轉載,請註明出處,否則將追究法律責任。

相關文章