人工智慧資料標註這些年:從幕後到前臺丨曼孚科技
“你瞭解人工智慧行業嗎?”
10個人中可能有9個人會給出肯定的回答。
“你瞭解資料標註行業嗎?”
10個人中可能有9個人會茫然地搖頭。
與處在聚光燈中心的人工智慧科技公司不同,資料標註行業長期處於聚光燈之外的灰色地帶,很長一段時間內都是被邊緣化乃至低視的一個存在。
不過,隨著時代發展帶來需求的改變,資料標註行業也在發生著日新月異的變化,開始從幕後走向前臺。
一.幕後:粗放與混亂交織
資料標註行業裡流傳著這樣的一段話:“有多少智慧,就有多少人工”。
這句話在某種程度上道出了人工智慧的本質。
事實上,現階段讓AI提升認知世界能力的最有效途徑仍然是監督學習,而目前AI演算法能學習的資料,幾乎全部都是透過人力逐一進行標註而得來的。
需求即意味著市場,據相關機構預測,未來幾年,國內資料服務市場將達上百億。
如此龐大的市場規模,讓很多人都想趁機分一杯羹,於是大大小小的標註團隊如雨後春筍一樣大量出現。
然而,問題也隨之而來。
與人工智慧高科技含量不同,資料標註仍屬於勞動密集型產業,且模式通常以外包形式為主。
標註員每天從事標框、拉點等重複枯燥的工作,勞動力水平參差不齊導致產出的標註資料質量偏低,無法滿足AI企業的需求,影響AI產品商業化落地程式。
與此同時,低端產能過低的技術含量,也使資料標註行業幾乎沒有任何壁壘限制,很多標註團隊隨意拉進來幾個人經過簡單培訓就可以接業務了。
這樣的後果就是行業混亂且競爭加劇,絕大部分標註團隊只能存活於產業鏈最底層,壓價情況嚴重,甚至接不到業務導致生存艱難。
二.前臺:AI對於高質量資料的依賴
人工智慧行業內有一個很重要的共識:
資料集質量的高低直接決定最終模型效果的好壞。
換句話說,資料對於模型效能的貢獻是最大的,資料越多越豐富、代表性越強、模型效果越好,演算法的健壯性和魯棒性就越強。
隨著AI企業商業化落地程式的加快,越來越多的企業開始意識到標註資料的重要性。
以自動駕駛為例,目前很多企業都已經生產出自己的無人駕駛汽車樣車,並頻頻出現在公共視野內。
然而,雖然這些樣車在實驗室內表現良好,但距離真正的商用仍然有很遙遠的距離,一個很重要的原因就是真實路況場景與實驗室場景差距過大。
在實驗室內,只需要少量的道路資料即可滿足實驗的需要,但是到了真實的道路上,無人駕駛汽車將會遇到很多無法預知的情況,在沒有足夠資料支撐的前提下,車載電腦無法做出自己的判斷,導致潛在的風險劇增。
因此,以自動駕駛企業為代表的眾多AI企業對資料標註行業提出了更高的要求,資料標註行業已然開始處於聚光燈的焦點,從幕後走向了前臺。
三.未來:智慧化、精細化、場景化
AI資料是人工智慧的重中之重。眾所周知,人工智慧的三駕馬車是演算法、算力與資料,其中資料是人工智慧行業的發展基石。
隨著人工智慧行業商業化落地程式的加快,AI資料服務領域泥沙下沉,清泉上湧,行業變革已初露端倪。未來,智慧化、精細化、場景化將是資料標註行業的主要發展方向。
智慧化,即意味著標註工具AI化。以曼孚科技自研的語音標註工具為例,AI預標註技術可以自動識別轉寫語音資料,標註員只需要在工具預標註的結果上略作修改即可,這在提升標註效率的同時也減輕了對於人力的依賴。
精細化,即意味對標註資料集質量與細節提出了新的要求。以往資料集的準確率可能達到90%以上即可滿足要求,但隨著AI商業化落地程式的加快,AI企業對於標註資料的質量要求達到了95%,甚至99%以上,同時更加註重細節,比如曼孚科技在進行自動駕駛領域資料標註業務時,專案方會對諸如情緒捕捉、疲勞駕駛等等提出更加細節化的標註需求。
場景化,即意味資料標註行業要滿足多樣化應用場景標註需求。以計算機視覺領域為例,目前資料標註可以應用在自動駕駛、無人機、AI教育、工業機器人、新零售、安全防護等場景中。每一個應用場景都有自己的資料型別與具體標註要求,因此極為考驗資料標註企業的場景化標註能力。
可以預見的是,未來幾年資料標註行業將迎來一場大變革,理念更先進、技術更硬核、服務更專業的AI資料服務企業將會把資料標註行業帶入全新的精細化運營時代。
而未來,相信隨著5G技術的逐步應用,資料與5G的結合將碰撞出更多創新火花,共同托起AI發展的基石。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69956378/viewspace-2681697/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 資料標註員:人工智慧行業的“築夢師”丨曼孚科技人工智慧行業
- 如何提高資料標註質量,提供精細化標註資料集?丨曼孚科技
- 人工智慧資料標註領域五大核心需求痛點丨曼孚科技人工智慧
- 資料標註是一塊肥肉,盯上這塊肉的不止中國丨曼孚科技
- 資料標註,自動駕駛汽車的新“引擎”丨曼孚科技自動駕駛
- 機器越“智慧”,資料標註員越容易被淘汰?丨曼孚科技
- 資料標註案例分享:車輛前置攝像頭資料採集標註專案丨曼孚科技
- 資料標註案例分享:搜尋結果相關性匹配標註專案丨曼孚科技
- 資料標註在AI教育領域中的具體應用丨曼孚科技AI
- AI輔助,資料標註行業發展的新引擎丨曼孚科技AI行業
- 資料標註在智慧金融領域中的具體應用丨曼孚科技
- 破局AI落地難,資料標註行業需率先變革丨曼孚科技AI行業
- 資料標註在智慧農業領域中的具體應用丨曼孚科技
- 資料標註在智慧安防領域中的具體應用丨曼孚科技
- 資料標註在智慧醫療領域中的具體應用丨曼孚科技
- 資料標註在自動駕駛領域中的具體應用丨曼孚科技自動駕駛
- 標註案例分享:自動駕駛影像語義分割丨曼孚科技自動駕駛
- 自動駕駛行業的未來由資料標註來撐起丨曼孚科技自動駕駛行業
- “洗牌期”來臨,資料標註企業如何建立深度技術壁壘?丨曼孚科技
- 人工智慧落地難,難在哪裡?丨曼孚科技人工智慧
- 2025年自動駕駛收割時,車企該如何應對資料標註問題?丨曼孚科技自動駕駛
- 自建資料標註團隊,品牌資料服務商的下一個戰略高地丨曼孚科技
- 戰“疫”背後的AI身影丨曼孚科技AI
- 案例分享:新零售商品陳列檢測資料標註專案丨曼孚科技
- 破局自動駕駛落地難,資料標註行業變革是關鍵丨曼孚科技自動駕駛行業
- 一文讀懂車載監控系統中的資料標註型別丨曼孚科技型別
- 演算法應用的三大階段,對資料標註行業的差異化需求丨曼孚科技演算法行業
- 資料採集,AI產業落地的“助推器”丨曼孚科技AI產業
- 提升數十倍工作效率丨曼孚科技如何打造新一代TOP1智慧標註平臺?
- AI資料中臺:企業數字化轉型的加速引擎丨曼孚科技AI
- 曼孚科技完成數千萬元A+輪融資,加速自動駕駛資料標註量產程式自動駕駛
- 曼孚科技:人工智慧,真的需要不少“人工”人工智慧
- 曼孚技術分享:資料標註都在自動駕駛哪些場景落地?自動駕駛
- 2022年,為何港口自動駕駛能“獨善其身”?丨曼孚科技自動駕駛
- 曼孚科技入選IDC中國資料智慧市場代表廠商
- 曼孚科技:時勢造英雄丨疫情之下,無人駕駛將要“出圈”?
- 從幕後到臺前:建築在遊戲設計中的意義遊戲設計
- 3D點雲——自動駕駛前行的推進器丨曼孚科技3D自動駕駛