沒有“好的”資料,AI就沒有未來?聽聽雲測資料怎麼說
算力、模型和資料構成了人工智慧的三要素,過去,我們過多的把目光聚焦於算力和模型上,殊不知,隨著人工智慧的深入,好的演算法和模型已不再是稀有物種, 反而那些被標註好的優質資料成為時下最為稀缺的“黑金”。
“公司的壁壘不再是演算法,而是資料。讓演算法利用足夠的資料,使得產品執行起來。”人工智慧和機器學習領域國際的權威學者吳恩達在發表以“AI is the new electricity”為主題的演講時,就重點強調了資料的重要性。無獨有偶,李開復在清華大學“清華學堂電腦科學實驗班”題為《人工智慧的黃金時代》的演講中也講到了此類觀點,“如果你有壟斷性的大資料,你就會有很大的優勢。”
以上種種,都表明著一件事,即AI的崛起離不開“好的”資料作為地基,這也是雲測資料成立的初衷所在。
溯源雲測資料的AI資料服務之路
“自2011年切入企服市場以來,Testin雲測不斷致力於助力產業智慧化,除了測試業務我們已經成為專業領域的壟斷品牌,專注於AI資料服務的雲測資料也成為資料領域的標杆品牌。目前我們整個資料服務團隊規模已超過1000人,透過標審分離的流程化作業模式和資料安全機制,更好的保證資料的高質量產出和資料隱私性,從而更好地為人工智慧落地提供定製化‘資料養料’。”在接受鈦媒體專訪時,雲測資料總經理賈宇航如是說。
AI資料服務作為一個非標領域,往往需要根據不同行業領域、不同的需求進行特定化的場景定製,而資料標註的過程,規範化、標準化以及可機讀性又不可或缺,這就意味著雲測資料所從事的領域,並沒有捷徑可以走。
早期的資料標註服務門檻並不高,幾個人、幾臺電腦便可展開操作,導致了行業魚龍混雜、同質化競爭等現象,而這時的人工智慧也處在初期發展階段。但當人工智慧駛入深水區,“應用人智慧”聲勢逐漸火熱,相對應的演算法對資料的精準程度和質量要求也水漲船高,就要求著作為AI資料服務的提供者,要為人工智慧提供定製化的、還原應用場景的優質資料。
針對於此,賈宇航告訴鈦媒體,“以人臉關鍵點識別為例,早先的相關資料標註往往用一句話便可描述完它的任務需求,到了現在,已經發展到幾百個關鍵點。通常數量級的人臉資料標註任務,有時候4張A4紙都未必能寫完這些需求,而人臉的資料標註只是眾多領域的任務需求之一。”
龐大資料標註任務量級之下,是當下業內需求端對精準和高質資料的普遍共識。
這就要求著資料服務要在資料標註和採集上下足功夫,而小團隊的能力範圍則顯得捉襟見肘。迴歸到資料標註面向多領域這件事的本質時,你又會發現,光靠人多或者說採用“眾包”模式往往只能解決量的需求,資料標註人員是否能統一化協同管理以及是否具備相關領域知識,才是決定某項資料任務完成質量的好壞。
同時,這也是雲測資料當下正專注的事情。正如醫生可以標註得好ct診療片,而云測資料團隊在進行自動駕駛車外環境資料標註時發現,那些能夠快速、精準進行資料標註的人員往往擁有駕駛經驗。
雲測資料快速成長的秘訣是什麼?
至此,我們還需要思考一個問題,為什麼雲測資料能做到且做好AI資料服務?
透過觀察Testin雲測的發展歷史,我們便能找到答案。
自2011年Testin雲測成立到現在,已經為全球超過百萬的企業及開發者提供服務,積累了豐富且完善的技術能力和流程化管理能力。而云測資料AI資料服務正式開展於2017年,換句換說,Testin雲測的資料業務線從一出生便擁有7年企業服務所積攢的經驗,並繼承了行業獨立第三方的角色,天然的“以客戶為中心”的企服基因是雲測資料區別於同行的最大護城河,而客戶最為關鍵的訴求則是“降本增效”。
“與企業服務在美國環境更側重標準不同的是,中國更重服務,透過這麼多年的觀察我們發現,是否能切實滿足使用者的真實需求,其實是一個非常重要的點,並不是說企業一定要做出一個平臺或者一個工具,更多是從企業或行業需求出發,構建對應的服務模式。”賈宇航對鈦媒體補充到。
以新零售門店巡檢為例,通常來說,每個門店每月都要巡檢一次,門店巡檢模式是讓一個人拿著調研表去盤點,隨著人工成本的增加,而門店數越來越多現實情況,已經讓這成為一筆不小的開銷。透過引入AI資料服務,現在工作人員可以拿一個手機APP直接巡檢,物品的數量、sku的數量以及對應的sq數量,都能一目瞭然。
“從不同客戶反饋得知,透過我們雲測資料的資料標註服務而落地AI產品的企業,可為企業減少大概1/3的人工成本。”賈宇航如是說。
門店巡檢只是案例之一,就目前來說,雲測資料主要關注智慧駕駛、智慧城市、智慧金融和智慧家居幾大方向,這也是當下市場需求最大的幾個領域。面對不同的資料領域,雲測資料透過流水化作業,將各個環節打造成不同模組,並配合自己的流程管理工具,最佳化人員管理、資料採集、資料清洗和資料標註的各個環節流程,確保內部的持續高效能運轉,最終保證AI資料高質產出。
根據IDC調查顯示,目前中國大資料發展處於應用落地階段,整個市場預計未來五年將保持持續增長的趨勢,年複合增長率將達到17.3%。而得益於人工智慧、5G、區塊鏈、邊緣計算的發展,未來多方技術融合,資料增長必然呈現井噴態勢,資料採集和標準業務作為其伴生體,必然有較大的增長空間。
得益於對AI趨勢的判斷,Testin雲測認為,“人工智慧正在逐漸往應用人工智慧”方向發展,因而云測資料在成立之初,就確定了定製化“精準高質、獨立安全”業務方針。本著這張“王牌”,雲測資料部門迅速擴充,在以往企業服務經驗的完美嫁接之下,最終讓雲測資料成為AI資料服務領域的頭部企業。”
“雲測資料業務規模量每年都在以倍數的規模增長,這也與我們所處賽道的市場深度息息相關,在我看來,整個市場仍然呈現非線性的幾何增長態勢,還有很多機會蘊含其中,有待挖掘。”談及雲測資料業務線發展狀態時,賈宇航如是說。
“安全”是AI資料服務提供商繞不開的命題
機會之下,企業端在提供優質資料的同時,也要注意資料服務過程中的規範和安全。
在這方面,雲測資料透過自建資料採集實驗室和自建資料標註基地的方式,規範管理專職資料服務團隊。這種措施除了保證標註資料的質量和效率,也最大限度地保證了資料產出的安全隱私性。
賈宇航對鈦媒體強調到,雲測資料自伊始便將資料安全放在首位,集中表現在以下幾個方面:
第一,不濫用資料,資料交付後清毀資料不留底,絕不二次使用;第二,不侵犯隱私,與所有資料採集的使用者都簽訂資料授權協議,確保AI企業用於訓練的資料合法合規;第三,建立相關的資料保障機制,如從防火牆的設定、內部資訊系統的管護、乃至標準化的流程作業體系等。
正如Testin雲測CMO張鵬飛多次強調:“即便說雲測資料從安全到隱私防護這套體系會加重運營成本,但從我們行業大局發展來看,只有以這種負責的態度來執行工作,我們的行業才能‘良幣驅除劣幣’。”
來源:消費日報網
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946594/viewspace-2668532/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 沒有審計系統就沒有資料庫安全資料庫
- 監聽狀態正常,但是資料庫不能連線,提示沒有監聽....資料庫
- Hadoop沒有消亡,它是大資料的未來Hadoop大資料
- 為什麼沒有“小資料”大資料就毫無意義?大資料
- golang有沒有好的AI框架?GolangAI框架
- 你沒有大資料大資料
- 有沒有辦法取得所有的資料來源
- PLSQL Developer 客戶端沒有TNS監聽,無法連線資料庫SQLDeveloper客戶端資料庫
- 有沒有大佬知道這種資料應該怎麼抓取呀?
- 幽默:沒有資料庫的架構來了資料庫架構
- jboss不支援client利用資料來源取得資料庫連線?有沒有好的解決辦法?client資料庫
- 資料治理到底治什麼?有沒有前景
- 關於用AI搞金融這件事,瞎BB吹上天沒用,聽聽實戰的人怎麼說AI
- 前端JavaScript的前景如何?有沒有未來?前端JavaScript
- AI騷擾電話,沒有洩露就沒有傷害AI
- 沒有需求就沒有軟體 (轉)
- 沒有介面就沒有設計模式設計模式
- 有沒有在南昌的小夥伴,就業怎麼樣啊就業
- 有沒有什麼程式設計師和產品經理聽的歌?程式設計師
- 聽說"快應用"了沒?
- Element表格資料沒有重新渲染
- Toapi - 再也不愁沒有資料!API
- 資料庫中沒有外來鍵的9個理由資料庫
- 如何成為一名資料科學家?聽聽來自Netfix的老司機怎麼說資料科學
- 有沒有動態建立資料表的輪子?
- 又來勒索,有完沒完-資料庫安全指南資料庫
- 恐怖遊戲的當下和未來?來聽聽Gamera和製作人們怎麼說遊戲GAM
- 資料清洗太難了?那是你沒有好工具,讓Smartbi來幫你!
- Filecoin在未來是沒有競爭者的獨角獸丨星際資料
- 有沒有完全自主的國產化資料庫技術資料庫
- v$blocking_quiesce 沒有資料BloCUI
- 鍵值資料庫與關聯式資料庫有沒有融合的可能?資料庫
- 聽說你的物件有個”環“?怎麼發現的呢?物件
- ArcMap的mxd檔案沒有資料、顯示感嘆號怎麼辦?
- 沒有光模組就沒有光通訊,真的嗎?
- 學習Java虛擬機器沒用? 聽聽當事人是怎麼說的!(skycto JEEditor)Java虛擬機
- 沒有大資料在手,該怎麼為NLP應用深度學習?大資料深度學習
- 沒有儲存的word文件怎麼找回來 恢復沒有儲存的word文件