AI巨幕之下,資料不只摺疊

naojiti發表於2018-11-16

在人工智慧的產業鏈中有一個有趣的說法叫“資料摺疊”,說的是訓練演算法需要大量資料,而資料標註就成了一項需求極大的工作,而且又沒有什麼門檻,於是和充滿創造性、高淨值的AI演算法研究不同,資料的標註、清洗、處理等低技術含量的工作被視作新時代的“廉價勞動”,於是在AI的光環之外,這些做資料標註的普通人被摺疊起來。

這個說法其實表達了近年來的一種取向,從大資料熱發展到AI熱,很多人開始忽略了資料本身的價值,而將其看做一個創新含量低的產業,認為資料產業只服從於AI演算法,是其附屬品。


AI巨幕之下,資料不只摺疊


而在我們看來,這種看法是完全錯誤的。AI演算法與資料應用更多是相輔相成的互相作用,在今天與AI技術相結合,資料產業的創新相比以往只多不少。在最近的2018烏鎮世界網際網路大會上,我們一直關注的眾盟資料就登場發言,提出了用智慧商業解決方案協助數字世界的建設。

今天我們就可以以眾盟資料為例,探討在AI時代的大命題下,資料產業面臨著怎樣的機會。

資料的摺疊決定了AI精度,技術的創新則影響AI在哪

我們知道之所以會有“資料摺疊”這一說法,是因為大多數AI演算法模型無限追求精準,所以會利用某一領域的大量重複資料反覆訓練模型,去追求百分之零點零幾的識別度提高。這就好比做一個識別狗品種的演算法,為了讓AI分清柴犬和秋田,不斷為兩種狗的圖片進行人工標註,把希望寄託於神經網路的黑箱。

這樣按照演算法需要去處理資料,的確在技術含量上十分有限。但我們可以發現一個問題——演算法和資料之間,和“雞生蛋與蛋生雞”的邏輯怪圈有些相同之處。AI演算法促進了資料處理的需求,可也只有在某一領域擁有了足夠的資料結構化基礎後,才能讓演算法有用武之地。


AI巨幕之下,資料不只摺疊


例如前文提到的眾盟資料,其特點就是對於線下資料的專注和應用創新,藉以推動商業智慧進入更多線下產業,進而最佳化效率。而AI恰恰是一項注重融合而非顛覆的產業,在今年,AI進入線下場景、與傳統產業相融合成了一個重要命題,這與眾盟資料這些一直專注於線下場景的企業本身的目標是一致的。更重要的是,誕生於實驗室和科技企業中的AI演算法要是想線上下場景高效運轉,就更需要這些企業有線下資料的累積和實體商業智慧化的經驗。

在今年的雲棲大會上眾盟資料曾經展示過新零售智慧商業解決方案,以智慧硬體為入口幫助企業利用自己的線下資料資產,透過線上線下消費行為資料的結合,來推動商業更加智慧化,如智慧運營、AI營銷等。讓實體產業的流量和經營價值得以量化,把以往只適用於網際網路企業和虛擬經濟的技術方法論也賦能給實體產業,這正是透過技術創新幫助AI進入實體產業的最好方式。

如果一味只看到AI當下的需要,就只能做被摺疊起來的資料標註工,幫助AI提升0.0001%的準確率,但如果能押注未來的產業發展並進行創新,就能像眾盟資料這樣,影響AI可以在哪兒生長。

讓AI進入細節,誰在做巨頭們來不及做的事?

科技巨頭爭相擴充套件AI版圖已經是不爭的事實,在他們的生態版圖中,資料產業往往是“被支配”的下游產業(這也成了資料摺疊的又一個論據),而從線上的內容、電商、社交,到線下的零售、工業、城市……無一不被他們列入AI賦能的規劃之中。

不過其中的問題在於,巨頭們出於戰略考慮,通常會將更多的精力投入到大企業或者說大場景之中。而那些中型企業包括小型企業,同樣有著強烈的技術升級需求,可巨頭們卻對於他們的需求沒有足夠深入的理解,也沒有足夠的人力去了解他們的需求。就像家樂福、永輝這樣的零售巨頭,其AI化進展一定有很多科技企業關注,可那些地方性的連鎖超市,卻很難得到科技巨頭的關注。矽谷一直在呼籲AI民主化,也是在鼓勵讓不同規模的企業都能夠獲得同等的技術升級機會。


AI巨幕之下,資料不只摺疊


眾盟資料聯合創始人&COO楊海玲在烏鎮世界網際網路大會上也提到了這樣一種現象,其實每一家服務於線下的企業、門店都有源源不斷的資料,但是企業缺乏技術和工具來應用這些資料,對於自己的使用者知之甚少。

這時眾盟資料這種一直服務於線下場景,自身又有足夠AI能力的創業企業,就承擔起了重要的作用。這一類企業本身就維繫著傳統企業、線下軟硬體創新和資本流動的小生態,如今更可以藉此引導AI技術流入線下產業的細節部分。例如眾盟資料推出的資料AI化功能,就可以幫助不同規模的線下企業應用上智慧運營、AI營銷等功能模組,這些AI技術本身就來源於眾盟資料多年來對線下場景和傳統企業賦能的累積,現如今自然可以更好地為他們提供AI服務。

資料產業的關鍵時刻,怎樣找到開啟數字世界的關鍵鑰匙

如今的資料產業,其實正處在一個微妙的時間點上。

首先,數字世界的打造在即,AI產業的發展急需線上下場景中尋找到落腳點。當我們把AI技術看做新時代的“水電煤”時,就已經認定了這項技術不可能僅僅應用於線上場景。但線下世界是混亂而無序的,對於更加適用於結構化資料的AI技術來說,單憑自己的力量去開墾線下場景,無異於是一項不切實際的工作。

同時我們也發現,實體經濟對新技術翹首以盼,非常期待接入AI的力量。透過長時間對實體企業和傳統企業的接觸,我們能明顯感受到他們的“技術恐慌”,經歷過網際網路經濟的融合發展,大多數實體企業已經看到了技術如何在經濟體之間拉開距離。對於他們來說,AI是一個絕好的機會。

而資料產業,本該作為兩者的連線者,如今卻又被分割在外獨立存在。有些資料企業被默默摺疊,成為AI技術的下游工廠。而有些資料企業卻只能服務線下,不具備技術上的創新能力。


AI巨幕之下,資料不只摺疊


眾盟資料如今把握的機會,就是站在交點中間,對於三者的捏合。向上融合更多AI技術能力,向下感知線下企業的切實需求,核心部分則是豐富的資料應用累積。

也就是說,資料產業面臨的是一副難得的“三花聚頂”,能否打出這手好牌,就看誰能真正把握技術、感知需求並且勇於創新。

我們相信AI時代的大幕之下,資料產業絕不僅僅只有摺疊一種形態,相反則是打造數字世界的關鍵角色。而對於新技術的挖掘與創新,則有著亙古不變的主角光環。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2220432/,如需轉載,請註明出處,否則將追究法律責任。

相關文章