資料是新石油,提煉新石油要遵循四個原則

qing_yun發表於2022-03-08

資料是新石油的概念已經存在了很長時間。一般來說,這要歸功於數學家Clive Humby:

資料是新的石油。像石油一樣,資料是有價值的,但石油如果沒有經過提煉,它就不能真正被使用。它必須被改變成氣體、塑料、化學品等,以創造一個有價值的實體,推動有利可圖的活動。因此,必須對資料進行分解、分析,使其具有價值。

資料是新的石油,因為資料可以被用來獲得洞察。根據公司的業務,洞察可以提高客戶留存率、提升銷售、產生新的收入模式、廣告等等。如果資料是新的石油,洞察就是新的財富。

由於計算、物聯網、機器生成的資料等方面的進步,資料量現在正在爆炸式增長。因此,我們被淹沒在資料石油中。我們如何防止石油火災,或與資料有關的火災,更準確地說,如何獲得良好的洞察?

僅僅擁有資料是不夠的。我們需要有一個資料實踐--一套普遍理解和可持續執行的資料管理原則。為了建立一個良好的資料實踐並避免發生與資料相關的火災,組織應該注意以下四個原則:

資料來源(我的資料是從哪裡來的?)

資料比比皆是,但質量參差不齊。一些資料是骯髒的(充滿了錯誤和遺漏)。有些資料是完全錯誤的,還有一些是虛構的。如果依賴公共領域的資料,這一點尤其要注意。一些資料集包含偏見--如果在人工智慧中使用,會給企業帶來重大風險。 正如麻省理工學院最近的一個專案中所概述的,有些只是包含錯誤。要想知道資料所產生的洞察是否有價值,甚至是否安全,對資料的來源有一個紮實的瞭解是至關重要的。

資料隱私(我被允許用這些資料做什麼?)

隨著人工智慧變得越來越普遍--城市、州和國家正在實施關於如何使用消費者資訊的新法律,以及消費者在使用其資料方面有哪些權利。主要的例子是美國加州的CCPA和歐盟GDPR中的 “解釋權”條款。隨著此類法律的增多,人類原始資料的使用者需要特別注意如何使用和保護這些資料。

資料保護(如何確保我不會丟失資料?)

資料隱私是資料保護的一種形式--確保資料訪問受到控制以保護隱私。資料保護的另一個重要方面是確保資料對需要它的人來說仍然可用。資料對公司越重要,資料的丟失對業務的影響就越大(比如,皮克斯因資料丟失事件而差點失去《玩具總動員2》)。

資料準備(如何從原始資料變成有用的資料?)

正如前文所述,原始資料,就像原始石油一樣,並不是非常有用。要想利用資料獲得洞察,就需要對其進行提煉(當以專注於人工智慧的方式進行時,這一過程被稱為資料準備、資料清洗或特徵工程)。擁有一個好的(可複用的)資料準備策略是關鍵。資料準備可以使從資料中產生的洞察力的質量或從資料中訓練的AI的質量有明顯的不同。

以上四項原則共同構成了一個良好的資料實踐的核心:

·出處。知道你的資料從哪裡來

·隱私。知道資料來自誰,以及使用資料時應遵循哪些法律

·保護。不要丟失資料

·準備。知道如何提煉資料,並記住你是如何提煉資料的,以便可以一次又一次地持續這樣做。

隨著商業模式的發展,越來越多的公司可能會發現資料是他們最大的資產,上述原則有助於保護和發展這一資產。

作者介紹:Nisha Talagala,人工智慧領域的企業家和技術專家,也是AIClub的執行長。

來自 “ https://www.forbes.com/sites/nishatalagala/2022/03 ”,原文連結:http://blog.itpub.net/69925873/viewspace-2867327/,如需轉載,請註明出處,否則將追究法律責任。

相關文章