大資料

不斷過濾清理資料,直到確保它的正確性的日子已經逐漸成為奢望,尤其是當IT部門需要以更快的速度和更多的靈活性來響應業務部門的需求時。但是,提供實時資料的使用也讓CIO們產生了一個基本問題:資料究竟如何才算正確呢?

Farzad Mostashari,美國衛生和公眾服務部的,前衛生資訊科技的國家協調員,就曾經論證瞭解決錯誤資料的方法就是更多的錯誤資料。在去年夏天舉行的一個資訊質量會議上,他曾經說過,不斷增加的資料“為你提供了上下文,”。其他專家,比如Michael Berry,Trip Advisor網站的業務運營分析總監,則認為並非如此。他在去年秋天的預測分析大會上說,他認為並不需要擔心資料的正確性,因為他們有太多的資料“肯定就是錯誤的,”。

Greg Pfluger,American Family Insurance公司的資訊系統副總裁,則有不同的觀點。在本期專家訪談中,Pfluger在麥迪遜,威斯康星州舉行的Fusion 201 4CEO-CIO Symposium研討會上,向CIO們和IT主管們就此進行演講,並回答相關問題:更多的資料還是正確的資料?

GregPfluger:這有可能是未來五年內,IT界將不得不面對的關鍵問題之一。我們擁有大量的不斷湧現的外部資料來源,因為各種業務需求我們需要整合這些資料–但有時我們並不清楚這些資料僅是作為資料的一部分,還是這些資料要求高度正確性。我並不認為通過這次的討論,我們可以從行業標準,得出兩個或三個類別的硬性指標,並都以此作為參考。隨著時間的推移,這些類別在不同的業務部門和行業都會不同。我鼓勵IT主管們,自己思考在他們所處的特定分析環境下,應該如何對這些資料進行分類。

例如,CIO可以把資料分成三個類別:類別一,我們並不在意資料的正確性;我們只是試圖讓我們的市場營銷工作做的更好。如果我們的營銷資料從2%上升到3%,我們就是成功的。雖然我們處理的有些資料有些可疑,但是這不要緊。

相比營銷資料,第二個類別,用來針對現有客戶的資料,質量則要更高一些。我敢肯定,我們都會時不時地因為我們的有線電視運營商的服務和定價而感到惱怒。我每個月至少有一次都會因為我的供應商而惱火,因為不知出於什麼原因,他們的老客戶資料庫和當前的客戶資料庫並不匹配。當我從StevensPoint,威斯康星州搬走時,我取消了我的服務,我現在住在麥迪遜,從同一個供應商訂購了新的服務。但現在,他們不斷地嘗試想讓我重新成為他們的客戶-即使我現在已經是他們的客戶。他們向我作為賬單地址的電子郵件賬戶傳送營銷郵件。如此看來,我不能退訂這些郵件,因為這樣我就會收不到我的賬單。他們在一定程度上肯定進行了資料整合,但是肯定沒有完全整合正確,因為他們不把我認為是他們的現有客戶。

第三個類別,當你試圖處理使用者事務時,你需要非常高質量的資料。我最近聽到了一個同事的經歷,由於冬季風暴造成了他的航班延誤。在這期間,Delta航空不斷向他傳送最新的資訊,並且自動為他重新預訂了航班,因此在這之後,他成為了Delta的忠實客戶。現在,他甚至願意為乘坐Delta的航班而支付額外的費用–哪怕航班取消!

新一代的航空公司服務,我敢肯定,將會更加積極主動。他們會知道一場風暴即將到來,然後向乘客提供提前一天的航班,而不加收費用,這樣既幫助你到達目的地,也有助於減少他們系統中的混亂。你可能會很高興收到這樣的電子郵件,為你提供較早的航班離開,也許你甚至願意為此而多花些費用。但如果風暴的資料錯誤,或你的地址是錯誤的,或你的起飛機場是錯誤的,當你收到這個電子郵件時會發生什麼?你會說,‘不對,沒有風暴的預報呀,’這一航空公司就會失去信譽–這一切需要很高的精確度。

IT部門需要思考適合他們自己企業的分類類別,並對每個類別提供適當的資料治理方案和資料質量處理流程。

via:TechTarget