1470371093-3985-3417eb9bbd59190b915208

 Intetix Foundation(英明泰思基金會)由從事資料科學、非營利組織和公共政策研究的中國學者發起成立,致力於通過資料科學改善人類社會和自然環境。通過聯絡、動員中美最頂尖的資料科學家和社會科學家,以及分佈在全球的志願者,我們創造性地踐行著我們的使命:為美好生活洞見資料價值。

 史丹佛經濟學家解釋電子資料寶庫如何為競爭開創新格局 !

 1470371093-5729-3417eb9bbd59190b906503

大量的資料收集正在改變著組織管理。(Steve Castillo拍攝)

電子資料的激增使得管理者能夠量化並徹底瞭解他們的業務,也就是說他們此用於升級產品或製造出全新的產品。史丹佛大學商學院經濟學教授同時也是微軟和其他科技公司的諮詢師Susan Athey,與《史丹佛商業雜誌》討論了大量資料的收集、廉價的儲存和利用資料寶庫中進行機器學習的這些方面是如何對受網路驅動的新興行業以及傳統商業的管理方式進行改革的。

以下是本次採訪的節選。

問:您是如何看待大資料技術改變矽谷的管理技巧以及之後發展的?

答(Susan Athey, 經濟學教授):“管理者需要理解並且評估分析師的研究結果,他們發現,如果自己不能直接參與管理,就會面臨著遺忘或者遭到遺棄。” 在矽谷,大多數網際網路相關領域的公司都存在著一個顯著的特徵:有著由大資料引起的對新且多樣化技能集的巨大需求。明顯地,必然有對資料分析的大量需求。在分析的範圍內,需要有人撰寫程式碼,從大量的資料來源衝提取資料並整合成有用的資料格式。也需要有人對這些資料進行簡單地分析,同時一些人做更加複雜的統計分析,這其中包含著機器學或計量經濟學的知識,例如建造資料模型可以預測網頁裡的連結哪些會被點選或瀏覽網頁時應該提供給消費者哪些產品。在高科技公司裡,管理者需要理解並且評估分析師們的研究結果,他們發現,如果自己不能直接參與管理,就會面臨著遺忘或者遭到遺棄。在商業常規業務中創造的分析資料之外,一個新領域涉及了管理的大規模實驗平臺以及從實驗中的分析資料。

1470371094-3152-3417eb9bbd59190b909804

 問:我聽說谷歌的專家一年執行成千上萬個實驗,正是實驗中的資料而不是管理人本身決定了公司的方向。事實上,在網際網路公司的一些資料專家傾向於將那些不基於資料的想法和直覺不屑地稱為河馬觀點(hippos),而這也代表著“高收入人群觀點”。您認為這是準確的界定方法嗎?

答(Susan Athey, 經濟學教授):管理模式明顯地正在改變。不僅是谷歌和微軟這樣的大公司,甚至是最小的公司都通過強制的實驗過程改變搜尋引擎的演算法。這也意味著產品只有經過嚴格的統計檢查才可能見到光明。因為公司的核心產品的建立是基於資料管理方式執行的,沒有來自統計學家和資料科學家的評估研究和預測,管理者在財務和商業方面的計劃無法實現其目的。因此,即使是代表資料分析師的MBA們仍需要吃透複雜的分析並且能夠與工程師和產品團隊進行交流,而他們的專業語言就是資料。

就我經驗而言,MBA中能有好的商業直覺並且能夠聰明地運用統計學家語言的都是“搖滾明星”。他們能夠很好的理解資料能證明的什麼、不能證明什麼,並且如何高效地利用資料做決定。他們知道如何利用資料來證明一個觀點,更加視覺化的呈現資訊,將收集的案例放在一起,所有的用來支援主要的結論。擁有這些才能的管理者會被其他公司挖走或在本公司得到快速晉升。他們給予執行報告並且他們是任何重要戰略專案的不可或缺人員。這也是其他行業期望的前進方向。

 問:除了線上執行的實驗,對於商業而言,大資料所帶來的下一個大的改變是什麼?

答(Susan Athey, 經濟學教授):在監測裝置或網站實時獲取與使用者進行相互作用的手機上的資料,並能及時進行機器學習,這也使得公司能夠面對其競爭對手時,提高自身的業績。網際網路公司正在處在基於機器學習自動決策的前沿,但是它在其他領域的應用也會帶來價值。

問:您能解釋一下機器是如何利用大量資料集進行決策工作的嗎?

答(Susan Athey, 經濟學教授):考慮一下機器學習的最終演算法—搜尋引擎。人們查詢的目的是隨時間改變的。如果你今天輸入Amanda Bynes到搜尋框,搜尋引擎會非常迅速的查詢其他人在今天搜尋Amanda Bynes時看到的網頁並點選的內容。今天很重要是因為你想要的必然和昨天不同。

例如,當Michael Jackson逝世時,網路流量猛增,搜尋引擎公司希望能夠在最初的30秒內阻止傳送給人們關於演出者的普通網頁,取而代之的是開始傳送給他們最新的新聞。通過使用最新的資料,一個你想要的眾包資料,一個搜尋引擎可以成為一個快速的學習者。

所有的搜尋引擎都試著這樣做,但是他們能做的多好關鍵取決於他們獲得資料的速度有多快。因此Google會比Bing做的更好,因為更多人首選Google。Amazon可以擊退小的零售運營商。如果你在Amazon中輸入“嬰兒車”,演算法會為你個人找出最好的網頁版本。該演算法使用了一種聯合方式,即確定你是哪種型別的消費者,以及像你這樣的消費者在過去一段時間裡的點選內容。

當我和在網際網路以外的公司談論機器決策時,他們常常沒有意識到大量資料的重要性。實際上,多年來,人工智慧研究專家認為,如果他們理解了網際網路的連結結構和語言結構,就能夠幫助人們獲到更好的搜尋結果。但實際上,擁有更多關於人們使用搜尋引擎表現行為的資料也很關鍵。瞭解人們在輸入特定的連續的三個字母時代表的最常見的東西可能比語義上的理解更有意義。這意味著在行業裡,機器學習對於產品的質量十分重要,你將會看到公司會更加集中,同時新公司將會更難的取得進展。

1470371093-4366-3417eb9bbd59190b90b705

 問:這就是投資者願意將數百萬美元投入沒有利潤但是能增長寶貴資料的專案的原因嗎?

答(Susan Athey, 經濟學教授):拿移動手機服務作為例子。如果你能讓更多手機使用者使用你的聲音服務,你將會在聲音識別上做得更好,也會為你的顧客帶來高質量的產品。這是你核心產品所能達到的能力,同時也是差異化的來源。這個資料的價值在於如何在不同的投資環境中理解語音功能。你能想象到,能夠收集一大堆資料的公司,在顧客需要語音識別時,將會沒有能直接競爭的對手,並將它作為突出的產品賣出去。使用者通過觸控式螢幕介面的所有產品都將會有此功能。所以,如果人們試圖通過打字、說話、使用觸屏、寫字或手勢去連線一個裝置,那麼一個擁有大量輸入的文字集的公司將會在使用者的輸入理解上會更快並且更準確。

一些網際網路公司因為想要聚集更多資料,在很多方向上進行整合,而語音識別只是你看到的普遍現象中的一個例子。他們並不希望他們的競爭者擁有資料來使他們的產品更好,或讓他們試著將資料用其他方式變現,例如通過更加個性化和更具有目標性的廣告。

 問:在哪個行業,您希望看到大資料打亂它的常規業務呢?

答(Susan Athey, 經濟學教授):這將是有趣預測:哪個領域將會更快地有效地使用資料。例如,你會認為,當你的航班延誤時,用一個自動航班預訂系統來改變一個連線行航班預訂會比調動車來開要方便更多。因為有來電顯示,當你從停機坪上叫車時,航空公司會知道你是誰。然而,在這種情況下,許多乘客都被耗費時間的航空電話弄得十分沮喪,只是在最近,我們才看到航空公司在這方面的體驗有真正的改善。另一方,汽車能自己安全的駕駛。另一個有吸引力的資料感測器的應用是用來監測複雜機器的零件,例如汽車或飛機,並學會如何提高機器安全性或決定何時替換損壞的零件。醫療診斷同樣也是一個例子,機器仔細研讀兆位元組的資料會比醫生更快更準確,僅僅是在極少的情況下,或是特定患者的治療中有少見的副作用。

你可能會驚訝於一些案例。你可能會認為像計程車這樣的行業會很難進入,因為它是被當地政府高度管制的敏感行業。然而,已有公司在很多城市成功進入,他們運用實時需求資料在供給短缺時提高價格,確保那些願意支付更多錢的人找到計程車。

1470371093-8119-3417eb9bbd59190b90f606

 問:對於老資料可以找到新的用法嗎?

答(Susan Athey, 經濟學教授):這裡有大量的方法來回答重要的政策問題,不僅有公共政策還有商業政策的問題,使用運營的或被動方式收集到的資料用於其他目的。所有的社會科學家積極主動地從社交媒體上挖掘資料來研究任何事情,例如推特,從幸福的事情到青少年社會準則再到社會動亂的基礎。學術界和金融行業都有像Google Trends的資源,來尋找搜尋模式,能夠用來預測流感的爆發,可以用於失業的統計,同樣適用於股票的回升情況。另一個增長趨勢是學術界研究者與公司合作從而有獲得大型資料,同時公司可以從研究者的專業知識中學習,並且研究者能夠回答研究使用公司專用的資料集的各種問題。此公佈的研究只顯示總量的統計資料,從而保護資料的機密性。在這件事上,我已和微軟研究院進行合作並且卓有成效,其他公司,如eBay和Yahoo也同樣成功地與學術界進行合作。

想到一個較不明顯的例子:城市。芝加哥、紐約,以及一些國家,現在都在做大規模的資料收集。因為這些資料正變得具有可獲取性,它能有用於一些直接的目的,例如受資料驅使的政策或交通和交通流的管理。但是我們僅僅是開始看到資料的從屬功用所帶來的可能性,資料關注就像在對非常微小級別的噪音、能源利用和汙染一樣。你可以聚集噪音的資料來識別是否違反噪聲條例,但之後你發現可以用它來研究噪音對兒童健康的影響。你可以收集關於計程車司機出行資料,用來監控其是否遵守各種規章制度,但在最後瞭解到通勤模式、公共交通的缺口、甚至是不同型別的顧客給小費的傾向。我期望也能在商業中看到。他們也許是被動地收集關於他們的顧客和汽車之間的關係。按照這種方式,他們也許會發現,顧客如何使用汽車的模式,對設計交通系統有著普遍的意義,對於城市規劃,以及如何設計未來的汽車的用處。

對於公司和政府而言,能夠全面利用他們所擁有的資料會很困難,因為保密性和資料安全的問題,但是令人更加驚喜的應用將必然出現。任何產業都可能會是下一個能夠以令人矚目的方式重新思量並進行創新的產業。

 

 參與人員:編譯 – 雷婧 ;編輯 – 裴懿萱;策劃-徐睿藝、樊茜茜

           推廣 – 李燕雲、申洪浩、李華芳

 原文:https://www.gsb.stanford.edu/insights/susan-athey-how-big-data-changes-business-management

原作者:Kathleen O’Toole

 注:本文來源於知乎,著作權歸作者所有,