資料思維不只是要“善用資料”更要能“解決問題”
寫這篇文章的初衷,是因為最近和一些企業交流時,發現大家在數字化轉型的過程中都或多或少遇到了同一個困惑——如何提升員工的“資料思維”,讓每一個人都能理解資料的價值和規律,甚至都具備資料分析的能力。即便是對於金融這樣走在數字化前排的行業來說,也在受類似問題的困擾。
和其它傳統的實體行業不同的是,金融幾乎就是一個基於數字的“遊戲”。但是,擁有資料是一回事,能把資料價值釋放出來又是另一回事。
不少金融企業表示,雖然行業整體在平臺建設和資料整合方面取得了可觀進展,然而對於如何提高資料的利用率,真正釋放資料要素價值,還有很多問題亟待解決——比如,內部員工如果不具備資料思維,就不能在日常開展業務的過程中把資料的價值納入考慮範圍,即便企業坐擁海量資料,也可能形同虛設。
所以, 帶著“如何提升企業員工的資料思維”這一問題,採訪了曾在被奉為“資料驅動金融先驅”的 Capital One(美國第一資本銀行)任職多年的晉梅博士。
晉梅是中國科技大學數學系本科、美國喬治華盛頓大學統計學博士,畢業後就加入了 Capital One;回國後,她先後在量化派、頂象技術、全量全速等公司任職,現在是神州資訊資深金融科技專家。對於金融和網際網路的業務經營、資料建模、運營分析和風險管理,她擁有著非常豐富的實戰經驗。
而針對我們的“迷思”,晉梅可以說是“一言驚醒夢中人”——她說——企業數字化做不好,大機率是因為,只看見了資料思維中的“資料”,但對“解決問題”鴕鳥式逃避。
01 資料不是越多越好,模型不一定越複雜越好
一提到“資料思維”,我們常常會聽到這樣的說法,一定要積累海量的資料、一定要用上覆雜的演算法和模型、一定要實現對業務的顛覆式創新。事實是這樣嗎?晉梅認為,資料思維的本質,不是追求資料的積累或是演算法的複雜度,而是要清楚地知道,如何用好資料、更好地解決實際問題。
“比如說,有的企業的基礎設施不夠完善,業務線上化程度和資料積累也很有限。但他們在業務邏輯上想得很透、對業務流程的拆解很到位、對提升和增長所需要重點關注的環節抓得很準。在重要環節上,他們敢於提出問題和關鍵假設,然後有的放矢地去積累資料。他們及時覆盤,基於分析結果一邊最佳化、一邊提出新的問題和假設——在這個過程中,即便他們只使用了幾張不超過 10M 的 Excel 表格、只運用了小學生都能熟練掌握的四則運算,我們也不會認為這樣的企業沒有‘資料思維’、算不上‘資料驅動’。”晉梅強調,“能夠踏實做到這一步的企業,就算是已經吃透‘資料思維’的核心了。”
她舉了個例子:拿所有銀行都在做的公眾號來說,即便是在沒有後臺許可權的情況下,運營分析師也能根據有限的公開資料——比如推文標題、位置和時間、內容和形式等資訊,判斷出某個分行或者業務部門在特定時間段內對公眾號渠道的定位是什麼、重點關注哪些客群、營銷什麼產品和服務、主推什麼賣點和權益、覆蓋廣度和投入力度如何等等。如果進一步結合每個推文的閱讀量、轉發量、點贊量、評論關鍵詞等資料,還可以做定性和定量的主題分析,圍繞分行或業務部門經營目標有針對性地給出內容運營的最佳化思路和測試路徑,甚至還能在使用者運營和權益規劃方面給到非常有價值的建議。
換言之,資料是否具備業務價值,不完全取決於規模或體量,而是看是否能解決需求或問題。即便資料資源有限,在特定場景下也可能創造價值。反之,資料體量大固然蘊藏著更大的潛力、更多的可能性,但如果沒想清楚要解決什麼問題、為什麼利用資料就能提供更有效的解決思路、如何使用資料才能達到預期效果這些問題,就會既增加資料成本、更增加決策難度。
那麼,越來越流行的 AI 分析工具以及複雜的模型或演算法又是不是必選項呢?晉梅的答案依然是否定的。“和到底是要用鏟子還是挖掘機、要用水果刀還是手術刀這類問題一樣,我們要分析資料、挖掘洞察,應該選擇什麼方法、使用什麼工具,依然需要具體情況具體分析,合理、有效、划算的才是好的。”
比如,當下非常火的短影片或直播,對於擁有海量使用者和內容的平臺來說,需要相對複雜和專業的演算法來識別使用者的偏好、內容類目,透過給使用者和內容分別打上標籤,進行及時和準確的推薦,以此增加使用者的粘性、催生更多有需求的內容。
但是,在這個生態中,能利用資料去成就和放大業務價值的,除了專業的演算法團隊,還有運營團隊。在直播的過程中,運營全程緊盯人氣資料、帶貨資料,分析觀眾畫像、流量來源、觀眾互動和商品轉化,捕捉有可能影響交易量的潛在因素,透過持續測試和最佳化投放策略、調整直播間的“人 - 貨 - 場”來創造價值。
“在這個過程中,他們常用的分析方法在絕大多數情況下並不涉及複雜演算法和數學模型,很多運營指標也只是基本的加減乘除,但這完全不妨礙優秀的運營人員利用資料去解決轉化的問題。”晉梅表示,“我合作過不少頂級的運營,他們不會寫 SQL、沒聽過邏輯迴歸、也弄不懂 GBDT,但他們把堅持資料驅動作為信仰,是真正具備資料思維並從中獲益的人。”
所以,在她看來,是否需要 AI 分析工具、使用什麼複雜度的模型,先要明確業務的目標,基於這個目標去做細化拆解、梳理環節,提出關鍵問題和假設,再結合資料的實際情況,綜合評估不同方案的可行性、投產比、優勢短板後再做選擇。
02 資料是錦上添花,而不是救命稻草
尤其是在數字化愈演愈烈的當下,市場上不乏打著“數字化轉型”的旗號販賣焦慮者,也不缺把“數字化”當作救命稻草,或者拿著錘子到處找釘子的企業。越是這樣,企業越是要從做業務的初心和商業的底層邏輯出發,對自身的核心競爭力有清晰的定位,對市場需求和趨勢發展有客觀的判斷,對資料科學的優勢和侷限性有必要的認知。否則,很容易陷入先把“資料思維”當作萬金油,一頓操作猛如虎卻沒有感受到業務突飛猛進的尷尬境地。到了最後,只能“甩鍋”給資料。
以這些年業界對 Capital One 的解讀風向變化為例:晉梅表示,因為短短几十年 Capital One 就躋身全美頭部銀行,很多人給它貼上了“大資料風控先驅”的標籤,而後冒出來很多主打“大資料風控”的公司,號稱他們的風控模型裡用了成千上萬個特徵,智慧到恨不得每分每秒都在自我迭代,甚至可以連模型帶係數從 A 銀行直接遷移到B銀行去幫後者快速冷啟動。但隨著後期 Capital One 遇上股價波動、業務調整,業界同樣著急下結論——表示“Capital One 走下神壇”。
那麼,事實果真如此嗎?晉梅解釋道,“成就 Capital One 的肯定不是所謂的‘大資料風控’,Capital One 也沒有什麼秘密武器,只是一直遵循著‘提出問題、分析問題、解決問題’的結構性思維方式,讓資料恰如其分地發揮價值罷了。”
據她介紹,在日常的業務推進過程中,Capital One 的演算法模型團隊會頻繁和業務反覆溝通金融產品要素、目標客群、推廣渠道、營銷策略、市場環境和宏觀趨勢。雙方不僅對業務的歷史、現狀、未來規劃都有充分共識,還會對建模樣本的選擇策略、模型的框架、建模的方法、模型適用性、模型的驗證、上線後的監控、可能會出現哪些問題、出現這些問題後的應對預案等資訊去做充分的討論——包括對入模的原始資料、衍生特徵的業務價值和投入成本客觀評估,以及對關鍵變數的係數從符號到數值是否合理、對映到業務上代表著什麼等問題逐一明確。
“脫離了具體業務和場景的模型不但很難放大資料的價值、甚至可能帶來毀滅性的災難。”晉梅強調,“在 Capital One 工作這麼多年給我的啟示就是,永遠不要在沒梳理清楚‘產品 - 營銷 - 運營’閉環的業務邏輯和關鍵問題之前,盲目扎入漫無邊際的資料海洋;不預設問題、說不明白要驗證什麼的建模和分析,都是低效甚至無效的。“
所以,商業的本質,歸根結底還是供給和需求的匹配,是用對的產品或服務、在對的時間和空間、以對的方式滿足使用者的需求。對於大多數企業來說,直接創造價值的不是資料本身,而是讓資料助力實現供給和需求之間的極致匹配。
換句話說,企業自身如果沒有好的商業模式、好的產品和服務、好的客戶體驗,那麼即便是再先進的技術、再優秀的演算法模型、再多的資料也無法幫助它扭轉乾坤——比如風靡一時的共享單車,背後也有海量資料在驅動資源配置,但是商業模式變現慢、服務管理不完善等問題同樣導致了它最終的失敗。過度高估資料價值,指望資料創造奇蹟,讓本就不符合邏輯的商業模式翻身,那多半會失望而歸。
03 要運用資料,先忘掉“資料”
“所以,我覺得‘資料思維’,歸根結底是因為有了資料加持,從而更有底氣和把握做出正確決策,繼而更高效地解決問題的思維。我們不能拘泥於字面上的、狹義的‘資料’這個詞本身。”晉梅強調,“甚至可以試著先忘掉‘資料’,捋一捋業務模式、搞清楚要解決的核心問題到底是什麼;在此基礎之上,再引入資料、考慮資料能幫到什麼,進而重新整理對業務模式和核心問題的理解。”
具體來說:第一,理解業務、提出問題;第二,拆解成多個子問題;第三,逐個分析和評估;第四,總結和決策。晉梅表示,這種結構化思維指導下的、解決問題的框架在如今的數字化背景下非常適用。
“首先,企業要明確目前業務上面臨的核心問題是什麼,大家充分探討和論證、要達成共識;然後,是對問題進行拆解,可以根據業務流程、關鍵要素或者部門職能等維度細分成多個子命題。圍繞每個子命題要敢於提出關鍵假設、圈定測試範圍、排好優先順序;第三步用包含資料分析在內的手段,對第二步拆解出來的問題和假設進一步量化、驗證和評估。最後一步,基於前面的分析結果,總結和決策。在落地執行、業務迭代的過程中一定還會碰到新的挑戰、出現新的問題,這時候再從第一步開始、螺旋式推進。”
以銀行的權益運營為例:
第一步,明確要解決的問題是,透過豐富的權益持續滿足客戶的需求,提升客戶體驗、加強客戶的粘性,繼而提升客戶的經營價值;
第二步,要做到在對的時間、把對的權益、以對的兌換積分金額和對的兌換方式去滿足客戶的需求。可以按照“人 - 貨 - 場”的運營模型進行細分拆解,圍繞著每一個維度,做好基礎標籤體系的建設,梳理互動環節,根據可提升空間和價值明確優先順序;
第三步,對關鍵環節開展資料採集、積累、分析和建模並提煉洞察。比如,透過兌換資料,可以把同一個 AUM 層級的客戶按照兌換品類的偏好進一步細分群,也可以評估兌換流程的轉化效率、從而定位最佳化兌換體驗的環節,還可以根據權益單品的兌換熱度調整選品策略和組合策略;
最後,透過對這些資訊的綜合分析,業務團隊和運營人員就可以更有據可依地開展分群運營、渠道最佳化、商品管理和供應商管理等工作。
晉梅告訴 記者,很多企業尤其是技術人員在推動數字化的過程中,經常把自己侷限在第三步,沒有考慮具體問題和具體場景的全貌,只是接受一個籠統的需求、確認下欄位的口徑就開始做分析和模型,最後往往不能提供業務用得上、切實輔助決策的輸出。
比如,建模同學 M 接到需求說要給 A 產品做信用評分卡,他兢兢業業找出來 A 產品的歷史資料、認認真真建模和回測,感覺都沒問題了就交付給策略同學 P 使用。沒過多久,策略同學 P 就抱怨 M 的評分卡不好使,時靈時不靈。
後來才發現,業務團隊為了完成增長 KPI,自行調整了 A 產品的受眾群體,把過去只聚焦在優質客群的 A 產品推向基數更大但信用資質略差的客群。為此,他們新增了 A 產品的進件合作渠道,在展示坑位、流量費用等方面也都做了調整。但是,在推進這些嘗試的過程中,他們只使用了過去優質客群的歷史表現資料,自然,M 同學原來建立的評分卡的有效性就非常有限。
所以,晉梅認為,解決問題的經典框架中的每一步如果沒有放在整體邏輯中去考慮,很難有價值可言。上面這個例子的漏洞就出在沒有對問題進行合理的拆分和定位。除此之外,還有的企業會在第一步明確問題的過程中,就開始出現目標上的偏差。
“比如,有些銀行在做 APP 的時候要拼日活資料,為了達標玩命地在 App 裡新增功能,儼然一副要和位元組拼內容、和騰訊拼社交、和 PDD 拼電商的架勢。且不說銀行 App 在這類比拼中到底有什麼優勢,就說日活資料的提升如何與銀行經營指標掛鉤?或者流量真的來了,銀行要用什麼產品和服務去承接去變現?而這些接得住流量需求的產品和服務目前是什麼狀況、有沒有需要最佳化的地方、最佳化的節奏又是什麼?完整的商業模式、業務鏈路和實現節奏企業自己是要先想清楚的。否則就是盲目投入,很可能錢花了不少卻總說不清產出在什麼地方。”
也就是說,這背後要求企業對自身業務的走勢有清晰認知和合理的規劃,能夠識別和解決到業務的“真問題”而不是“偽需求”。
04 每個人都該有“業務體感”和“資料思維”
那麼,在一個企業當中,究竟誰應該具備這種結構性思維和解決問題的能力?在傳統認知中,我們通常認為創造業務價值並且在這個過程中負責解決具體問題的,是衝在前線的業務部門。而技術部門扮演的是執行者的角色,只要在幕後負責接收業務需求,然後針對性地做開發、找技術、做模型。
但是,時過境遷,如今數字化轉型的背後需要源源不斷的技術內燃力,技術已經成為其中的關鍵角色,這意味著過去這一套協作模式無法奏效。
所以,晉梅的答案是——無論是一線的業務人員還是中後臺的技術人員,所有人都應該具備上面所說的解決問題的思維和能力——更確切來說,每個人都要有“業務體感”和“資料思維”。
她講了某區域銀行的例子:“在診斷這家銀行營銷系統時發現,他們很多營銷活動的響應率居然都能達到 90% 以上。即便是非常牛的網際網路爆款產品,也很難達到這麼高的響應。所以,當我們把這些資料拉出來看的時候,就發現了問題。這些高響應率活動的營銷方式都是簡訊,而這個所謂的響應率其實是送達使用者手機的比例,除了被攔截的簡訊,超過 90% 多都能送達。事實上,簡訊送達後使用者並不一定會點選參與這些營銷活動,而這一步的點選率是比簡訊觸達率更具業務價值的指標。更讓我震驚的是,這個數值高達 90%、以‘響應率’自居的指標,在這家銀行的營銷系統裡已經靜靜躺了幾年了。”
在晉梅看來,這就是缺少“業務體感”,進而對資料的業務意義和價值、對資料所反映出來的業務漏洞也不敏感的一種表現。很多企業拼命花錢做專案、上技術,最後要麼沒效果、要麼說不清楚效果,就宣告專案失敗,其實背後可能不是技術水土不服,而是圍繞業務閉環本身該做的思考和論證太過敷衍和草率。
但是,現實情況是,這種兼具“業務體感”和“資料思維“的人才非常稀缺,他的基本能力要求是既要懂業務又要懂技術,複合能力疊加,培養難度也加倍。晉梅指出,企業要解決的當務之急,需要業務人員與技術人員的“雙向奔赴”。
“一方面,技術一定要去理解業務,明確業務目標、流程和痛點,你要清楚自己透過哪些技術、演算法能產生什麼樣的影響,帶來什麼樣的價值;另一方面,業務對技術的理解,不要只在大資料、人工智慧這些熱詞表面,比如,當你的業務對技術、對資料的依賴越來越重,起碼要知道關鍵技術的基礎原理、構建邏輯、優勢、短板和侷限性等。”晉梅指出。
05 業務技術雙向奔赴
——“說人話”比“造新詞”更重要
很多人認為,技術與業務人員之間的隔閡是天然存在的,由於工作內容的差異,雙方關心的問題並不相同,無法在同一套話語體系下溝通是非常普遍的現象。晉梅表示,這個問題不是沒有解,但也沒有捷徑。
“業務、技術、資料等核心部門首先都不要回避這個問題,其次要一起迎接這個挑戰。技術不要認為業務背景的人肯定聽不懂技術和資料,高段位技術的一個重要能力,就是讓業務人員聽懂技術的價值;同樣,業務也不要認為技術人員弄不明白商業模式,高段位業務一定要具備的重要能力,就是簡單、直接地講清楚業務本質。”
據晉梅介紹,Capital One 把這樣的文化觀念透過制度和流程的方式做了固化和沉澱。
比如,在人才招聘過程中,無論是業務、資料還是技術崗,面試時都會安排一輪案例分析。主導這一輪的面試官都是 VP 級別的高管、擁有一票否決權。而在整整一小時、和高管 1V1 的面試中,候選人會被提供一個具體的業務問題,圍繞著這個問題會被給到業務背景、資料包表等資訊,但這些資訊不是一次性、一股腦給到候選人的(這也符合我們在實際工作中碰到的情況),而是由候選人和 VP 展開多輪互動,詢問、確認、提出假設、分析解讀、給出建議,然後再被提供更多資訊後,進一步分析和最佳化建議。
也就是說,在整個面試過程中,候選人身上沒有“業務崗”、“資料崗”、“技術崗”的標籤,而是一個先快速吸收背景知識,然後提出問題、分析問題和解決問題的角色。
再比如,在部門協作過程中,Capital One 模型團隊在每一次對模型進行調整時,都會和業務充分溝通調整的原因和方式,調整前後的對比,新模型的優勢、短板和侷限性;反之,業務團隊每一次做業務策略調整時也會把調整背景、調整方向、預判影響等資訊同步給模型團隊。並且,在整個流程中,雙方不是對立的狀態,也不是各自扛各自的指標,而是一起扛業務最終的收益。
此外,Capital One 在培訓體系中還有一個比較有意思的做法,是在內部培訓中設立了一門叫做“COF Lessons Learned”的課程。這是一門不斷積累案例的培訓,積累的都是公司付出過代價、在踐行資料驅動業務的道路上實實在在踩過的“坑”。而培訓的老師,首選是那些曾親身參與和經歷過這些“坑”的同事、尤其是負責人。案例的內容很豐富,包括對這些專案的業務背景、入坑覆盤,梳理當初的思路是什麼、為什麼會出現問題、是哪個點沒有考慮清楚、或者溝通上不夠順暢,最後導致了什麼樣的業務結果等等。
並且,為了讓每一位員工清醒認識資料中既有真相、也有盲區,模型會揭示規律、也會製造錯覺,Capital One 還有另一門叫做“Statistical Pitfalls”的內訓課,專門講述各類統計模型和資料分析在支撐業務決策的應用過程中,可能存在的侷限性和常見的誤區。
“任何技術、任何工具,只有對它的優勢、短板、適用性、侷限性等有客觀的認識,才能把好鋼用在刀刃上、真正發揮它的價值。而在這個過程中,前臺不應該自詡為商業奇才、中後臺也不應該以‘技術大神’自居,探討問題要以表達清楚、闡述明白為目標,不刻意、不做作。”晉梅強調。
06 總結
2020 年 4 月,《中共中央國務院關於構建更加完善的要素市場化配置的體制機制的意見》釋出。這是中央第一份關於要素市場化配置的檔案,首次將“資料”與土地、勞動力、資本、技術等傳統要素並列,明確資料是一種新型生產要素。
在這樣的背景下,企業需要對資料有客觀清醒的認知:首先,資料作為關鍵生產要素,的確能夠給企業帶來競爭力提升;但是,資料又不是萬能的,它解決不了根本的業務模式問題;另一方面,資料驅動文化的構建、資料思維的培養並非一朝一夕,即便是像 Capital One 這樣曾經被“封神”的公司,它的文化價值觀也是在不斷跌進去、爬出來,再跌進去、爬出來的過程中反覆總結和打磨出來的。
所以,留給企業的課題是——在數字化轉型過程中,如何尊重規律、尊重分析、講究邏輯和依據——以業務為船舵,用資料做引擎。
來自 “ 談資料 ”, 原文作者:談資料;原文連結:https://mp.weixin.qq.com/s/FMazP2q-Eqhe4Ih4WyYALA,如有侵權,請聯絡管理員刪除。
相關文章
- 解決hive資料庫 插入資料很慢的問題Hive資料庫
- 什麼是 Hadoop ?它主要能解決 “大資料” 的哪兩個問題?Hadoop大資料
- 解決AI的小資料問題AI
- 得到(思維造物)上市招股書及簡要資料
- sbt配置——資料來源問題解決
- 資料庫層面問題解決思路資料庫
- 大資料常見的資料分析思維大資料
- 解決pl/sql developer中資料庫插入資料亂碼問題SQLDeveloper資料庫
- 資料分析思維有哪些
- 資料編號+1 併發問題解決
- SqlServer資料庫中文亂碼問題解決SQLServer資料庫
- 【Spark篇】---Spark解決資料傾斜問題Spark
- 資料驅動決策:決策智慧與設計思維
- 思維體系---技術思維、業務資料思維、產品思維、複合思維
- 讀資料質量管理:資料可靠性與資料質量問題解決之道15資料信任
- 大資料時代,從零學習資料思維大資料
- 如何培養資料分析思維?
- 研發了 5 年的時序資料庫,到底要解決什麼問題?資料庫
- Swoole - TCP流資料邊界問題解決方案TCP
- Windows共享資料夾常見問題解決方法Windows
- 安裝mysql資料庫及問題解決方法MySql資料庫
- 資料倉儲的效能問題及解決之道
- 【資料庫】解決Mysql資料庫提示innodb表不存在的問題!資料庫MySql
- 讀資料質量管理:資料可靠性與資料質量問題解決之道01資料質量
- 讀資料質量管理:資料可靠性與資料質量問題解決之道02資料湖倉
- 讀資料質量管理:資料可靠性與資料質量問題解決之道06資料測試
- 讀資料質量管理:資料可靠性與資料質量問題解決之道10資料平臺
- 讀資料質量管理:資料可靠性與資料質量問題解決之道18資料發現
- 讀資料質量管理:資料可靠性與資料質量問題解決之道19資料未來
- 讀資料質量管理:資料可靠性與資料質量問題解決之道16資料認證
- 讀資料質量管理:資料可靠性與資料質量問題解決之道13資料沿襲
- 讀資料質量管理:資料可靠性與資料質量問題解決之道17資料網格
- 讀資料質量管理:資料可靠性與資料質量問題解決之道03資料目錄
- 解決資料庫高併發訪問瓶頸問題資料庫
- 解碼智慧治理 用大資料解決民生小問題大資料
- 讀資料質量管理:資料可靠性與資料質量問題解決之道05資料標準化
- 讀資料質量管理:資料可靠性與資料質量問題解決之道09資料可靠性
- 讀資料質量管理:資料可靠性與資料質量問題解決之道14普及資料質量