一文知曉什麼是資料分析

qing_yun發表於2022-05-12

隨著數字化轉型普遍開展,資料分析飛速發展。無論您的組織屬於哪個行業,資料分析都可能在制定戰略中發揮著關鍵作用。許多公司現在都有資料分析師,他們對原始資料採用資料探勘技術,從這個過程中獲得的許多可行的洞察和見解。

同時,資料分析軟體市場迅速攀升。根據IDC的資料,2021年,全球在大資料和業務分析解決方案上的支出增長10.1%,達到2157億美元。許多公司正在積極招聘資料科學家和資料分析師實現“資料驅動的決策”。

Gartner的研究人員得出結論:“資料和分析越來越成為業務戰略的主要驅動力,資料驅動的業務戰略和資訊產品的潛力比以往任何時候都大。”據該研究公司稱,到2023年,在垂直和特定領域資料探勘技術的推動下,整體分析採用率將從35%增加到50%。

鑑於資料分析趨勢在現代企業中發揮的重要作用,有必要研究一下“什麼是資料分析?”以及為什麼它很重要以及未來的趨勢是什麼。接下來我們將談論以下幾個問題:

·什麼是資料分析

·資料科學與資料分析

·資料分析的型別

·為什麼資料分析很重要

·資料分析的好處

·資料分析的趨勢

一 、什麼是資料分析

資料分析是分析資料趨勢獲取知識和洞察力以做出更好決策的過程。這個複雜的過程由資料分析師和資料科學家以及非技術人員協作進行的。該過程通常從原始資料開始,這些資料經過資料探勘,尋求有價值的洞察力——事實上,競爭優勢是業務資料分析的主要目標。

可以肯定的是,資料分析的定義與其他一些技術定義相比變化較小,主要是因為專家一致認為資料分析幾乎涵蓋了組織可能對原始資料執行的任何操作。例如,Gartner將資料分析定義為“對所有用途(運營和分析)的資料進行管理,並對資料進行分析,以透過更有效的決策制定和增強的客戶體驗來推動業務流程並改善業務成果。”

這些定義基本涵蓋現代企業中常見的活動。資料分析主要包括以下內容:

資料探勘

資料探勘是將原始資料轉化為業務可用資訊的過程。最常見的方法是透過各種資料探勘軟體來尋找資料中的模式。資料探勘是資料分析的子集。此外,資料探勘是人工智慧和機器學習的基礎元件。多年來已經開發了許多技術來實際應用和實踐資料探勘。每種技術都建立在跟蹤一組資料中的模式的基本思想之上。可以根據專案的重點和研究的深度持續最佳化資料探勘方法。例如,可以使用關聯來簡單地關聯多個因變數,可以深入研究並利用異常值和異常檢測來篩選大型資料集並發現任何異常。

文字分析

大多數文字分析利用人工智慧驅動的自然語言處理(NLP)來解釋人類語言。人工智慧、機器學習和資料分析的最新發展使得計算機系統從文件中的結構化和非結構化資料中提取含義的能力顯著增強。

資料視覺化

資料視覺化工具透過以圖形形式(包括圖表、圖形、迷你圖、資訊圖、熱圖或統計圖)表示資料,在資料分析中發揮著重要作用。以視覺形式呈現的資料易於理解和分析,即使是非技術利益相關者也可以做出更有效的實時決策

商業智慧

商業智慧工具可以快速的實現視覺化報告、深度資料探勘、自動化、預測幫助和其他關鍵能力。

資料目錄

資料目錄工具可自動發現整個企業系統中的資料來源。它使用後設資料管理功能來組織資料,顯示不同資料之間的關係,啟用搜尋和跟蹤資料沿襲,即發現資料的來源。同時,包括資料治理功能並支援業務使用者的自助服務,有些還包括詞彙表,以便使用者對術語有共同的理解。大多數現代資料目錄工具依賴人工智慧 (AI)和機器學習 (ML)功能。

資料倉儲

資料倉儲工具是大資料和資料分析中的關鍵元件。資料倉儲是為分析軟體提供資料的智慧資料儲存庫,允許使用者進行資料探勘以獲得競爭洞察力。資料倉儲通常位於大型資料儲存庫(如資料庫)和資料集市之間。資料倉儲軟體通常與ETL 工具一起使用,支援從商業智慧到預測分析的各種報告和分析。

資料湖

資料湖是一個儲存庫,以原始格式儲存大量原始資料,直到處理完畢。與使用資料夾、行和列等分層資料結構的結構化資料倉儲不同,資料湖是一種平面檔案結構,可在輸入資料時保留資料的原始結構。湖中的每個資料元素都被分配了一個唯一的識別符號,並使用一組擴充套件的後設資料標籤進行標記。當有人根據某個後設資料執行業務查詢時,所有標記的資料都會被分析以用於查詢或分析。資料湖存在的原因是因為每個人都在從各處收集大量資訊,尤其是從物聯網,他們需要將其儲存在某個地方。歷史儲存介質是關聯式資料庫。但是這些技術對於我們從各地收集的所有這些資料片段來說並不適用。

資料網格

資料網格正在成為一種幫助組織更好地處理快速增長的資料量、不斷變化的應用程式需求和分散式處理場景的方法。可以將資料網格想象成一個橫跨大型網路的網路,它連線本地和公共雲中的多個位置、型別和資料來源,並透過多種方法訪問該資料以處理、移動、管理、並將資料儲存在結構範圍內。

資料建模

資料建模是將結構和方法應用於資料的過程,以便將其轉換為有用的形式以進行分析和獲得洞察力。透過準備資訊系統中涉及的資料模型,可以最佳化資料庫設計並瞭解資訊系統中的資料流。一個好的資料模型是資料庫中具體細節的抽象模型,例如資料如何捕獲、資料如何在系統中流動、資料如何輸入到各個表中,以及在儲存資料之前對資料應用哪些檢查和約束在資料庫中。

人工智慧(AI)

人工智慧功能通常分為幾個核心領域:機器學習(ML)、深度學習、預測分析、機器視覺、機器人流程自動化 (RPA)、智慧助手和聊天機器人。

機器學習(ML)

機器學習是人工智慧的一個子集,是電腦科學的一部分,專注於創造以人類思維方式思考的計算機。換言之,所有機器學習系統都是人工智慧系統,但並非所有人工智慧系統都具備機器學習能力。

可以將機器學習細分為幾個不同的類別:

監督學習需要提供哪些輸入與哪些輸出一致的示例。例如,如果想使用監督學習來教計算機識別貓的圖片,你會提供一大堆影像,其中一些被標記為“貓”,一些被標記為“不是貓”。” 機器學習演算法將幫助系統學習概括概念,以便它可以識別以前從未遇到過的影像中的貓。

無監督學習要求系統從給定的資料集中得出自己的結論。例如,如果您有大量線上銷售資料,可以使用無監督學習來查詢這些資料之間的叢集或關聯,從而幫助您改進營銷。例如,您可能會發現 1980 年初出生、收入超過 5 萬美元的女性對特定品牌的巧克力棒有濃厚的興趣,或者購買特定品牌蘇打水的人也會購買特定品牌的薯片。

半監督學習是有監督學習和無監督學習的結合。回到貓的例子,假設你有大量的影像,其中一些被標記為“貓”和“非貓”,而另一些則沒有。半監督學習系統將使用標記的影像來猜測哪些未標記的影像包括貓。然後最好的猜測將被反饋到系統中,以幫助它提高其能力,並且迴圈將繼續。

強化學習接收類似於懲罰和獎勵的反饋的系統。強化學習(適用於機器學習)的一個經典例子是坐在一排老虎機前的賭徒。起初,賭徒不知道哪些老虎機會得到回報或有多好,所以他嘗試了所有老虎機。隨著時間的推移,他發現有些機器設定得“更寬鬆”,因此它們的回報更頻繁、金額更高。隨著時間的推移,賭徒會透過更頻繁地玩更寬鬆的機器來增加他的收入。

深度學習

深度學習是一種人工智慧技術,它已經在模仿人類大腦的各個方面取得了進展,使裝置能夠處理資訊以進行上下文分析和行動。深度學習將 ML 演算法擴充套件到多層神經網路,以製作多層連結變數和相關決策的決策樹。在自動駕駛汽車的例子中,前進會導致有關速度、是否需要導航障礙、導航到目的地等方面的決策。然而,這些後續決策可能會產生反饋,迫使人工智慧重新考慮早期的決策並改變它們. 深度學習旨在模仿人腦,讓我們透過被訓練和透過多層近乎同時的決策來學習。

資料分析是研發、工程和戰略規劃不可或缺的一部分。當然,它是物流和供應鏈管理的核心。每年,分析在資訊科技和網路安全中發揮著越來越大的作用。總而言之,幾乎沒有一個行業不是由資料分析驅動的。

如今,許多組織都有一名首席資料官,其職責是監督組織內資料管理的各個方面,包括資料分析和資料科學。

二 、資料科學與資料分析

儘管它們相似且密切相關,但是經常混淆,資料科學和資料分析並不是一回事。簡而言之,資料分析是一門商業學科,而資料科學是一門技術學科。資料分析的目標是回答特定的業務問題,而資料科學的目標是準備、轉換和組織資料,使其有用。資料分析需要深入瞭解特定業務領域,如金融或營銷,而資料科學需要深入瞭解數學和技術學科,如統計建模和程式設計。

哈佛商業評論認為,“資料分析是指分析資料以回答問題、提取見解和識別趨勢的過程和實踐。資料科學的核心是構建、清理和組織資料集。”

資料分析師檢查大型資料集以識別趨勢、開發圖表並建立視覺化簡報,以幫助企業做出更具戰略性的決策。資料科學家使用原型、演算法、預測模型和自定義分析來設計和構建資料建模和生產的新流程。

在實踐中,資料科學家和資料分析師經常密切合作,甚至可能是組織內同一團隊的一部分。

三 資料分析的型別

並非所有資料分析都是相同的。大多數專家將資料分析分為四種關鍵型別:

1.描述性分析

描述性分析描述了過去發生的事情或當前正在發生的事情。這種型別的分析可以回答諸如誰、什麼、何地、何時以及如何等問題。例如,顯示過去四個季度每月銷售額的銷售報告就是描述性分析的一個示例。這是最容易執行的分析型別,但對組織的價值有限。但是不能忽略它,因為描述性分析是更高階分析型別的必要基礎。

2.診斷性分析

診斷分析會告訴您發生某事的原因。例如,如果描述性分析告訴上個季度的銷售額下降,那麼診斷分析將幫助找出問題所在。這種型別的分析通常涉及組合多個資料集,以對組織的情況進行更全面和準確的評估。也許銷售下降是因為供應鏈問題或惡劣天氣,或者是因為僱用新的銷售人員後失去了一個關鍵客戶。診斷分析可以幫助弄清楚這一點。

3.預測性分析

預測分析可幫助您瞭解接下來可能發生的事情。它著眼於歷史趨勢,尋找能夠洞察未來的模式。預測分析工具通常依賴於先進的資料模型和機器學習技術,這些技術可以提煉影響過去績效的重要因素並將其應用於當前情況。這是一種更先進、更具投機性的分析形式,具有很高的潛在價值。它正在成為一種非常普遍的工具,尤其是對於大型企業而言。

4.規範性分析

規範性分析試圖告訴您應該如何應對未來可能發生的事情。例如,如果預測分析預測下個季度的銷售額會下降,那麼規範性分析可以幫助瞭解如果降低價格或更改營銷策略或從不同供應商處採購產品,情況可能會發生怎樣的變化。顯然,規範分析的潛在好處非常高,但做好規範分析也非常困難。目前,很少有組織擁有大規模進行規範性分析的資源和能力。

大多陣列織從描述性分析開始他們的資料分析。隨著時間的推移,它們擴充套件到診斷分析,然後是預測分析。許多人渴望最終擁有一個成功的規範性分析程式,以更好地為他們的業務決策提供資訊。

四 為什麼資料分析很重要

大多數專家都同意,資料分析對現代組織非常重要,因為它可以幫助組織變得更有競爭力。Forrester說:“資料是改善客戶體驗和運營效率的關鍵,這反過來又推動了公司的成功。釋放資料的全部潛力依賴於可靠的資料分析。”

出於多種原因,組織進行資料分析和資料科學計劃。使用資料分析做的一些最常見的事情包括:

1.更好地瞭解客戶

大多陣列織都可以訪問有關其客戶的各種資料,包括人口統計、訂單歷史、客戶服務互動、社交媒體、瀏覽歷史、調查回覆等。聘請資料分析師來分析這些資料可以幫助公司更全面地瞭解每個客戶以及他們的客戶作為一個整體的總體情況。此外,它可能會突出更好地滿足客戶需求或接觸新買家群體的機會。

2.簡化業務運營

組織內有許多流程,從接單、到履行、到供應鏈管理、到客戶服務、再到 IT 運營等等,都是可以衡量的。任何可以衡量的東西,都可以改進。資料分析可以幫助跟蹤關鍵績效指標 (KPI) 的進展,並幫助識別當今可能拖慢組織速度的瓶頸。

3.識別新的機會

資料分析中更有趣的領域之一是空白分析學科。這種做法有助於組織識別今天沒有做但他們未來可以做的業務。它可以幫助尋找新的客戶、新產品和新的合作伙伴,從而增加收入和利潤。

4.利用現有趨勢

即使是最基本的資料視覺化,也可以輕鬆檢視 KPI 的移動方向和速率。透過識別這些趨勢,通常是透過原始資料篩選,可以做更多運作良好的事情,並嘗試糾正錯誤的事情。

5.營銷活動更有效

營銷是被資料分析改變最多的商業學科之一。由於如此多的營銷活動以數字方式進行,營銷團隊擁有大量可用資料,可以幫助他們確定哪些目標最有可能成為客戶,哪些客戶可能再次購買,哪些客戶有轉投競爭對手的危險等等。他們經常使用資料視覺化來幫助資料探勘以獲得業務洞察力。

6.改進定價策略

如果僅將價格提高 1% 就可以將組織的整體利潤提高多達 10%,那會怎樣?分析可以幫助您分析變數。資料分析可以幫助定價團隊確定他們應該在哪裡提高價格(以及應該在哪裡降低價格)以最大限度地提高盈利能力。

7.做出更好的決定

人類總是傾向於出於情感原因做出決定,通常基於先入為主的觀念,這些觀念可能是真實的,也可能不是真實的。資料分析為這種本能提供了強有力的檢查,以便企業領導者可以看到他們的直覺反應是否可能導致成功。在非常廣泛的意義上,資料分析可以幫助企業改進整個組織的決策。

五 資料分析的好處

資料分析支援的所有這些活動的最終結果通常在組織的底線中可見。商業領袖表示,資料分析可以幫助他們:

透過簡化業務運營、調整技術支出規模、改善庫存管理和更好地與供應商談判來降低成本。

透過快速識別新產品機會、改進開發流程、加快測試速度和提高整體質量來加快上市時間。

透過更好地滿足客戶需求併為客戶服務代理提供所需的工具、培訓和支援來提高客戶滿意度。

透過改進產品供應、加強營銷工作和授權銷售人員來增加銷售額。

透過降低成本和最佳化價格來增加利潤。

透過分析歷史資料和使用機器學習來實現預測性和規範性分析,提高預測的準確性。

六 資料分析的趨勢

在接下來的幾年裡,資料分析的使用幾乎肯定會繼續顯著增長。然而,並非所有組織都能透過其分析工作取得成功。

簡而言之,分析現在至關重要。Gartner說:“到 2025 年,80% 尋求擴充套件數字業務的組織將失敗,因為他們沒有采用現代方法進行資料和分析治理。”

除了資料治理,其他值得關注的主要趨勢包括:

人工智慧和機器學習。許多最複雜的資料分析形式,包括預測性和規範性分析,都依賴於人工智慧和機器學習能力。隨著這些技術的進步,分析將變得更加強大。

合成資料。 隱私法規通常會限制組織可以直接對客戶資料執行的分析量。解決這個問題的方法之一是使用合成資料,它是匿名的,通常由資料模型和演算法生成。

多種分析解決方案和中心。 大多數大型企業發現沒有單一的分析解決方案可以滿足整個組織的所有需求。專家表示,最成功的公司很可能是那些找到創新方法來結合其各種分析解決方案和資料儲存的公司。

從長遠來看,掌握這些趨勢以及透過資料分析工作確定的趨勢的組織可能是最成功的。

來自 “ 資料驅動智慧 ”, 原文作者:曉曉;原文連結:https://mp.weixin.qq.com/s/pqJDqDMMsoMVqT8mbjwCSA,如有侵權,請聯絡管理員刪除。

相關文章