資料分析基礎—3.1 認識資料

lanyu發表於2021-09-09

圖片描述

資料,已經滲透到社會的每一個領域,成為影響社會發展的重要因素。每一天,甚至每一分鐘,都會有海量資料透過企業的各種應用產生。如何從資料中獲取有價值的資訊,將成為資料化運營的基本能力。

        一、資料的含義

        資料是指對客觀事物發展規律進行記錄的原始材料。

        它可以是數字,也可以是文字、字母、符號,圖形、影像、影片、音訊等,例如,“1、2、3...100、101...”、“陰、雨、下降、氣溫”、“公司員工的檔案記錄、網店出貨記錄”等都是資料。

        二、資料的分類

        我們可以簡單的把資料分成兩類: 數值型資料、屬性資料。

        1、數值型資料

        是可以進行加減乘除等數值運算的資料。例如,公司員工的績效、考勤、薪酬等都是典型的數值型資料。

        2、屬性資料

        是分類或者定性描述是反應事物屬性的資料。如:員工“性別”的取值為男或女,員工“表現評價”的取值為優、良、中、一般等,這些資料一般不進行數值運算。

        例如:部分公司股票資訊分析

圖片描述

股票分析表

        上圖中的股價和市值兩欄的資料是數值型資料,公司名稱、所屬行業、近期表現、概念幾欄的資料為屬性資料。

        三、資料的表現形式

        在真實的業務場景中資料的儲存通常是透過資料庫來完成的,那麼透過下面的費用表例子來給大家介紹一下資料中最常見的兩種表現形式“欄位“和“記錄“,例如:

圖片描述

費用表

        費用表的列我們稱之為欄位,代表是事物或現象的特徵。

        費用表的行我們稱之為資料記錄。即為具體資料,是事物特徵的具體表現。

        在實際的大資料場景中,記錄的數量會有幾十億幾百億條甚至更多,在進行資料分析之前,認識資料,對其進行正確分類和拆解,熟悉每種資料型別的性質是進行資料分析運用的基礎。


圖片描述



作者:小明學資料
連結:


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/2035/viewspace-2816320/,如需轉載,請註明出處,否則將追究法律責任。

相關文章