如何正確理解「指標」和「標籤」
一、前言
有朋友問我,什麼是指標,什麼是標籤,最本質的區別在哪?如何識別?不問我,我覺得我比較清晰的,好像很明確,但是被人一問,我覺得我又不清晰了,所以重新學習了一遍,把學習過筆記分享給大家,希望對大家有幫忙和啟發。
二、指標理解
1.指標是說明總體綜合數量特徵的概念,所有指標能用數值來表示,一個完整的統計指標,一定要講時間、地點、範圍(百度);
2.指標的評價較易量化,通常有一定的標準和尺度;
3.指標是生產性思維、拆解式思維,講究的是化整為零,將事物分解開來進行多角度的描述,得到很多的指標;
4.指標最擅長的應用是監測、分析、評價和建模;
5.指標是業務管理導向的,需要提前規劃,應用場景很多,戰略目標、市場定位、業務監測、業績考核、任務分解、資料分析、資料建模、BI應用等。
三、標籤理解
1. 標籤是物件的屬性,顆粒度到欄位級“標籤”則是指從原始資料清洗加工而來,能夠為業務所用併產生價值的資料資源,一般都需要結構化到欄位粒度,保障服務化使用。(標籤類目體系)
2. 標籤是合成性思維、聚合式思維,講究的是化零為整,將多個分散的指標按照一定的原理進行綜合加工,得出概括性的結果;
3. 標籤經常也被稱呼為屬性、特徵、指標、引數等;
4. 指標是半成品,標籤是成品,標籤是指標進一步產品化的結果;
5. 標籤面向資料應用端,解答的是“資料怎麼用”“資料的價值是什麼”的問題;
6. 標籤是資源,是資產,可定價、可售賣、可交易的一種資料產品;
8. 標籤是應用導向的,跟隨業務需求的而變化,隨時增加;
9. 標籤最擅長的應用是標註、刻畫、分類和特徵提取;
10. 標籤主要應用在客戶分群、畫像、觸客、獲客、黏客、續客、資料建模、資料視覺化等;
11. 標籤的評價一般與使用者的感受、應用的結果有強關聯關係,不同的人、不同的應用場景,標籤能發揮的效果可能大相徑庭。
四、標籤分層
1. 理解根目錄、標籤類目、標籤、標籤值四者的區別和聯絡,對標籤體系就比較清晰了。下面是保險資產層級思考,可以對應資料中臺架構設計思考。
2. 根目錄指向標籤所屬的物件:根目錄往往是一種較為模糊、寬泛、簡單的名詞或動名詞,例如使用者、購房者、酒店、瀏覽(記錄)、交易(記錄)、報修(記錄)。按照資料思維,世上的一切事物都可以歸為人、物、關係三類物件,因此一個用來指向某個物件的詞(名詞指向人、物,動名詞指向關係)都不應該是標籤,往往是標籤根目錄。在資料物理層面往往對映為某張大寬表中的主鍵,這張大寬表中的資訊都是對該主鍵物件的詳細刻畫和資料記錄:大寬表的列即對映為標籤,大寬表的行記錄則對應於具體的物件在各標籤屬性上的具體屬性值記錄。
3.類目是對標籤的分類:客戶標籤可以分類為基本資訊、地理位置、社交關係等,這些分類名也是類目名。類目往往由名詞構成。一個類目及其所歸類的標籤在資料物理層面可以和某張具體表對應,例如“客戶”物件的【基本資訊】類目下,有“性別”“年齡”“籍貫”等多個標籤,一般對應於客戶資料庫中的一張客戶基本資訊表,該表中會有“性別”“年齡”“籍貫”等多個欄位。
4. 標籤是物件的屬性,顆粒度到欄位級:“客戶姓名”“客戶電話”“客戶居住地址”等欄位粒度的屬性就是“客戶”物件的標籤。標籤往往由前後兩個名詞構成,前一個名詞作為物件定語修飾後一個名詞。標籤一般對應於某資料庫中某張資料表中的某欄位。
5. 標籤值是物件屬性的具體取值:例如【小明】【小紅】是“客戶姓名”標籤的標籤值,【男】【女】是“性別”標籤的標籤值。標籤值往往是形容詞、名詞或數字,一般對應於資料庫中某張資料表中的某欄位取值。標籤值的取值型別可以是數值型、文字型、日期型、Key-value型,但主要為數值型。數值型中又分可列舉的離散值和不可列舉的連續值。
五、標籤的分類
標籤的分類是為應用服務的,大家可以按需新增。
1. 按照標籤的變化性分為靜態標籤和動態標籤;
2. 按照標籤的指代和評估指標的不同,可分為定性標籤和定量標籤;
3. 按照標籤資產分級分層的方式,可以分為一級標籤、二級標籤、三級標籤等,每一個層級的標籤相當於一個業務維度的切面,符合MECE原則。
5. 按照複雜程度分為:事實標籤、規則標籤和模型標籤。事實標籤通常是寫實的,與指標有較高的重合度,
6. 比如性別,年齡等;規則標籤一般是有一些簡單的規則來控制,符合某種規則時才生成相應的標籤;模型標籤一般需要通過某些機器學習演算法來生成。
六、結論
標籤是物件的屬性,一般到欄位粒度,面向資料應用端,是資源,是資產,可定價、可售賣、可交易的一種資料產品,包含屬性、特徵、指標、引數等;
指標是可量化的,用數值表示的欄位,面向業務管理,需要提前規劃,擅長的應用是監測、分析、評價和建模;
來自 “ 資料治理體系 ”, 原文作者:理哥;原文連結:https://mp.weixin.qq.com/s/RURt2pz9YTWIn7Mz1e7O3g,如有侵權,請聯絡管理員刪除。
相關文章
- 指標和標籤的基礎理解指標
- 如何正確執行 DORA 指標指標
- MySQL如何計算重要的指標,來確定配置是否正確MySql指標
- MPLS標籤分發協議正確方式——Vecloud協議Cloud
- 【C++】智慧指標的正確使用方式C++指標
- properties標籤和typeAliases標籤
- 如何正確理解棧和堆?
- 指標的理解指標
- 如何正確使用公開招標、邀請招標、自行招標的流程
- C++指標理解C++指標
- 如何正確的制定目標?(只需4步)
- 詳解c++指標的指標和指標的引用C++指標
- C語言指標(三):陣列指標和字串指標C語言指標陣列字串
- 指標函式 和 函式指標指標函式
- 準確率評價指標指標
- 深入理解 Golang 指標Golang指標
- 匹配html標籤正規表示式HTML
- 匹配 HTML 標籤正規表示式HTML
- 指標常量和常量指標的區別指標
- 文字框和標籤
- 網站標頭的修改,如何修改網站的標題和元標籤網站
- C語言重點——指標篇(一文讓你完全搞懂指標)| 從記憶體理解指標 | 指標完全解析C語言指標記憶體
- 標籤評分:海量標籤如何進行系統治理?
- jmeter軟體指標和硬體指標(16.5)JMeter指標
- 小技巧系列:正則匹配img標籤
- typedef void (*Fun) (void) 的理解——函式指標——typedef函式指標函式指標
- HTML標籤(基本標籤的使用)HTML
- 資料標籤與指標在金融行業的應用指標行業
- 說說你對`<meta>`標籤的理解
- 寫一個方法檢測頁面中的所有標籤是否正確閉合
- 1.0 - 指標和引用指標
- mybatis的 choose -- when test -- otherwise 標籤和 if test 標籤的區別MyBatis
- NullPointerException空指標異常的理解NullException指標
- VOC標籤轉化為YOLO標籤YOLO
- [C++] 成員函式指標和函式指標C++函式指標
- 【C++系列】指標物件和物件指標的區別C++指標物件
- 理解並正確使用synchronized和volatilesynchronized
- Script標籤的async和defer