指標和標籤的基礎理解
一、前言
有朋友問我,什麼是指標,什麼是標籤,最本質的區別在哪?如何識別?不問我,我覺得我比較清晰的,好像很明確,但是被人一問,我覺得我又不清晰了,所以重新學習了一遍,把學習過筆記分享給大家,希望對大家有幫忙和啟發。
二、指標理解
1.指標是說明總體綜合數量特徵的概念,所有指標能用數值來表示,一個完整的統計指標,一定要講時間、地點、範圍(百度);
2.指標的評價較易量化,通常有一定的標準和尺度;
3.指標是生產性思維、拆解式思維,講究的是化整為零,將事物分解開來進行多角度的描述,得到很多的指標;
4.指標最擅長的應用是監測、分析、評價和建模;
5.指標是業務管理導向的,需要提前規劃,應用場景很多,戰略目標、市場定位、業務監測、業績考核、任務分解、資料分析、資料建模、BI應用等。
三、標籤理解
1. 標籤是物件的屬性,顆粒度到欄位級“標籤”則是指從原始資料清洗加工而來,能夠為業務所用併產生價值的資料資源,一般都需要結構化到欄位粒度,保障服務化使用。(標籤類目體系)
2. 標籤是合成性思維、聚合式思維,講究的是化零為整,將多個分散的指標按照一定的原理進行綜合加工,得出概括性的結果;
3. 標籤經常也被稱呼為屬性、特徵、指標、引數等;
4. 指標是半成品,標籤是成品,標籤是指標進一步產品化的結果;
5. 標籤面向資料應用端,解答的是“資料怎麼用”“資料的價值是什麼”的問題;
6. 標籤是資源,是資產,可定價、可售賣、可交易的一種資料產品;
8. 標籤是應用導向的,跟隨業務需求的而變化,隨時增加;
9. 標籤最擅長的應用是標註、刻畫、分類和特徵提取;
10. 標籤主要應用在客戶分群、畫像、觸客、獲客、黏客、續客、資料建模、資料視覺化等;
11. 標籤的評價一般與使用者的感受、應用的結果有強關聯關係,不同的人、不同的應用場景,標籤能發揮的效果可能大相徑庭。
四、標籤分層
1. 理解根目錄、標籤類目、標籤、標籤值四者的區別和聯絡,對標籤體系就比較清晰了。下面是保險資產層級思考,可以對應資料中臺架構設計思考。
2. 根目錄指向標籤所屬的物件:根目錄往往是一種較為模糊、寬泛、簡單的名詞或動名詞,例如使用者、購房者、酒店、瀏覽(記錄)、交易(記錄)、報修(記錄)。按照資料思維,世上的一切事物都可以歸為人、物、關係三類物件,因此一個用來指向某個物件的詞(名詞指向人、物,動名詞指向關係)都不應該是標籤,往往是標籤根目錄。在資料物理層面往往對映為某張大寬表中的主鍵,這張大寬表中的資訊都是對該主鍵物件的詳細刻畫和資料記錄:大寬表的列即對映為標籤,大寬表的行記錄則對應於具體的物件在各標籤屬性上的具體屬性值記錄。
3.類目是對標籤的分類:客戶標籤可以分類為基本資訊、地理位置、社交關係等,這些分類名也是類目名。類目往往由名詞構成。一個類目及其所歸類的標籤在資料物理層面可以和某張具體表對應,例如“客戶”物件的【基本資訊】類目下,有“性別”“年齡”“籍貫”等多個標籤,一般對應於客戶資料庫中的一張客戶基本資訊表,該表中會有“性別”“年齡”“籍貫”等多個欄位。
4. 標籤是物件的屬性,顆粒度到欄位級:“客戶姓名”“客戶電話”“客戶居住地址”等欄位粒度的屬性就是“客戶”物件的標籤。標籤往往由前後兩個名詞構成,前一個名詞作為物件定語修飾後一個名詞。標籤一般對應於某資料庫中某張資料表中的某欄位。
5. 標籤值是物件屬性的具體取值:例如【小明】【小紅】是“客戶姓名”標籤的標籤值,【男】【女】是“性別”標籤的標籤值。標籤值往往是形容詞、名詞或數字,一般對應於資料庫中某張資料表中的某欄位取值。標籤值的取值型別可以是數值型、文字型、日期型、Key-value型,但主要為數值型。數值型中又分可列舉的離散值和不可列舉的連續值。
五、標籤的分類
標籤的分類是為應用服務的,大家可以按需新增。
1. 按照標籤的變化性分為靜態標籤和動態標籤;
2. 按照標籤的指代和評估指標的不同,可分為定性標籤和定量標籤;
3. 按照標籤資產分級分層的方式,可以分為一級標籤、二級標籤、三級標籤等,每一個層級的標籤相當於一個業務維度的切面,符合MECE原則。
5. 按照複雜程度分為:事實標籤、規則標籤和模型標籤。事實標籤通常是寫實的,與指標有較高的重合度,
6. 比如性別,年齡等;規則標籤一般是有一些簡單的規則來控制,符合某種規則時才生成相應的標籤;模型標籤一般需要通過某些機器學習演算法來生成。
六、結論
標籤是物件的屬性,一般到欄位粒度,面向資料應用端,是資源,是資產,可定價、可售賣、可交易的一種資料產品,包含屬性、特徵、指標、引數等;
指標是可量化的,用數值表示的欄位,面向業務管理,需要提前規劃,擅長的應用是監測、分析、評價和建模;
來自 “ 資料治理體系 ”, 原文作者:理哥;原文連結:https://mp.weixin.qq.com/s/nDJecB7g7CvxzrJlpnpCDQ,如有侵權,請聯絡管理員刪除。
相關文章
- 如何正確理解「指標」和「標籤」指標
- 基礎標籤
- HTML基礎-標籤HTML
- C指標原理(14)-C指標基礎指標
- C指標原理(15)-C指標基礎指標
- 指標的理解指標
- 技術基礎 | 重要指標和告警指標
- 函式指標基礎函式指標
- Go 之基礎速學 (四) golang 裡面的指標的理解和實操Golang指標
- PhpCms模板標籤的基礎知識PHP
- properties標籤和typeAliases標籤
- html一些基礎標籤HTML
- C語言基礎-指標C語言指標
- 詳解c++指標的指標和指標的引用C++指標
- HTML常用基礎標籤:圖片與超連結標籤全解!HTML
- [06]HTML基礎之表單標籤HTML
- 2020-10-20 css基礎標籤CSS
- C語言基礎-1、指標C語言指標
- iOS彙編基礎(四)指標和macho檔案iOS指標Mac
- 指標常量和常量指標的區別指標
- C++指標理解C++指標
- HTML基礎知識6-表格標籤HTML
- 基礎演算法之快慢指標演算法指標
- C語言指標(三):陣列指標和字串指標C語言指標陣列字串
- HTML標籤(基本標籤的使用)HTML
- 指標函式 和 函式指標指標函式
- typedef void (*Fun) (void) 的理解——函式指標——typedef函式指標函式指標
- 資料標籤與指標在金融行業的應用指標行業
- 深入理解 Golang 指標Golang指標
- mybatis的 choose -- when test -- otherwise 標籤和 if test 標籤的區別MyBatis
- 說說你對`<meta>`標籤的理解
- 八、Abp vNext 基礎篇丨標籤聚合功能
- NullPointerException空指標異常的理解NullException指標
- C++學習筆記基礎篇15——地址和指標C++筆記指標
- 文字框和標籤
- 二維陣列的指標的理解陣列指標
- Script標籤的async和defer
- 【C++系列】指標物件和物件指標的區別C++指標物件