結構化資料、半結構化資料和非結構化資料
結構化資料、半結構化資料和非結構化資料
結構化資料
結構化的資料是指可以使用關係型資料庫表示和儲存,表現為二維形式的資料。一般特點是:資料以行為單位,一行資料表示一個實體的資訊,每一行資料的屬性是相同的。舉一個例子:
id name age gender
1 lyh 12 male
2 liangyh 13 female
3 liang 18 male
- 1
- 2
- 3
- 4
所以,結構化的資料的儲存和排列是很有規律的,這對查詢和修改等操作很有幫助。但是,顯然,它的擴充套件性不好(比如,我希望增加一個欄位,怎麼辦?)。
半結構化資料
半結構化資料是結構化資料的一種形式,它並不符合關係型資料庫或其他資料表的形式關聯起來的資料模型結構,但包含相關標記,用來分隔語義元素以及對記錄和欄位進行分層。因此,它也被稱為自描述的結構。
半結構化資料,屬於同一類實體可以有不同的屬性,即使他們被組合在一起,這些屬性的順序並不重要。
常見的半結構資料有XML和JSON,對於對於兩個XML檔案,第一個可能有
<person>
<name>A</name>
<age>13</age>
<gender>female</gender>
</person>
- 1
- 2
- 3
- 4
- 5
第二個可能為:
<person>
<name>B</name>
<gender>male</gender>
</person>
- 1
- 2
- 3
- 4
從上面的例子中,屬性的順序是不重要的,不同的半結構化資料的屬性的個數是不一定一樣的。有些人說半結構化資料是以樹或者圖的資料結構儲存的資料,怎麼理解呢?上面的例子中,<person>
標籤是樹的根節點,<name>
和<gender>
標籤是子節點。通過這樣的資料格式,可以自由地表達很多有用的資訊,包括自我描述資訊(後設資料)。所以,半結構化資料的擴充套件性是很好的。
非結構化資料
顧名思義,就是沒有固定結構的資料。各種文件、圖片、視訊/音訊等都屬於非結構化資料。對於這類資料,我們一般直接整體進行儲存,而且一般儲存為二進位制的資料格式。
相關文章
- 結構化資料與非結構化資料的差異
- python字典和結構化資料Python
- 非結構化資料怎麼盤點?
- Qlik:非結構化資料和GenAI洞察報告AI
- 可持久化資料結構持久化資料結構
- 杉巖資料非結構化資料儲存解決方案
- 資料庫結構的優化資料庫優化
- 可持久化資料結構1持久化資料結構
- 資料結構最佳化DP資料結構
- DBMS和資料倉儲趨勢:整合化裝置與非結構化資料CF
- 結構化與非結構化
- Spark效能優化:優化資料結構Spark優化資料結構
- 港大開源GraphAgent: 破解結構化與非結構化資料融合的AI智慧體AI智慧體
- 透過結構化資料構建頁面
- 【Immutable.js】可持久化資料結構以及結構分享JS持久化資料結構
- 【資料結構篇】認識資料結構資料結構
- 資料結構小白系列之資料結構概述資料結構
- 什麼是非結構化資料(unstructured data)?Struct
- 結構化資料上的 TopN 運算
- 淺談資料結構最佳化DP資料結構
- TensorFlow中結構化資料工具Protocol BufferProtocol
- 資料結構 中綴表示式轉化資料結構
- C++資料結構和pb資料結構的轉換C++資料結構
- 資料結構資料結構
- 資料結構與演算法-資料結構(棧)資料結構演算法
- 資料結構:快速排序程式碼(已優化)資料結構排序優化
- Serilog文件翻譯系列(四) - 結構化資料
- 【資料結構】可持久化線段樹初步資料結構持久化
- Python掙錢系列:資料整合之-結構化企業資料Python
- 請求支援,我們被非結構化資料包圍了!
- 【PHP資料結構】PHP資料結構及演算法總結PHP資料結構演算法
- MaxCompute讀取分析OSS非結構化資料的實踐經驗總結
- 想要玩轉資料視覺化?先弄清我們能用非結構化資料做什麼吧視覺化
- leetcode演算法資料結構題解---資料結構LeetCode演算法資料結構
- 數字化轉型時代:非結構化資料保護是關鍵
- 【資料結構——圖和圖的儲存結構】資料結構
- 資料結構——樹資料結構
- Redis資料結構Redis資料結構