資料結構 |
應用場景 |
示例 |
雜湊表 |
要求所有鍵值對放入記憶體,查詢可以在常數時間內完成。 |
l 提取某日誌訪問百度次數最多的IP l 統計不同電話號碼的個數 |
堆 |
插入和調整需要O(logn)時間,n為堆元素的個數,而獲取堆頂元素只需要常數時間。 |
l 求出海量資料前K大的數 l 求海量資料流的中位數 |
BitMap |
通常記錄整數出現的情況,用來快速查詢、數字判重、刪除元素等。 |
l 統計不同電話號碼的個數 l 2.5億個整數中查出不同重複的整數個數 |
雙層桶 |
兩次定址方式以節省記憶體,通常用在求第K大、中位數和數字判重。 |
l 2.5億整數找出中位數 l 海量資料的第K大的值 |
反向索引 |
通過單詞-文件,屬性-實體建索引,方便後序查詢 |
l 基於關鍵詞的搜尋 l 搜尋框輸入的自動補全 |
外排 |
借用硬碟空間實現海量資料排序 |
l 1GB大小的檔案,每行是一個詞,記憶體1MB,返回頻率最高的100的詞 |
字首樹 |
為集合內所有單詞建立字首樹 |
l 求出熱門的查詢字串 l 求出重複率較高的詞 |
MapReduce |
分散式處理,將資料交給不同機器去處理,劃分資料,然後規約結果 |
l 海量日誌分析 l 資料探勘 l 智慧推薦系統 |
關於海量資料常用的資料結構
相關文章
- 關於資料結構資料結構
- 關於Mysql索引的資料結構MySql索引資料結構
- Go常用的資料結構Go資料結構
- 關於資料結構的學習心得資料結構
- Java關於資料結構的實現:樹Java資料結構
- 快手關於海量模型資料處理的實踐模型
- Python常用資料結構(列表)Python資料結構
- 列舉python常用的資料結構Python資料結構
- Java關於資料結構的實現:雜湊Java資料結構
- Java刷題常用的資料結構總結Java資料結構
- 常用資料結構-namedtuple(命名元祖)資料結構
- 圖解Java常用資料結構圖解Java資料結構
- 資料結構程式碼常用模板資料結構
- 資料結構之資料、資料元素、資料項、資料物件之間的關係資料結構物件
- 資料結構中常用的數學公式資料結構公式
- python演算法與資料結構-資料結構中常用樹的介紹(45)Python演算法資料結構
- 資料結構——關聯容器資料結構
- 關於資料結構的理解超級棒的網站!!!!資料結構網站
- JAVA常用資料結構及原理分析Java資料結構
- [20190930]關於資料結構設計問題.txt資料結構
- 關於資料庫鎖的總結資料庫
- 資料結構與演算法——常用高階資料結構及其Java實現資料結構演算法Java
- 結構化資料、半結構化資料和非結構化資料
- database資料庫的資料結構Database資料庫資料結構
- 資料結構相關知識資料結構
- 【資料結構篇】認識資料結構資料結構
- Java常用資料結構之Map-HashMapJava資料結構HashMap
- Java常用資料結構之Set之TreeSetJava資料結構
- Redis叢集模式和常用資料結構Redis模式資料結構
- Java常用資料結構之Stack&VectorJava資料結構
- 關於Web開發中的“程式=資料結構+演算法”Web資料結構演算法
- 【譯】資料結構中關於樹的一切(java版)資料結構Java
- SeaTunnel用於海量資料的同步和轉換
- 資料結構小白系列之資料結構概述資料結構
- mysql資料庫-資料結構MySql資料庫資料結構
- C++資料結構和pb資料結構的轉換C++資料結構
- 結構化資料與非結構化資料的差異
- 海量非結構化資料儲存難題 ,杉巖資料物件儲存完美解決物件
- 資料結構資料結構