關於海量資料常用的資料結構

OpenSoucre發表於2014-07-17

資料結構	應用場景	示例
雜湊表	要求所有鍵值對放入記憶體，查詢可以在常數時間內完成。	l 提取某日誌訪問百度次數最多的IP l 統計不同電話號碼的個數
堆	插入和調整需要O(logn)時間，n為堆元素的個數，而獲取堆頂元素只需要常數時間。	l 求出海量資料前K大的數 l 求海量資料流的中位數
BitMap	通常記錄整數出現的情況，用來快速查詢、數字判重、刪除元素等。	l 統計不同電話號碼的個數 l 2.5億個整數中查出不同重複的整數個數
雙層桶	兩次定址方式以節省記憶體，通常用在求第K大、中位數和數字判重。	l 2.5億整數找出中位數 l 海量資料的第K大的值
反向索引	通過單詞-文件，屬性-實體建索引，方便後序查詢	l 基於關鍵詞的搜尋 l 搜尋框輸入的自動補全
外排	借用硬碟空間實現海量資料排序	l 1GB大小的檔案，每行是一個詞，記憶體1MB，返回頻率最高的100的詞
字首樹	為集合內所有單詞建立字首樹	l 求出熱門的查詢字串 l 求出重複率較高的詞
MapReduce	分散式處理，將資料交給不同機器去處理，劃分資料，然後規約結果	l 海量日誌分析 l 資料探勘 l 智慧推薦系統

關於資料結構
2020-10-27
資料結構
關於Mysql索引的資料結構
2022-04-29
MySql索引資料結構
Go常用的資料結構
2019-01-23
Go資料結構
關於資料結構的學習心得
2024-07-07
資料結構
Java關於資料結構的實現：樹
2019-02-06
Java資料結構
快手關於海量模型資料處理的實踐
2024-02-07
模型
Python常用資料結構（列表）
2021-06-25
Python資料結構
列舉python常用的資料結構
2022-03-05
Python資料結構
Java關於資料結構的實現：雜湊
2019-03-03
Java資料結構
Java刷題常用的資料結構總結
2023-02-26
Java資料結構
常用資料結構-namedtuple(命名元祖）
2020-11-02
資料結構
圖解Java常用資料結構
2018-12-31
圖解Java資料結構
資料結構程式碼常用模板
2024-06-17
資料結構
資料結構之資料、資料元素、資料項、資料物件之間的關係
2021-06-11
資料結構物件
資料結構中常用的數學公式
2018-05-19
資料結構公式
python演算法與資料結構-資料結構中常用樹的介紹(45)
2019-07-04
Python演算法資料結構
資料結構——關聯容器
2020-10-25
資料結構
關於資料結構的理解超級棒的網站！！！！
2018-11-22
資料結構網站
JAVA常用資料結構及原理分析
2020-11-09
Java資料結構
[20190930]關於資料結構設計問題.txt
2019-10-04
資料結構
關於資料庫鎖的總結
2020-11-24
資料庫
資料結構與演算法——常用高階資料結構及其Java實現
2018-03-04
資料結構演算法Java
結構化資料、半結構化資料和非結構化資料
2018-06-21
database資料庫的資料結構
2021-12-13
Database資料庫資料結構
資料結構相關知識
2018-08-14
資料結構
【資料結構篇】認識資料結構
2021-04-27
資料結構
Java常用資料結構之Map-HashMap
2018-11-07
Java資料結構HashMap
Java常用資料結構之Set之TreeSet
2018-11-26
Java資料結構
Redis叢集模式和常用資料結構
2024-03-20
Redis模式資料結構
Java常用資料結構之Stack&Vector
2018-12-24
Java資料結構
關於Web開發中的“程式=資料結構+演算法”
2019-01-11
Web資料結構演算法
【譯】資料結構中關於樹的一切（java版）
2018-04-17
資料結構Java
SeaTunnel用於海量資料的同步和轉換
2022-01-13
資料結構小白系列之資料結構概述
2019-03-05
資料結構
mysql資料庫-資料結構
2021-06-27
MySql資料庫資料結構
C++資料結構和pb資料結構的轉換
2024-04-14
C++資料結構
結構化資料與非結構化資料的差異
2022-03-01
海量非結構化資料儲存難題，杉巖資料物件儲存完美解決
2020-01-17
物件
資料結構
2024-11-28
資料結構

關於海量資料常用的資料結構

相關文章