大資料的實時查詢

小弟季義欽發表於2014-05-28

原文網址 : https://blog.csdn.net/jiq408694711/article/details/27403761

最近出現了一個很火的詞，叫做流式計算，可以做很高的實時處理，比如Twitter的Storm，它的特點是不處理靜態資料，而是處理會連續產生的流式資料，而Hadoop專注於批處理，因為Hadoop為批處理作了高度優化，MapReduce系統典型地通過排程批量任務來操作靜態資料；而流式計算的典型正規化之一是不確定資料速率的事件流流入系統，系統處理能力必須與事件流量匹配，或者通過近似演算法等方法優雅降級，通常稱為負載分流（load-shedding）。

所以兩者應用場景還是不同的。

最近比較關心一個問題，就是大資料的實時查詢。一般如何實現呢，簡單瞭解了一下，大概有幾種方式吧：

（1）HBase+Solr：比如某電信專案中採用HBase來儲存使用者終端明細資料，供前臺頁面即時查詢。HBase無可置疑擁有其優勢，但其本身只對rowkey支援毫秒級的快速檢索，對於多欄位的組合查詢卻無能為力。針對HBase的多條件查詢也有多種方案，但是這些方案要麼太複雜，要麼效率太低，基於Solr的HBase多條件查詢原理很簡單，將HBase表中涉及條件過濾的欄位和rowkey在Solr中建立索引，通過Solr的多條件查詢快速獲得符合過濾條件的rowkey值，拿到這些rowkey之後在HBASE中通過指定rowkey進行查詢。

（2）Impala：Hadoop的新成員，是Cloudera公司主導開發的新型查詢系統，它提供SQL語義，能查詢儲存在Hadoop的HDFS和HBase中的PB級大資料。已有的Hive系統雖然也提供了SQL語義，但由於Hive底層執行使用的是MapReduce引擎，仍然是一個批處理過程，難以滿足查詢的互動性。相比之下，Impala的最大特點也是最大賣點就是它的快速。

還需要進一步的調研。

Prometheus時序資料庫-資料的查詢
2021-03-15
Prometheus資料庫
SSH：hiberate實現資料的查詢（單查詢和全查詢）
2019-01-01
如何使用 Milvus 向量資料庫實現實時查詢
2022-04-01
資料庫
概括SQL Server實時查詢Oracle資料庫WS
2022-03-21
SQLServerOracle資料庫
查詢訂單付款超時的資料
2024-11-19
TableStore多元索引，大資料查詢的利器
2019-02-28
索引大資料
mysql查詢最近時間的一組資料
2018-12-21
MySql
關於Oracle資料庫的時間查詢
2018-06-06
Oracle資料庫
流式查詢1. mybatis的遊標Cursor，分頁大資料查詢
2024-07-11
MyBatis大資料
LINUX下查詢大檔案及大的資料夾
2018-07-04
Linux
SQL Server實戰四：查詢資料庫的資料
2024-05-06
SQLServer資料庫
Flask——資料的查詢
2019-08-24
Flask
Hadoop - 實時查詢Drill
2018-05-22
Hadoop
MySQL - 資料查詢 - 簡單查詢
2020-12-27
MySql
PB級資料實時查詢，滴滴Elasticsearch多叢集架構實踐
2022-12-06
Elasticsearch架構
Laravel 查詢資料庫欄位內容是 Json 陣列時的查詢語句
2021-09-26
Laravel資料庫JSON陣列
Java ——MongDB 插入資料、模糊查詢、in查詢
2018-08-10
Java
資料庫高階查詢之子查詢
2018-07-15
資料庫
Mysql查詢一行資料超時分析
2020-12-18
MySql
RESTFul資料查詢
2018-09-22
REST
MYSQL查詢資料
2024-04-01
MySql
indexedDB 查詢資料
2019-07-27
Index
AMS 資料查詢
2024-08-28
解析MSSQL跨資料庫查詢的實現方法
2021-09-09
SQL資料庫
Excel資料庫轉MySQL，實現查詢
2024-11-11
Excel資料庫MySql
Iceberg 資料治理及查詢加速實踐
2023-02-25
5 大類 15 小類查詢型別全面對比，三大流行時序資料庫查詢效能孰強孰劣
2023-03-09
型別資料庫
Sublime Text 查詢時排除指定的資料夾或檔案
2018-08-16
mysql資料庫查詢時用到的分頁方法有哪些
2024-08-02
MySql資料庫
efcore 跨表查詢，實現一個介面內查詢兩個不同資料庫裡各自的表資料
2020-07-06
資料庫
資料庫基礎查詢--單表查詢
2018-07-15
資料庫
elasticsearch查詢之大資料集分頁查詢
2022-02-08
Elasticsearch大資料
查詢資料庫的資料量的大小
2018-08-02
資料庫
查詢前90%的資料值
2018-06-30
MySQL 查詢重複的資料
2020-03-18
MySql
資料庫查詢慢的原因
2019-06-29
資料庫
Mysql 查詢近半年的資料
2024-10-30
MySql
大資料量查詢容易OOM？試試MySQL流式查詢
2021-01-04
大資料OOMMySql
使用cglib實現資料庫框架的級聯查詢
2019-02-27
CGLib資料庫框架

大資料的實時查詢

相關文章