Facebook的Realtime Hadoop及其應用

熊貓夜未眠發表於2011-09-14

enter link description here 作者：冠誠, IBM中國研究院, 研究員

在今年的SIGMOD‘11上，Facebook又發了一篇新paper，講述了它們在提高Hadoop實時性上的工作及其應用。簡單來講，他們的專案需求主要有：

 1.Elasticity（伸縮性）
 2. High write throughput（高寫吞吐量）
 3. Efficient and low-latency strong consistency semantics    within
a    data center（單個data center內高效能、低延遲的強一致性）
 4. Efficient random reads from disk（disk的高效能隨機讀）
 5. High Availability and Disaster Recovery（高可靠性、災後恢復能力）
 6. Fault Isolation（錯誤隔離）
 7. Atomic read-modify-write primitives（read-modify-write原子操作）
 8. Range Scans（範圍掃描）

最終他們選擇了Hadoop和HBase作為解決方案的基石，因為HBase已經滿足了上述需求中的大部分。與此同時，他們還做了如下三點改進以滿足實時性需求：
1. File Appends
2. Name Node的高可靠性優化 (AvatarNode)
3. HBase的讀效能的優化

文章還列舉了三個基於此方案的應用：Facebook Message，Facebook Insight，Facebook Metric Systems，大家可以著重看看這三個應用的特點及需求是怎樣被這個方案滿足的。

在現在這個時代，只有大公司才有如此大的資料來做新東西，難怪Facebook，Google的paper被大量追捧了。

參考資料：

1 Facebook’s New Realtime Analytics System: HBase To Process 20 Billion Events Per Day

2 Real Time Analytics for Big Data: An Alternative Approach

ZooKeeper 原理及其在 Hadoop 和 HBase 中的應用
2017-02-27
Hadoop
大資料之 ZooKeeper原理及其在Hadoop和HBase中的應用
2017-09-17
大資料Hadoop
Facebook實時人體姿態估計：Dense Pose及其應用展望
2019-02-10
Ajax及其應用
2024-03-12
Facebook 的應用機器學習平臺
2018-02-11
機器學習
泛型及其應用
2016-08-29
泛型
閉包及其應用
2018-07-05
解析 Facebook 的 Flux 應用架構
2015-03-21
UX應用架構
hadoop jetty的應用薦
2014-12-22
HadoopJetty
動態代理的原理及其應用
2018-08-07
流程卡的應用及其侷限性
2021-11-15
掃描線及其應用
2020-12-15
位運算子及其應用
2016-11-19
Hash函式及其應用
2015-06-12
函式
如何改善應用啟動效能 | Facebook 應用的經驗分享
2021-12-22
淺析RunLoop原理及其應用
2020-04-06
OOP
淺談webscoket原理及其應用
2019-12-03
Web
Java 組合模式及其應用
2021-06-02
Java模式
閉包及其應用場景
2018-08-27
Sherman-Morrison公式及其應用
2018-05-09
公式
Hash 演算法及其應用
2010-05-21
演算法
AllFacebook:Facebook應用領先iPhone和Android總和
2010-09-23
iPhoneAndroid
Facebook應用Mercurial經驗談
2014-01-08
JavaScript中的bind方法及其常見應用
2018-03-10
JavaScript
說說 PHP 的魔術方法及其應用
2017-04-11
PHP
AOP及其在Spring中的應用（一） .
2012-12-18
Spring
AOP及其在Spring中的應用（二）
2012-12-18
Spring
Facebook註冊移動應用以投放應用廣告
2019-10-14
線段樹差分及其應用
2020-08-04
細說 Java 泛型及其應用
2019-04-01
Java泛型
Vue底層架構及其應用
2019-05-30
Vue架構
【分散式】CAP理論及其應用
2021-07-17
分散式
堆排序原理及其應用場景
2021-07-27
排序
【資料結構】——堆及其應用
2018-02-25
資料結構
Java 超程式設計及其應用
2017-05-12
Java程式設計
6.6 哈夫曼樹及其應用
2024-06-14
Hadoop的Server及其執行緒模型分析
2015-07-28
HadoopServer執行緒模型
Hadoop 的 Server 及其執行緒模型分析
2015-07-26
HadoopServer執行緒模型

Facebook的Realtime Hadoop及其應用

相關文章