大資料：protobuf是啥玩意兒

發表於2019-05-11

原文網址 : http://www.topthink.com/topic/11993.html

protobuf使用者結構化資料往hbase裡存取只用。http://blog.csdn.net/caisini_vc/article/details/5599468
首先，protobuf是一個開源專案（官方站點在“這裡”），而且是後臺很硬的開源專案。網上現有的大部分（至少80%）開源專案，要麼是某人單幹、要麼是幾個閒雜人等合夥搞。而protobuf則不然，它是鼎鼎大名的Google公司開發出來，並且在Google內部久經考驗的一個東東。由此可見，它的作者絕非一般閒雜人等可比。
那這個聽起來牛X的東東到底有啥用處捏？簡單地說，這個東東干的事兒其實和XML 差不多，也就是把某種資料結構的資訊，以某種格式儲存起來。主要用於資料儲存、傳輸協議格式等場合。有同學可能心理犯嘀咕了：放著好好的XML不用，幹嘛重新發明輪子啊？！先別急，後面俺自然會有說道。
話說到了去年（大約是08年7月），Google突然大發慈悲，把這個好東西貢獻給了開源社群。這下，像俺這種喜歡撿現成的傢伙可就有福啦！貌似喜歡撿現成的傢伙還蠻多滴，再加上Google的號召力，開源後不到一年，protobuf的人氣就已經很旺了。所以俺為了與時俱進，就單獨開個帖子來忽悠一把。
★protobuf有啥特色？
掃盲完了之後，就該聊一下技術方面的話題了。由於這玩意兒釋出的時間較短（未滿週歲），所以俺接觸的時間也不長。今天在此是先學現賣，列位看官多多包涵:-)
◇效能好/效率高
現在，俺就來說說Google公司為啥放著好端端的XML不用，非要另起爐灶，重新造輪子。一個根本的原因是XML效能不夠好。
先說時間開銷：XML格式化（序列化）的開銷倒還好；但是XML解析（反序列化）的開銷就不敢恭維啦。俺之前經常碰到一些時間效能很敏感的場合，由於不堪忍受XML解析的速度，棄之如敝履。
再來看空間開銷：熟悉XML語法的同學應該知道，XML格式為了有較好的可讀性，引入了一些冗餘的文字資訊。所以空間開銷也不是太好（不過這點缺點，俺不常碰到）。
由於Google公司賴以吹噓的就是它的海量資料和海量處理能力。對於幾十萬、上百萬機器的叢集，動不動就是PB級的資料量，哪怕效能稍微提高0.1%也是相當可觀滴。所以Google自然無法容忍XML在效能上的明顯缺點。再加上Google從來就不缺造輪子的牛人，所以protobuf也就應運而生了。
Google對於效能的偏執，那可是出了名的。所以，俺對於Google搞出來protobuf是非常滴放心，效能上不敢說是最好，但肯定不會太差。
◇程式碼生成機制
除了效能好，程式碼生成機制是主要吸引俺的地方。為了說明這個程式碼生成機制，俺舉個例子。
比如有個電子商務的系統（假設用C++實現），其中的模組A需要傳送大量的訂單資訊給模組B，通訊的方式使用socket。
假設訂單包括如下屬性：
具體內容，請點選檢視

回覆

《星際之門》系列之二：星門到底啥玩意兒？
2019-06-25
Spring註解？啥玩意？
2019-07-01
Spring
csdn什麼玩意兒嗎
2024-07-26
哥們，B/S瞭解嗎？——啥玩意，我是敲程式碼的
2019-07-23
Protobuf 為啥比 JSON、XML 牛？
2021-11-20
JSONXML
啥是資料庫正規化
2020-11-06
資料庫
IT圈兒最香的工種，將會是啥？
2022-04-21
快應用、快服務、服務直達…這些到底是啥玩意
2020-05-19
【大資料】科普一下大資料的那些事兒
2022-03-20
大資料
還不知道大資料是幹啥嗎？來看看全球10個智慧城市大資料應用案例！
2019-06-01
大資料
資料分析師到底是幹啥的？
2023-12-01
大資料分析為啥越來越重要
2021-12-09
大資料
學習大資料從哪兒下手
2018-04-08
大資料
當Synchronized遇到這玩意兒，有個大坑，要注意！
2022-02-14
synchronized
檢視是什麼玩意
2018-05-20
用資料視角看看區塊鏈是啥？
2022-07-19
區塊鏈
啥啥啥，服務治理是個啥
2021-02-01
Cool 你一定要看一看的玩意兒
2020-04-04
如何使用 Protobuf 做資料交換
2019-11-22
Burpsuite中protobuf資料流的解析
2020-08-19
UI
大資料是什麼？大資料的趨勢？
2019-06-22
大資料
什麼是大資料？大資料能做什麼？
2022-03-20
大資料
什麼是大資料?大資料開發是做什麼的?
2019-12-04
大資料
什麼是大資料？
2022-06-22
大資料
詳解通訊資料協議ProtoBuf
2018-03-07
協議
前後端資料互動利器--Protobuf
2021-08-01
後端
到底什麼是大資料？新手學大資料的路徑是什麼？
2019-10-25
大資料
敗家玩意兒！Redis 竟然浪費了這麼多記憶體！
2020-11-30
Redis記憶體
什麼是大資料安全?
2022-09-02
大資料
大資料分析是什麼
2022-03-09
大資料
高效的資料壓縮編碼方式 Protobuf
2018-05-31
Protobuf: 高效資料傳輸的秘密武器
2023-05-11
資料大屏，僅僅是資料展示嗎？
2022-04-20
微服務？資料庫？它們之間到底是啥關係？
2019-05-16
微服務資料庫
一個基於運氣的資料結構，你猜是啥？
2020-12-07
資料結構
啥是雲主機，雲主機是啥樣的？
2020-10-22
思考gRPC：為什麼是protobuf
2018-07-19
RPC
大資料前景如何？大資料開發工程師是什麼？
2020-03-14
大資料工程師

大資料：protobuf是啥玩意兒

回覆

相關文章