一個私有協議檔案DB 的解析.
ip 地址庫, 現在手機/web/app 的基礎部件.
LBS 應用的基礎.
在網路上找到了一個簡單的私有協議的ip地址庫部件.
對ip地址的定位, 基本在 0.0x 毫秒 的效率.
根據 專案介紹以及對應的程式碼 做了一個分析.
專案地址:
裡面有提到對應的檔案協議的定義.
然後就根據這個協議直接讀取了這個檔案的二進位制檔案. 然後繞過了. 軟體支援, 直接把資料讀出來了.
* db struct:
* 1. header part
* 1): super part:
* +------------+-----------+
* | 4 bytes
| 4 bytes |
* +------------+-----------+
* start index ptr, end index ptr
*
* 2): b-tree index part
* +------------+-----------+-----------+-----------+
* | 4bytes | 4bytes
| 4bytes
| 4bytes
| ...
* +------------+-----------+-----------+-----------+
* start ip ptr index ptr
*
* 2. data part:
* +------------+-----------------------+
* | 2bytes
| dynamic length
|
* +------------+-----------------------+
* data length city_id|Country|Province|Area|City|ISP
*
* 3. index part: (ip range)
* +------------+-----------+---------------+
* | 4bytes
| 4bytes
| 4bytes
|
* +------------+-----------+---------------+
* start ip
end ip
3 byte data ptr & 1 byte data length
結構就比較簡單.
跟pg / oracle 的資料塊協議有相似之處.
檔案開頭, 定義了一個了一個超級塊 ( supper block ) 兩個 4 位元組的 欄位.
8個位元組, 儲存了 索引快 ( index block) 開始地址, 跟結束地址.
為了支援btree 索引, 對index block 又構建另一個二級索引. head -- index- block.
對 索引塊,(index block) 按照 4K 分割槽, 抽取了ip地址的最小值 ,以及對應的 位置指標.
具體的ip地址索引, 索引塊 ( index block) 12位元組
start ip : 4 bytes ;
end ip : 4 bytes ;
dataptr : 4 bytes : {
datalenth 1 byte ,
dataptr : 3 bytes
}
dataptr 儲存了對應IP地址段 的地區名稱, 以及 對應的 文字的儲存長度.
對二進位制檔案的直接讀取, 到這裡, 就基本可以開工了.
根據 supper block 的 定位到 start- index- block 以及last-index-block
然後構建一個迴圈.
然後直接按照格式讀出來, 生成文字資料就可以了.
i ( , (blkcnt) + ) : file.seek(sidx + i * idxblklen ) row = file.read(idxblklen ) sip,eip,ptr,datlen = getrow(row) fip, lip,cityid,city = getdata(file,sip,eip,ptr,datlen ) (%(L2ip(sip),L2ip(lip),city))
經過抽取, 發現 實際檔案儲存, 與java 版本的maker 的對吧.
檔案裡多了2筆記錄. 即 超級塊的位置定義上應該還是有一個bug.
實際上最後多出來的兩個 index-block 的內容是錯誤的. 是不能合在一個ip段裡面的.
程式碼部分提供的3種 搜尋方法. memory search / binary search /btree - search 基本還是基於二分法的查詢.
還有一個問題. 這個maker 程式碼目前沒有實現 merge 功能, 每次都是隻能重建db 檔案.
如果要實現merge 功能, 即 增量資料的入庫.
需要考慮 . 索引分裂, 以及 head-index block 的重寫. 以及位置移動.
由此引發的一點小思考.
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/133735/viewspace-2665083/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 協議中的私有屬性協議
- 銘說 | 一次私有協議的流量分析協議
- 檔案傳輸協議介紹協議
- Raysync檔案傳輸協議(FTP)協議FTP
- ARP(地址解析協議)和RARP(逆地址解析協議)協議
- Go Module 支援 HTTP 協議的私有庫方案GoHTTP協議
- WebSocket的Frame協議解析Web協議
- ARP地址解析協議-個人總結協議
- 一行命令為專案檔案新增開源協議頭協議
- 檔案傳輸協議的五種安全檔案傳輸替代方案協議
- ARP 地址解析協議協議
- HTTP 協議完全解析HTTP協議
- 檔案共享之SMB/CIFS協議及Samba的使用協議Samba
- 4種傳輸協議設定,檔案傳輸協議如何選擇?協議
- TCP/IP協議及配置、檔案系統TCP協議
- jftp通過sftp協議上傳檔案FTP協議
- ffmpeg 推流檔案,採用rtmp協議協議
- SQL Anywhere db檔案損壞修復 DB檔案修復 DB資料庫修復SQL資料庫
- consul 原始碼解析(一)raft 協議實現原始碼Raft協議
- 還在使用檔案傳輸協議傳輸機密檔案?你可能是對檔案傳輸協議有什麼誤會協議
- iOS開發·專職協議宣告的標頭檔案iOS協議
- 在java中使用SFTP協議安全的傳輸檔案JavaFTP協議
- 支援斷點續傳的大檔案傳輸協議斷點協議
- Linux——檔案傳輸協議知識點梳理Linux協議
- 如何在MacOS中設定共享檔案協議?Mac協議
- 私有云盤防護企業檔案的幾個要點
- HDFS原始碼解析系列一——HDFS通訊協議原始碼協議
- Python使用socket的UDP協議實現FTP檔案服務PythonUDP協議FTP
- 關於檔案傳輸協議,你不知道的事協議
- 超詳細 DNS 協議解析DNS協議
- ARP協議 地址解析協議:IP地址轉換為MAC地址協議Mac
- 認識流媒體協議,從 RTSP 協議解析開始!協議
- CAP一致性協議及應用解析協議
- 博文推薦|深入解析 BookKeeper 多副本協議(一)協議
- Bigfile 用新的方式管理檔案,支援 HTTP,RPC 以及 FTP 協議HTTPRPCFTP協議
- Java下載遠端伺服器檔案到本地(http協議和ssh2協議)Java伺服器HTTP協議
- 5個重要的CCNP協議協議
- Protobuf協議逆向解析-APP爬蟲協議APP爬蟲