一次使用InfluxDB資料庫的總結

Johnson木木發表於2019-07-20

前言

因當前的專案需要記錄每秒鐘伺服器的狀態資訊,例如負載、cpu等等資訊,這些資料都是和時間相關聯的。
因為一秒鐘就要儲存挺多的資料。而且我還在前端做了echart的折線圖,使用websocket實時檢視資料的變化。

第一次的方案

第一次是很簡單的,就是mysql建索引,在時間戳和其餘兩個條件查詢比較多的欄位建索引,然後最近一天的資料是存放到redis快取當中的,
一開始感覺還是不錯的,所以查詢實時的資料還是挺快的,查詢歷史資料因為有索引的關係,所以速度也還可以。
但是隨著資料量的增多,發現查詢歷史資料也逐漸變慢了,資料佔用空間太大了,而且索引的佔用空間竟然也非常的恐怖。

第二次的方案

因為考慮到第一次的解決方案處理稍微有點複雜,並且資料佔用空間大。就網上搜一搜有什麼解決方案,一個時序資料庫的文字進入了
我的猿眼。全稱叫做時間序列資料庫,主要用於帶時間標籤的資料,例如用於實時監控、裝置採集所產生的資料。哦吼?搞一下。


InfluxDb教程

安裝

官方網址:https://docs.influxdata.com/influxdb/v1.7/introduction/installation/

因為我用的是ubuntu18.04,所以下面就把ubuntu的安裝教程寫在這,其他的版本可以到官網上面看看。
新增InfluxData儲存庫:

wget -qO- https://repos.influxdata.com/influxdb.key | sudo apt-key add -
source /etc/lsb-release
echo "deb https://repos.influxdata.com/${DISTRIB_ID,,} ${DISTRIB_CODENAME} stable" | sudo tee /etc/apt/sources.list.d/influxdb.list

安裝並啟動InfluxDb服務

sudo apt-get update && sudo apt-get install influxdb
sudo service influxdb start

到這一步你已經可以使用InfluxDB資料庫啦,埠是8086,剛安裝的InfluxDB是免密登入的,
如果開啟身份驗證就在配置檔案下把auto-enabled選項設定為true

[http]
auth-enable = true

最後使用 -config 選項將程式指向配置檔案:

influxd -config /etc/influxdb/influxdb.conf


視覺化工具InfluxDb Studio

https://github.com/CymaticLabs/InfluxDBStudio

這個工具查詢資料多的時候渲染會很卡,不要以為是查詢資料慢了,
我一開始就是以為查的慢。再說一遍,埠是8086。

客戶端

因為我用的是php,所以就使用了influxdb的php客戶端

php客戶端入口:https://github.com/influxdata/influxdb-php

其它語言的客戶端庫可以在這裡找:

https://docs.influxdata.com/influxdb/v1.7/tools/api_client_libraries/

快速上手:
composer 安裝influxdb-php客戶端

$ composer require influxdb/influxdb-php

直接放php程式碼,註釋和說明在程式碼裡面寫了,比較直接。

//獲取客戶端物件
$client = new \InfluxDB\Client("127.0.0.1", 8086, "username", "password");

//選擇資料庫, 獲取Database物件
$database = $client->selectDB("database_name");
$points = [ 
    new Point("table_name", 3, //第一個引數為表名, 第二個引數為值
        [
            "tags" => 1, //標籤值
        ],
        [
            'fields' => 1 //欄位
        ],
        time()), //最後一個為時間戳
];

//寫入資料, 第一個引數為寫入的資料,第二個引數為時間戳的精度,這裡我們使用秒精度
$database->writePoints($points, Database::PRECISION_SECONDS);

查詢方式分兩種,第一種則是直接使用sql查詢

$database->query("select * from table_name where time > 1563602406s", [
    "epoch" => "s" //讓返回的時間格式為秒精度的時間戳,
])->getPoints(); //返回的陣列集合

sql是不是有點奇怪呢?因為資料儲存的時候InfluxDB是按照自己的格式儲存的,如果要用秒時間戳作為條件查詢,就要這樣寫啦,
在api文件裡面有說明

api文件的快捷入口:https://docs.influxdata.com/influxdb/v1.7/tools/api/

第二種則是使用Builder查詢,其實就是幫你把要查詢的操作封裝起來,到最後解析成SQL,最後再呼叫方式一的query方法。

//2.使用Builder查詢
$builde = $database->getQueryBuilder();
$builde->select("*") //查詢欄位
    ->from("table_name") //表名
    ->setTimeRange(1563602406, 1563602806) //篩選時間範圍
    ->where(["type = 1"]) //查詢條件
    ->getResultSet() //裡面其實就是呼叫了方式1的$database->query方法。
    ->getPoints(); //返回陣列集合

setTimeRange篩選時間範圍這個方法需要注意,如果安裝InfluxDB的機器(虛擬機器)和你開發中機器的時區不同,
就不要用了,因為他提前把時間格式化為Y-m-d H:i:s,然後再拿這個時間去不同時區的機器那裡查詢。資料肯定不對。
好了,到這裡簡單入門就差不多啦。

結語

總結自己的學習過程還是蠻不錯的,每一次學習到新東西,都感覺到提升了自我價值。但是如果不用記錄下來的話,
總感覺少了點什麼。好像過不久就會忘掉一樣,所以學到新東西感覺還是記錄下來比較心安,嘿嘿。
文章中若有不足之處,請各位在下面評論區留下。Thanks♪(・ω・)ノ

相關文章