前言
因當前的專案需要記錄每秒鐘伺服器的狀態資訊,例如負載、cpu等等資訊,這些資料都是和時間相關聯的。
因為一秒鐘就要儲存挺多的資料。而且我還在前端做了echart的折線圖,使用websocket實時檢視資料的變化。
第一次的方案
第一次是很簡單的,就是mysql建索引,在時間戳和其餘兩個條件查詢比較多的欄位建索引,然後最近一天的資料是存放到redis快取當中的,
一開始感覺還是不錯的,所以查詢實時的資料還是挺快的,查詢歷史資料因為有索引的關係,所以速度也還可以。
但是隨著資料量的增多,發現查詢歷史資料也逐漸變慢了,資料佔用空間太大了,而且索引的佔用空間竟然也非常的恐怖。
第二次的方案
因為考慮到第一次的解決方案處理稍微有點複雜,並且資料佔用空間大。就網上搜一搜有什麼解決方案,一個時序資料庫的文字進入了
我的猿眼。全稱叫做時間序列資料庫,主要用於帶時間標籤的資料,例如用於實時監控、裝置採集所產生的資料。哦吼?搞一下。
InfluxDb教程
安裝
官方網址:https://docs.influxdata.com/influxdb/v1.7/introduction/installation/
因為我用的是ubuntu18.04,所以下面就把ubuntu的安裝教程寫在這,其他的版本可以到官網上面看看。
新增InfluxData儲存庫:
wget -qO- https://repos.influxdata.com/influxdb.key | sudo apt-key add -
source /etc/lsb-release
echo "deb https://repos.influxdata.com/${DISTRIB_ID,,} ${DISTRIB_CODENAME} stable" | sudo tee /etc/apt/sources.list.d/influxdb.list
安裝並啟動InfluxDb服務
sudo apt-get update && sudo apt-get install influxdb
sudo service influxdb start
到這一步你已經可以使用InfluxDB資料庫啦,埠是8086,剛安裝的InfluxDB是免密登入的,
如果開啟身份驗證就在配置檔案下把auto-enabled
選項設定為true
:
[http]
auth-enable = true
最後使用 -config
選項將程式指向配置檔案:
influxd -config /etc/influxdb/influxdb.conf
視覺化工具InfluxDb Studio
這個工具查詢資料多的時候渲染會很卡,不要以為是查詢資料慢了,
我一開始就是以為查的慢。再說一遍,埠是8086。
客戶端
因為我用的是php,所以就使用了influxdb的php客戶端
其它語言的客戶端庫可以在這裡找:
https://docs.influxdata.com/influxdb/v1.7/tools/api_client_libraries/
快速上手:
composer 安裝influxdb-php客戶端
$ composer require influxdb/influxdb-php
直接放php程式碼,註釋和說明在程式碼裡面寫了,比較直接。
//獲取客戶端物件
$client = new \InfluxDB\Client("127.0.0.1", 8086, "username", "password");
//選擇資料庫, 獲取Database物件
$database = $client->selectDB("database_name");
$points = [
new Point("table_name", 3, //第一個引數為表名, 第二個引數為值
[
"tags" => 1, //標籤值
],
[
'fields' => 1 //欄位
],
time()), //最後一個為時間戳
];
//寫入資料, 第一個引數為寫入的資料,第二個引數為時間戳的精度,這裡我們使用秒精度
$database->writePoints($points, Database::PRECISION_SECONDS);
查詢方式分兩種,第一種則是直接使用sql查詢
$database->query("select * from table_name where time > 1563602406s", [
"epoch" => "s" //讓返回的時間格式為秒精度的時間戳,
])->getPoints(); //返回的陣列集合
sql是不是有點奇怪呢?因為資料儲存的時候InfluxDB是按照自己的格式儲存的,如果要用秒時間戳作為條件查詢,就要這樣寫啦,
在api文件裡面有說明
api文件的快捷入口:https://docs.influxdata.com/influxdb/v1.7/tools/api/
第二種則是使用Builder
查詢,其實就是幫你把要查詢的操作封裝起來,到最後解析成SQL,最後再呼叫方式一的query
方法。
//2.使用Builder查詢
$builde = $database->getQueryBuilder();
$builde->select("*") //查詢欄位
->from("table_name") //表名
->setTimeRange(1563602406, 1563602806) //篩選時間範圍
->where(["type = 1"]) //查詢條件
->getResultSet() //裡面其實就是呼叫了方式1的$database->query方法。
->getPoints(); //返回陣列集合
setTimeRange
篩選時間範圍這個方法需要注意,如果安裝InfluxDB的機器(虛擬機器)和你開發中機器的時區不同,
就不要用了,因為他提前把時間格式化為Y-m-d H:i:s
,然後再拿這個時間去不同時區的機器那裡查詢。資料肯定不對。
好了,到這裡簡單入門就差不多啦。
結語
總結自己的學習過程還是蠻不錯的,每一次學習到新東西,都感覺到提升了自我價值。但是如果不用記錄下來的話,
總感覺少了點什麼。好像過不久就會忘掉一樣,所以學到新東西感覺還是記錄下來比較心安,嘿嘿。
文章中若有不足之處,請各位在下面評論區留下。Thanks♪(・ω・)ノ