mariadb審計日誌通過 logstash匯入 hive

曲珂發表於2018-07-27

原文網址 : https://www.cnblogs.com/txwsqk/p/9376873.html

我們使用的 mariadb, 用的這個審計工具 https://mariadb.com/kb/en/library/mariadb-audit-plugin/

這個工具一點都不考慮後期對資料的處理, 因為他的日誌是這樣的

20180727 11:40:17,aaa-main-mariadb-bjc-001,user,10.1.111.11,3125928,6493942844,QUERY,account,'select


    id, company_id, user_id, department, title, role, create_time, update_time, status,
    is_del, receive_email, contact

    from company


     WHERE (  user_id = 101



                  and is_del = 0 )',0

所以需要上 logstash 格式化一下

input {
  file {
    path => ["/data/logs/mariadb/server_audit.log"]
    start_position => "end"
    codec => multiline {
      charset => "ISO-8859-1"
      pattern => "^[0-9]{8}"
      negate => true
      what => "previous"
    }
  }
}

filter {
    if "quartz" in [message] { drop {} }
    mutate {
        gsub => [
            "message", "\s", " ",
            "message", "\s+", " "
        ]
    }
    dissect {
        mapping => {
            "message" => "%{ts} %{+ts},%{hostname},%{user},%{dbhost},%{connid},%{queryid},%{operate},%{db},%{object}"
        }
    }
    mutate {
        replace => { "message" => "%{ts}    %{hostname}    %{user}    %{dbhost}    %{operate}    %{db}    %{object}" }
    }
}

output {
    file {
        path => "/data/logs/mariadb/%{host}_%{+YYYY-MM-dd_HH}.gz"
        gzip => true
        codec => line { format => "%{message}" }
    }
}

注意 !!!

replace 那個地方各個欄位之間我用的 tab 隔開的, 如果用 vim 一定不能寫\t, 這在hive中不識別的, 要在 vim 中先按 ctrl+v, 再按 tab

在 vim 中 set list 如下顯示才對

mariadb 的審計日誌不能按小時切割,上面 logstash 我把日誌按小時生成 gz 檔案了,後面就是推到 hdfs 中了, 期間試了各種方法

logstash的 output [webhdfs] 效率不行還丟資料

syslog-ng

rsyslog

統統不好用,最終直接使用 hdfs cli簡直完美

我把 logstash 的配置和推送到 hdfs 的命令都打到 rpm 裡,下面貼一下 rpm SPEC 檔案也記錄一下吧

Name:           logstash
Version:        1.0.0
Release:        1%{?dist}
Summary:        specialize to mysql audit log collection
License:        GPL
AutoReqProv:    no

%define __os_install_post %{nil}

%description

%prep

%build

%install
rm -rf $RPM_BUILD_ROOT
mkdir -p %{buildroot}/{apps,etc,usr,var/lib/logstash,var/log/logstash}
cp -r %{_builddir}/etc/* %{buildroot}/etc/
cp -r %{_builddir}/usr/* %{buildroot}/usr/
cp -r %{_builddir}/apps/* %{buildroot}/apps/

%post
chown -R root:root /usr/share/logstash
chown -R root /var/log/logstash
chown -R root:root /var/lib/logstash
chown -R root:root /apps/hadoop-2.6.0
/usr/share/logstash/bin/system-install /etc/logstash/startup.options
cat >> /etc/hosts <<EOF
# for logstash push msyql audit to HDFS
這裡填上 hdfs namenode和 datanode 的 hosts
EOF

echo "$(shuf -i 3-15 -n 1) * * * *" 'source /etc/profile;/apps/hadoop-2.6.0/bin/hdfs dfs -copyFromLocal /data/logs/mariadb/${HOSTNAME}_$(date -u +"\%Y-\%m-\%d_\%H" -d "last hour").gz hdfs://active_namenode/mysql_audit/$(date -u +"\%Y-\%m-\%d")/ && rm -f /data/logs/mariadb/${HOSTNAME}_$(date -u +"\%Y-\%m-\%d_\%H" -d "last hour").gz' >> /var/spool/cron/root

initctl start logstash

%files
%defattr(-,root,root)
/apps/hadoop-2.6.0
/etc/logstash
/usr/share/logstash
/var/lib/logstash
/var/log/logstash


%preun
if [ $1 -eq 0 ]; then
  # Upstart
  if [ -r "/etc/init/logstash.conf" ]; then
    if [ -f "/sbin/stop" ]; then
      /sbin/stop logstash >/dev/null 2>&1 || true
    else
      /sbin/service logstash stop >/dev/null 2>&1 || true
    fi
    if [ -f "/etc/init/logstash.conf" ]; then
      rm /etc/init/logstash.conf
    fi
  # SYSV
  elif [ -r "/etc/init.d/logstash" ]; then
    /sbin/chkconfig --del logstash
    if [ -f "/etc/init.d/logstash" ]; then
      rm /etc/init.d/logstash
    fi
  # systemd
  else
    systemctl stop logstash >/dev/null 2>&1 || true
    if [ -f "/etc/systemd/system/logstash-prestart.sh" ]; then
      rm /etc/systemd/system/logstash-prestart.sh
    fi

    if [ -f "/etc/systemd/system/logstash.service" ]; then
      rm /etc/systemd/system/logstash.service
    fi
  fi
  if getent passwd logstash >/dev/null ; then
    userdel logstash
  fi

  if getent group logstash > /dev/null ; then
    groupdel logstash
  fi
fi


%postun


%clean
rm -rf $RPM_BUILD_ROOT

我把 hadoop 的程式也放進去了,方便

安裝完 rpm 自動啟動 logstash 省勁

現在日誌已經按天寫到 hdfs 中,下面再匯入 hive 中

先建立 hive 表

create table mysql_audit(datetime string,hostname string,username string,dbhost string,operation string,db string,object string) partitioned by (dt int,hour smallint,module string) row format delimited fields terminated by '\t';

分了3個 partition

load hdfs to hive

#!/bin/bash
# Description: load hdfs mysql audit gz to hive
# Author     : quke
# Date       : 2018-07-27

source /root/.bash_profile

cur_date=$(date -u +"%Y-%m-%d" -d "last hour")
cur_date_short=$(date -u +"%Y%m%d" -d "last hour")
cur_hour=$(date -u +"%H" -d "last hour")

for fn in $(hdfs dfs -ls /mysql_audit/${cur_date}/*_${cur_hour}.gz|awk '{print $NF}');do
    host_name=$(echo $fn|awk -F [/_] '{print $(NF-2)}')
    module=${host_name%-bjc*}
    echo "load data inpath 'hdfs://ossmondb${fn}' into table mysql_audit partition(dt=${cur_date_short},hour=${cur_hour},module='${module}');" >> hive.sql
done

hive -f hive.sql && rm -f hive.sql

有任何疑問歡迎交流

使用Logstash工具匯入sqlserver資料到elasticSearch及elk分散式日誌中心
2023-01-15
SQLServerElasticsearch分散式
vertica審計日誌
2019-07-05
logstash收集springboot日誌
2021-04-28
Spring Boot
日誌審計系統
2020-01-19
mysql審計日誌-ProxySQL
2024-07-02
MySql
日誌審計是什麼？為什麼企業需要日誌審計？
2024-10-18
最全 Kubernetes 審計日誌方案
2019-02-22
Logstash mysql匯入es注意
2020-11-25
MySql
（四）Logstash收集、解析日誌方法
2020-11-22
.Net Core 審計日誌實現
2020-12-27
mybatis-plus匯入sql日誌
2024-07-15
MyBatisSQL
日誌服務資料匯入
2022-04-27
Logstash 配置Java日誌格式的方法
2024-09-11
Java
通過 Systemd Journal 收集日誌
2019-03-11
phpMyadmin通過日誌寫webshell
2020-11-23
PHPWebshell
wazuh日誌審計--定製規則
2020-10-21
利用 ELK 處理 Percona 審計日誌
2023-04-12
十八、.net core（.NET 6）搭建ElasticSearch(ES)系列之使用Logstash通過Rabbitmq接收Serilog日誌到ES
2021-06-30
ElasticsearchMQ
logstash匯入movielens測試資料
2022-04-21
日誌分析平臺ELK之日誌收集器logstash
2020-10-02
MySQL審計外掛-MariaDB Audit Plugin
2023-02-22
MySqlPlugin
mysql 系統審計日誌格式說明:
2021-11-30
MySql
請問日誌審計什麼意思呢？
2021-11-15
Kibana+Logstash+Elasticsearch 日誌查詢系統
2020-04-05
Elasticsearch
通過helm部署EFK收集應用日誌，ingress-nginx日誌解析。
2021-07-01
應用日誌Nginx
IIS 日誌匯入到資料庫的方法
2018-07-17
資料庫
比較開源日誌：Logstash、FluentD 和 Fluent Bit
2024-03-17
Elasticsearch+kibana+logstash 搭建日誌收集分析平臺
2022-01-26
Elasticsearch
python通過TimedRotatingFileHandler按時間切割日誌
2019-07-17
Python
深度解讀RDS for MySQL 審計日誌功能和原理
2024-10-29
MySql
HIVE資料匯入基礎
2021-09-09
Hive
將資料匯入kudu表（建立臨時hive表，從hive匯入kudu）步驟
2020-09-24
Hive
批量匯入歷史檔案到日誌服務
2018-11-07
2023最新ELK日誌平臺（elasticsearch+logstash+kibana）搭建
2023-03-19
Elasticsearch
hive匯出到csv hive匯出到excel
2020-11-19
HiveExcel
日誌服務之敏感資訊脫敏與審計
2022-04-27
日誌分析平臺ELK之日誌收集器logstash常用外掛配置
2020-10-03
sqoop用法之mysql與hive資料匯入匯出
2020-12-22
OOPMySqlHive

mariadb審計日誌通過 logstash匯入 hive

相關文章