00【線上日誌分析】之專案概述和GitHub專案地址
1.前期基本架構圖
2.最終基本架構圖
3.版本
Flume: 1.7
Hadoop: 2.7.3
Scala: 2.11
Kafka: 0.10.1.0
Spark: 2.0.2
InfluxDB: 1.2.0
Grafana: 4.1.1
maven: 3.3.9
4.主要目的
主要是想基於Exec Source開發自定義外掛AdvancedExecSource,將機器名稱 和 服務名稱 新增到cdh 服務的角色log資料的每一行前面,則格式為:機器名稱 服務名稱 年月日 時分秒.毫秒 日誌級別 日誌資訊 ;
然後在後面的spark streaming 實時計算我們所需求:比如統計每臺機器的服務的每秒出現的error次數 、統計每5秒的warn,error次數等等;
來實時視覺化展示和郵件簡訊、微信企業號通知。
其實主要我們現在的很多監控服務基本達不到秒級的通知,都為5分鐘等等,為了方便我們自己的維護;
其實對一些即將出現的問題可以提前預知;
其實最主要可以有效擴充套件到實時計算資料庫級別日誌,比如MySQL慢查詢日誌,nginx,tomcat,linux的系統級別日誌等等。
5.大概流程
1.搭建hadoop cluster
2.eclipse 匯入flume原始碼(window7 安裝maven,eclipse,eclipse與maven整合)
3.開發flume-ng 自定義外掛
4.flume 收集,匯聚到hdfs(主要測試是否匯聚成功,後期也可以做離線處理)
5.flume 收集,匯聚到kafka
6.搭建kafka monitor
7.搭建 spark client
8.window7裝ieda開發工具
9.idea開發 spark streaming 的wc
10.讀取kafka日誌,開發spark streaming的這塊日誌分析
11.寫入influxdb
12.grafana視覺化展示
13.整合郵件
6.百度雲: 密碼:m2rs
7.GitHub: (歡迎大家單擊Star,持續關注)
2.最終基本架構圖
3.版本
Flume: 1.7
Hadoop: 2.7.3
Scala: 2.11
Kafka: 0.10.1.0
Spark: 2.0.2
InfluxDB: 1.2.0
Grafana: 4.1.1
maven: 3.3.9
4.主要目的
主要是想基於Exec Source開發自定義外掛AdvancedExecSource,將機器名稱 和 服務名稱 新增到cdh 服務的角色log資料的每一行前面,則格式為:機器名稱 服務名稱 年月日 時分秒.毫秒 日誌級別 日誌資訊 ;
然後在後面的spark streaming 實時計算我們所需求:比如統計每臺機器的服務的每秒出現的error次數 、統計每5秒的warn,error次數等等;
來實時視覺化展示和郵件簡訊、微信企業號通知。
其實主要我們現在的很多監控服務基本達不到秒級的通知,都為5分鐘等等,為了方便我們自己的維護;
其實對一些即將出現的問題可以提前預知;
其實最主要可以有效擴充套件到實時計算資料庫級別日誌,比如MySQL慢查詢日誌,nginx,tomcat,linux的系統級別日誌等等。
5.大概流程
1.搭建hadoop cluster
2.eclipse 匯入flume原始碼(window7 安裝maven,eclipse,eclipse與maven整合)
3.開發flume-ng 自定義外掛
4.flume 收集,匯聚到hdfs(主要測試是否匯聚成功,後期也可以做離線處理)
5.flume 收集,匯聚到kafka
6.搭建kafka monitor
7.搭建 spark client
8.window7裝ieda開發工具
9.idea開發 spark streaming 的wc
10.讀取kafka日誌,開發spark streaming的這塊日誌分析
11.寫入influxdb
12.grafana視覺化展示
13.整合郵件
說明:針對自身情況,自行選擇,步驟如上,但不是固定的,有些順序是可以打亂的,例如開發工具的安裝,可以一起操作的,再如這幾個元件的下載編譯,如果不
想編譯可以直接下tar包的,自行選擇就好,但是建議還是自己編譯,遇到坑才能更好的記住這個東西,本身這個專案就是學習提升的過程,要是什麼都是現成的,
那就沒什麼意義了
6.百度雲: 密碼:m2rs
7.GitHub: (歡迎大家單擊Star,持續關注)
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/30089851/viewspace-2132037/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 22【線上日誌分析】之專案第二階段概述
- 專案(Explore)總結之專案概述
- 電商專案之收貨地址理解
- Apache 子專案 概述Apache
- ELK實時分析之php的laravel專案日誌PHPLaravel
- 上傳專案到gitHub,上傳報錯和刪除gitHub上的專案Github
- GitHub專案大多不是開源專案Github
- GitHub生成帶token的專案程式碼連結地址Github
- mingqq專案地址
- 專案日誌
- GitHub上面找專案Github
- github克隆專案太慢Github
- 專案分析
- Github上fork專案後保持與源專案更新Github
- 上傳專案到githubGithub
- 使用GitHub託管專案Github
- Github 建立自己的專案Github
- 網際網路金融專案——工作日誌(五)之 maven專案打包Maven
- 專案管理過程概述 (轉)專案管理
- 16【線上日誌分析】之grafana-4.1.1 Install和新建日誌分析的DashBoardGrafana
- java專案日誌配置檔案Java
- <Zhuuu_ZZ>Spark專案之log日誌資料分析處理Spark
- 專案與專案群管理:主要區別和相似之處
- AKM專案軼事之新新專案
- 專案總結之專案失誤
- 專案經理之專案跟蹤
- Hadoop專案實戰-使用者行為分析之應用概述(一)Hadoop
- Hadoop專案實戰-使用者行為分析之應用概述(二)Hadoop
- Hadoop專案實戰-使用者行為分析之應用概述(三)Hadoop
- Kowala專案分析
- oracle效能調優:管理oracle日誌之調整線上日誌檔案Oracle
- Kafka專案實戰-使用者日誌上報實時統計之應用概述Kafka
- 大資料專案實戰之 --- 使用者畫像專案分析大資料
- GitHub 上有哪些適合新手跟進的優質專案?(附地址)Github
- GitHub 搜尋專案小技巧Github
- GitHub 上優質專案整理Github
- GitHub實用開源專案Github
- 上傳已有專案至 GitHubGithub