大資料應用-Flume+HBase+Kafka整合資料採集/儲存/分發完整流程測試03.
系列文章目錄
Flume+HBase+Kafka整合資料採集/儲存/分發完整流程測試
一、說明
兩個flume節點採集slave1,slave2應用伺服器,彙總在master上的flume,然後master上flume分為兩端傳遞資料,一端是傳遞給Kafka,一端是傳遞給HBase,之前各個元件的配置我都已經總結好,詳細請看上面的幾篇文章,這一篇文章主要是對整個資料採集儲存、分發做一個詳細的測試。
二、應用服務模擬器程式開發
新建一個普通專案編寫程式碼
將這個程式碼打包上傳到master
package com.builddata.jar;
import java.io.*;
public class LogReadAndWriter {
private static String readFileName;
private static String writeFileName;
public static void main(String[] args) {
readFileName = args[0];
writeFileName = args[1];
try {
// readInput()
readFileByLines(readFileName);
}catch (Exception e){
}
}
public static void readFileByLines(String filename){
FileInputStream fis = null;
InputStreamReader isr = null;
BufferedReader br = null;
String tempString = null;
try{
System.out.println("以行為單位讀取檔案內容,一次讀一整行:");
fis = new FileInputStream(filename);
// 從檔案系統中的某個檔案中獲取位元組
isr = new InputStreamReader(fis,"GBK");
br = new BufferedReader(isr);
int count = 0;
while ((tempString = br.readLine()) != null){
count++;
// 顯示符號
Thread.sleep(100);
String str = new String(tempString.getBytes("UTF8"),"GBK");
System.out.println("row:"+count+">>>>>>>>>>"+tempString);
method1(writeFileName,tempString);
}
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
} catch (InterruptedException e) {
e.printStackTrace();
} finally {
if (isr != null){
try{
isr.close();
} catch (IOException e) {
e.printStackTrace();
}
}
}
}
public static void method1(String file, String content){
BufferedWriter out = null;
try {
out = new BufferedWriter(new OutputStreamWriter(new FileOutputStream(file,true)));
out.write("\n");
out.write(content);
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
} finally {
try {
out.close();
} catch (IOException e) {
e.printStackTrace();
}
}
}
}
在usr新建jars包
mkdir -p jars
將檔案拷貝到jars目錄下面
cp weblogs.jar /usr/jars
分發到其他兩臺伺服器上去:
scp -r weblogs.jar slave1: /usr/jars
scp -r weblogs.jar slave2: /usr/jars
回到master中編寫啟動指令碼:
相關文章
- flume日誌採集,hbase資料儲存,hive查詢輸出(簡單整合)Hive
- 大資料_資料採集_網頁01大資料網頁
- 監控採集上報和儲存監控資料策略
- 大資料如何採集資料?大資料的資料從何而來?大資料
- 大資料技術之資料採集篇大資料
- HarmonyOS:儲存你的應用資料
- 資料採集知識分享|4大資料採集方式都有什麼?大資料
- 大資料技術與應用課堂測試-資料清洗同步大資料
- Oracle資料倉儲的實時資料採集XSOracle
- 資料儲存(1):從資料儲存看人類文明-資料儲存器發展歷程
- 大資料採集:fillna函式大資料函式
- 雲資料庫HBase大資料儲存及實時分析場景應用解析資料庫大資料
- 儲存過程返回資料集儲存過程
- 《資料儲存》之《分庫,分表》
- 《資料資產管理核心技術與應用》讀書筆記-第二章:後設資料的採集與儲存筆記
- 資料採集與分析的那些事——從資料埋點到AB測試
- 大資料測試學習筆記之測試工具集大資料筆記
- oracle 匿名儲存過程插入大量測試資料Oracle儲存過程
- Alink漫談(七) : 如何劃分訓練資料集和測試資料集
- 大資料測試與 傳統資料庫測試大資料資料庫
- 報表資料分庫儲存
- 大資料測試之揭秘大資料的背景與發展大資料
- 高效採集資料,幫助應用業務增長
- 高效採集資料,伴隨應用業務增長
- 最快方式搭建docker大資料 測試叢集Docker大資料
- 建設資料採集分析平臺,整合業務資料、消滅資料孤島
- 用SharedPreference儲存資料
- Python中高階資料儲存及應用Python
- Web應用中的離線資料儲存Web
- 如何在安卓應用程式中儲存資料安卓
- 大資料應用觸發預測性新聞大資料
- 大資料的儲存和管理大資料
- 玩轉大資料系列之一:資料採集與同步大資料
- MQTT 賦能工業 PLC 資料採集與應用MQQT
- 分庫解決方案—資料儲存
- 資訊化時代大資料系統整合應用大資料
- 資料儲存
- Bond——大資料時代的資料交換和儲存格式大資料