Flume:資料匯入到hdfs中
在前面的部落格上我說了flume就是三個最重要的地方,分別是分別是source、channel、sink,source是獲取資料,channel是通道,傳輸資料的,sink是把資料給誰的,這裡顯而易見的是把資料給hdfs的,所以我們只需要在前面的基礎上改sink就可以了
在之前的基礎上修改a.conf檔案中的sink
修改完後啟動hadoop
檢視程式是否開啟,其實這裡只需開dfs就行了,不需要啟動yarn
接著啟動flume
新建一個檔案,因為我們配置的時候是監控目錄的,所以複製一個檔案到那個資料夾下
寫入一些資料在test檔案中
接著把檔案移動到a1_test資料夾下
然後我們會發現flume有變化
前面那個箭頭是指我們移動過去的檔案傳輸到了一個目錄下面去了,並且改了一個名字,這是因為我在配置中寫了以時間來命名的,相關配置可以去官網上看,而後面那個箭頭指向的檔案的字尾是tmp,這是因為檔案還在寫入,寫完後它自動會把tmp去掉
然後登入我的hadoop
直接進入目錄/user/hadoop/flumedir
接著就會發現我剛剛移動過去的檔案的資訊
跟著箭頭一直點,這個目錄我也不知道是什麼
接著會發現一個00的目錄,我猜是以編號來命名資料夾的吧
最後終於發現了我們的檔案,是以FlumeData為字首,這個字首是預設的,自己也可修改,字尾是一串數字,這串數字是時間的資訊。
相關文章
- odps平臺將資料匯入到hdfs
- Flume採集到HDFS
- Flume將 kafka 中的資料轉存到 HDFS 中Kafka
- 資料匯入終章:如何將HBase的資料匯入HDFS?
- 大資料3-Flume收集資料+落地HDFS大資料
- Sqoop將MySQL資料匯入到hive中OOPMySqlHive
- 使用Flume消費Kafka資料到HDFSKafka
- Mysql 大資料表 資料匯入到SqlServer 中的方法MySql大資料Server
- 匯入excel資源到資料庫Excel資料庫
- GeoRapter工具將shapefile資料匯入到Oracle空間資料庫中APTOracle資料庫
- python將目標檢測資料匯入到指定資料庫中Python資料庫
- java 從EXCEL匯入到資料庫JavaExcel資料庫
- 建立HDFS,匯入HADOOP jar包HadoopJAR
- 如何將外部資料庫 匯入到系統的SQL中資料庫SQL
- MongoDB--Mongodb 中資料匯出與匯入MongoDB
- .NET Core使用NPOI將Excel中的資料批量匯入到MySQLExcelMySql
- IIS 日誌匯入到資料庫的方法資料庫
- 資料庫 MySQL 資料匯入匯出資料庫MySql
- sqoop資料匯入匯出OOP
- Oracle 資料匯入匯出Oracle
- 資料泵匯出匯入
- Oracle資料匯入匯出Oracle
- phpMyAdmin匯入/匯出資料PHP
- 大文字資料,匯入匯出到資料庫資料庫
- MySQL入門--匯出和匯入資料MySql
- MATLAB匯入資料Matlab
- 將資料庫中資料匯入至solr索引庫資料庫Solr索引
- Flume採集資料時在HDFS上產生大量小檔案的問題
- 使用navicat匯出查詢大量資料結果集並匯入到其他資料庫(mysql)資料庫MySql
- SpringBoot+Mybatis-plus整合easyExcel批次匯入Excel到資料庫+匯出ExcelSpring BootMyBatisExcel資料庫
- Mongodb資料的匯出與匯入MongoDB
- oracle資料匯出匯入(exp/imp)Oracle
- 匯入和匯出AWR的資料
- EasyPoi, Excel資料的匯入匯出Excel
- Mysql 資料庫匯入與匯出MySql資料庫
- .sql檔案匯入到sql server中SQLServer
- Excel 表匯入資料Excel
- MySQL資料的匯入MySql