Flume:資料匯入到hdfs中
在前面的部落格上我說了flume就是三個最重要的地方,分別是分別是source、channel、sink,source是獲取資料,channel是通道,傳輸資料的,sink是把資料給誰的,這裡顯而易見的是把資料給hdfs的,所以我們只需要在前面的基礎上改sink就可以了
在之前的基礎上修改a.conf檔案中的sink
修改完後啟動hadoop
檢視程式是否開啟,其實這裡只需開dfs就行了,不需要啟動yarn
接著啟動flume
新建一個檔案,因為我們配置的時候是監控目錄的,所以複製一個檔案到那個資料夾下
寫入一些資料在test檔案中
接著把檔案移動到a1_test資料夾下
然後我們會發現flume有變化
前面那個箭頭是指我們移動過去的檔案傳輸到了一個目錄下面去了,並且改了一個名字,這是因為我在配置中寫了以時間來命名的,相關配置可以去官網上看,而後面那個箭頭指向的檔案的字尾是tmp,這是因為檔案還在寫入,寫完後它自動會把tmp去掉
然後登入我的hadoop
直接進入目錄/user/hadoop/flumedir
接著就會發現我剛剛移動過去的檔案的資訊
跟著箭頭一直點,這個目錄我也不知道是什麼
接著會發現一個00的目錄,我猜是以編號來命名資料夾的吧
最後終於發現了我們的檔案,是以FlumeData為字首,這個字首是預設的,自己也可修改,字尾是一串數字,這串數字是時間的資訊。
相關文章
- odps平臺將資料匯入到hdfs
- Flume將 kafka 中的資料轉存到 HDFS 中Kafka
- 資料匯入終章:如何將HBase的資料匯入HDFS?
- 大資料3-Flume收集資料+落地HDFS大資料
- MySQL資料匯入到infobright中MySql
- Sql Server資料庫資料匯入到SQLite資料庫中Server資料庫SQLite
- Sqoop將MySQL資料匯入到hive中OOPMySqlHive
- Excel的資料匯入到PB的DW中Excel
- 把ACCESS的資料匯入到Mysql中(轉)MySql
- Mysql 大資料表 資料匯入到SqlServer 中的方法MySql大資料Server
- pl/sql developer將excel資料匯入到資料庫中SQLDeveloperExcel資料庫
- 使用Flume消費Kafka資料到HDFSKafka
- 【匯入匯出】將資料匯入到其他使用者
- 把csv檔案的資料匯入到oracle資料庫中Oracle資料庫
- 匯入excel資源到資料庫Excel資料庫
- java 實現excel中的資料匯入到資料庫的功能JavaExcel資料庫
- 用exp/imp把遠端資料匯入到本地資料庫中資料庫
- 如何將資料匯入到 SQL Server Compact Edition 資料庫中SQLServer資料庫
- 在SQL Server資料庫中匯入匯出資料SQLServer資料庫
- java 從EXCEL匯入到資料庫JavaExcel資料庫
- 把Excel表資料匯入到mysqlExcelMySql
- 從Excel到匯入MYSQL資料庫ExcelMySql資料庫
- GeoRapter工具將shapefile資料匯入到Oracle空間資料庫中APTOracle資料庫
- python將目標檢測資料匯入到指定資料庫中Python資料庫
- 如何將外部資料庫 匯入到系統的SQL中資料庫SQL
- 文字檔案用sqlldr工具匯入到oracel資料庫中SQL資料庫
- 如何把資料從Mysql匯入到GreenplumMySql
- 將Mysql資料匯入到ElasticSearch叢集MySqlElasticsearch
- 將資料從文字匯入到mysql(轉)MySql
- .NET Core使用NPOI將Excel中的資料批量匯入到MySQLExcelMySql
- 將excel中資料從window上匯入到linux中oracle資料庫ExcelLinuxOracle資料庫
- 建立HDFS,匯入HADOOP jar包HadoopJAR
- Oracle資料匯入到Hive資料庫的操作方法OracleHive資料庫
- Flume-ng HDFS sink原理解析
- flume 寫往hdfs引數理解分析
- IIS 日誌匯入到資料庫的方法資料庫
- 把資料匯入到不同的表空間
- 遠端資料庫AWR 匯入到本地分析資料庫