尚矽谷大資料Hadoop(30)P120-P127Mapreduce-FileinputFormat實現類KeyValueTextInputFormat案例實現NLineInputFormat案例實現
P120-Mapreduce-FileinputFormat實現類
3.1.5CombineTextInputFormat案例操作
1.需求
將輸入的大量小檔案合併成一個切片統一處理。
- (1)輸入資料
準備4個小檔案
- (2)期望
期望一個切片處理4個檔案
2.實現過程
- (1)不做任何處理,執行1.6節的WordCount案例程式,觀察切片個數為4。
- (2)在WordcountDriver中增加如下程式碼,執行程式,並觀察執行的切片個數為3。
(a)驅動類中新增程式碼如下:
// 如果不設定InputFormat,它預設用的是
TextInputFormat.class
job.setInputFormatClass(CombineTextInputFormat.class);
//虛擬儲存切片最大值設定4m
CombineTextInputFormat.setMaxInputSplitSize(job, 4194304
相關文章
- Thread類實現買電影案例thread
- java 一個類實現兩個介面的案例Java
- 使用Spring Boot實現資料庫整合配置案例Spring Boot資料庫
- 簡單實現跑馬燈案例
- 資料庫工具類實現資料庫
- Kafka ACL實現架構以及實操案例剖析Kafka架構
- 騰訊雲大資料實戰案例大資料
- 案例:商品瀏覽記錄的實現
- 【SpringMVC】RESTFul簡介以及案例實現SpringMVCREST
- 搶紅包案例分析以及程式碼實現
- Flutter 仿iOS側滑返回案例實現FlutteriOS
- Hadoop-Map/Reduce實現實現倒排索引Hadoop索引
- 真實案例:使用LLM大模型及BERT模型實現合同審查系統大模型
- 案例:通過shell指令碼實現mysql資料備份與清理指令碼MySql
- 資料庫儲存與索引技術(三)LSM樹實現案例資料庫索引
- 前端實操案例丨如何實現JS向Vue傳值前端JSVue
- iOS 面向切面程式設計的實現與實戰案例iOS程式設計
- 實際案例:如何實現報表回寫時引數聯動輸入資料
- 大資料 - DWS層 業務實現大資料
- Golang 連線池的幾種實現案例Golang
- 使用Java實現簡單的鬥地主案例Java
- 微信小程式實現商城案例(賦原始碼)微信小程式原始碼
- 用JS實現隨機點名小案例JS隨機
- 搶紅包案例分析以及程式碼實現(四)
- 搶紅包案例分析以及程式碼實現(三)
- 搶紅包案例分析以及程式碼實現(二)
- javascript實現隨機小方塊小案例(原型)JavaScript隨機原型
- PHP常用操作類實現——資料庫操作類PHP資料庫
- 好程式設計師web前端分享js實現實戰案例程式設計師Web前端JS
- HashSet 實現類
- 怎麼實現員工和工資大資料分析,echarts+js實現大資料EchartsJS
- Java實現網路爬蟲 案例程式碼Java爬蟲
- 在Spring Boot實現國際化的案例Spring Boot
- 網站日誌統計案例分析與實現網站
- Java 實現壓縮圖片,影片,音訊案例Java音訊
- Android Spingboot 實現SSE通訊案例Androidboot
- asp實現批次錄入資料的實現 (轉)
- C均值聚類 C實現 Python實現聚類Python