配置Hadoop中啟用LZO壓縮
關於的centos7中安裝LZO與配置,請參考:http://blog.itpub.net/31511218/viewspace-2151945/
配置Hadoop中啟用LZO壓縮,並完成測試。步驟如下:
一、配置hadoop的hadoop-evn.sh檔案,增加如下內容:
二、配置core-site.xml檔案,增加如下內容:
二、配置mapred-site.xml檔案,增加如下內容:
三、使用hadoop自帶wordcount程式測試
1、測試生成lzo檔案
測試結果:
[hadoop@spark220 mapreduce]$ hdfs dfs -ls /output/wc2
Found 2 items
-rw-r--r-- 1 hadoop supergroup 0 2018-03-17 00:21 /output/wc2/_SUCCESS
-rw-r--r-- 1 hadoop supergroup 113 2018-03-17 00:21 /output/wc2/part-r-00000.lzo
2、生成index檔案:
點選(此處)摺疊或開啟
日誌:
18/03/17 00:23:05 INFO lzo.GPLNativeCodeLoader: Loaded native gpl libraryutput/wc2/part-r-00000.lzo
18/03/17 00:23:05 INFO lzo.LzoCodec: Successfully loaded & initialized native-lzo library [hadoop-lzo rev 049362b7cf53ff5f739d6b1532457f2c6cd495e8]
18/03/17 00:23:06 INFO lzo.LzoIndexer: [INDEX] LZO Indexing file /output/wc2/part-r-00000.lzo, size 0.00 GB...
18/03/17 00:23:07 INFO Configuration.deprecation: hadoop.native.lib is deprecated. Instead, use io.native.lib.available
18/03/17 00:23:07 INFO lzo.LzoIndexer: Completed LZO Indexing in 0.80 seconds (0.00 MB/s). Index size is 0.01 KB.
測試結果:
[hadoop@spark220 common]$ hdfs dfs -ls /output/wc2
Found 3 items
-rw-r--r-- 1 hadoop supergroup 0 2018-03-17 00:21 /output/wc2/_SUCCESS
-rw-r--r-- 1 hadoop supergroup 113 2018-03-17 00:21 /output/wc2/part-r-00000.lzo
-rw-r--r-- 1 hadoop supergroup 8 2018-03-17 00:23 /output/wc2/part-r-00000.lzo.index
至此完成配置與測試
來自@若澤大資料
配置Hadoop中啟用LZO壓縮,並完成測試。步驟如下:
一、配置hadoop的hadoop-evn.sh檔案,增加如下內容:
點選(此處)摺疊或開啟
- export LD_LIBRARY_PATH=/usr/local/hadoop/lzo/lib
二、配置core-site.xml檔案,增加如下內容:
點選(此處)摺疊或開啟
-
<!--支援的壓縮列表-->
-
<property>
-
<name>io.compression.codecs</name>
-
<value>
-
org.apache.hadoop.io.compress.GzipCodec,
-
org.apache.hadoop.io.compress.DefaultCodec,
-
org.apache.hadoop.io.compress.BZip2Codec,
-
org.apache.hadoop.io.compress.SnappyCodec,
-
com.hadoop.compression.lzo.LzoCodec,
-
com.hadoop.compression.lzo.LzopCodec
-
</value>
-
</property>
-
-
-
<!--支援LZO使用類-->
-
<property>
-
<name>io.compression.codec.lzo.class</name>
-
<value>com.hadoop.compression.lzo.LzopCodec</value>
- </property>
二、配置mapred-site.xml檔案,增加如下內容:
點選(此處)摺疊或開啟
-
<!--啟用map中間檔案壓縮-->
-
<property>
-
<name>mapreduce.map.output.compress</name>
-
<value>true</value>
-
</property>
-
<!--啟用map中間壓縮類-->
-
<property>
-
<name>mapred.map.output.compression.codec</name>
-
<value>com.hadoop.compression.lzo.LzopCodec</value>
-
</property>
-
<!--啟用mapreduce檔案壓縮-->
-
<property>
-
<name>mapreduce.output.fileoutputformat.compress</name>
-
<value>true</value>
-
</property>
-
<!--啟用mapreduce壓縮類-->
-
<property>
-
<name>mapreduce.output.fileoutputformat.compress.codec</name>
-
<value>com.hadoop.compression.lzo.LzopCodec</value>
-
</property>
-
<!--配置Jar包-->
-
<property>
-
<name>mapred.child.env</name>
-
<value>LD_LIBRARY_PATH=/usr/local/hadoop/lzo/lib</value>
- </property>
三、使用hadoop自帶wordcount程式測試
1、測試生成lzo檔案
點選(此處)摺疊或開啟
- cd /app/hadoop-2.6.0-cdh5.7.0/share/hadoop/mapreduce
- hadoop jar hadoop-mapreduce-examples-2.6.0-cdh5.7.0.jar wordcount /input/test1.txt /output/wc2
[hadoop@spark220 mapreduce]$ hdfs dfs -ls /output/wc2
Found 2 items
-rw-r--r-- 1 hadoop supergroup 0 2018-03-17 00:21 /output/wc2/_SUCCESS
-rw-r--r-- 1 hadoop supergroup 113 2018-03-17 00:21 /output/wc2/part-r-00000.lzo
2、生成index檔案:
點選(此處)摺疊或開啟
- cd /app/hadoop-2.6.0-cdh5.7.0/share/hadoop/common
- hadoop jar hadoop-lzo-0.4.19.jar com.hadoop.compression.lzo.LzoIndexer /output/wc2/part-r-00000.lzo
18/03/17 00:23:05 INFO lzo.GPLNativeCodeLoader: Loaded native gpl libraryutput/wc2/part-r-00000.lzo
18/03/17 00:23:05 INFO lzo.LzoCodec: Successfully loaded & initialized native-lzo library [hadoop-lzo rev 049362b7cf53ff5f739d6b1532457f2c6cd495e8]
18/03/17 00:23:06 INFO lzo.LzoIndexer: [INDEX] LZO Indexing file /output/wc2/part-r-00000.lzo, size 0.00 GB...
18/03/17 00:23:07 INFO Configuration.deprecation: hadoop.native.lib is deprecated. Instead, use io.native.lib.available
18/03/17 00:23:07 INFO lzo.LzoIndexer: Completed LZO Indexing in 0.80 seconds (0.00 MB/s). Index size is 0.01 KB.
測試結果:
[hadoop@spark220 common]$ hdfs dfs -ls /output/wc2
Found 3 items
-rw-r--r-- 1 hadoop supergroup 0 2018-03-17 00:21 /output/wc2/_SUCCESS
-rw-r--r-- 1 hadoop supergroup 113 2018-03-17 00:21 /output/wc2/part-r-00000.lzo
-rw-r--r-- 1 hadoop supergroup 8 2018-03-17 00:23 /output/wc2/part-r-00000.lzo.index
至此完成配置與測試
來自@若澤大資料
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31511218/viewspace-2151946/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- spark中配置啟用LZO壓縮Spark
- CentOS7中安裝LZO壓縮程式CentOS
- hadoop支援lzo完整過程Hadoop
- Hadoop上配置snappy壓縮格式(最簡單的做法)HadoopAPP
- Keka for Mac(壓縮解壓工具) 1.3.6中文啟用版Mac
- nginx快取配置及開啟gzip壓縮Nginx快取
- Hadoop(十九)MapReduce OutputFormat 資料壓縮HadoopORM
- Hadoop支援的壓縮格式對比和應用場景以及Hadoop native庫Hadoop
- 如何透過ZBlogPHP啟用Gzip壓縮?PHP
- 如何在Spring Boot應用程式中啟用GZIP壓縮? | 前端後端Spring Boot前端後端
- 解壓縮工具:Bandizip for mac 中文啟用版Mac
- 前端效能最佳化——啟用文字壓縮前端
- vue-cli 啟動gzip壓縮,及後臺配置Vue
- tomcat網頁壓縮配置Tomcat網頁
- rar壓縮解壓工具:RAR Extractor - ZIP Unarchiver中文啟用版Hive
- Linux中檔案的壓縮和解壓縮Linux
- Apache 開啟gzip壓縮Apache
- Nginx網路壓縮 CSS壓縮 圖片壓縮 JSON壓縮NginxCSSJSON
- 專業解壓縮軟體:Oka解壓專家 for Mac v2.1.7中文啟用版Mac
- vue-cli3.0配置GZIP壓縮Vue
- CentOS中zip壓縮和unzip解壓縮命令詳解CentOS
- nginx指定埠開啟gzip壓縮Nginx
- Vue開啟gzip壓縮檔案Vue
- Apache開啟GZIP壓縮功能方法Apache
- 專業版解壓/壓縮工具:MyZip Pro for Mac v1.2.5免啟用版Mac
- 實用的壓縮解壓工具:WinZip for MacMac
- 用ASP實現線上壓縮與解壓縮功能程式碼
- 檔案壓縮和解壓縮
- 簡單解壓縮工具:OmniZip - Universal Extractor Pro 中文啟用版
- hadoop叢集配置和啟動Hadoop
- 人工智慧在資料壓縮中的應用人工智慧
- 蘋果Mac壓縮解壓工具:Archiver 4 for Mac v4.0.0註冊啟用版蘋果MacHive
- 怎麼把影片壓縮?實用又簡單的壓縮影片方法
- Python實現壓縮和解壓縮Python
- linux下壓縮解壓縮命令Linux
- linux壓縮和解壓縮命令整理Linux
- JS壓縮方法及批量壓縮JS
- 4K Image Compressor Pro fo mac(圖片壓縮器) 1.0.1中文啟用版Mac