閱讀目錄
本文版權歸mephisto和部落格園共有,歡迎轉載,但須保留此段宣告,並給出原文連結,謝謝合作。
文章是哥(mephisto)寫的,SourceLink
序
上一篇,我們從發展歷程,架構,MapReduce等方面對比了Hadoop1.x與Hadoop2.x,特別是這這幾年,2.x的發展已經可以適合很多的應用場景了。前面我們通過Eclipse外掛來進行檔案的上傳,刪除等,下面我們熟悉下Hadoop命令,從而更能直接,強力的對Hadoop進行操作。
下面,我們就開始對Hadoop命令進行粗略的解析。本文有些地方是自己翻譯的,翻譯的不好望見諒。本章節內容較多,還是分為上中下三部分。
概述
一:概述
所有的hadoop命令均由bin/hadoop指令碼引發。不指定引數執行hadoop指令碼會列印所有命令的描述。
用法:hadoop [--config confdir] [COMMAND] [GENERIC_OPTIONS] [COMMAND_OPTIONS]
Hadoop有一個選項解析框架用於解析一般的選項和執行類。
命令選項 描述 --config confdir 覆蓋預設配置目錄。預設是${HADOOP_HOME}/conf。 --loglevel loglevel 覆蓋日誌級別. 有效的日誌級別是 FATAL, ERROR, WARN, INFO, DEBUG, and TRACE. 預設是 INFO. GENERIC_OPTIONS 多個命令都支援的通用選項。 COMMAND_OPTIONS 各種各樣的命令和它們的選項會在下面提到。 HDFS and YARN 在其他文件有講解。 二:常規選項
很多子命令 通過配置選項來改變他們的行為。
GENERIC_OPTION 描述 -archives <comma separated list of archives> 指定要在計算機一個逗號分隔的檔案。僅適用於job。 -conf <configuration file> 指定應用程式的配置檔案。 -D <property>=<value> 為指定property指定值value。 -files <comma separated list of files> 指定要拷貝到map reduce叢集的檔案的逗號分隔的列表。 只適用於job。 -jt <local> or <resourcemanager:port> 指定job tracker。只適用於job 。 -libjars <comma seperated list of jars> 指定要包含到classpath中的jar檔案的逗號分隔的列表。 只適用於job.
Hadoop Common Commands
一:介紹
所有這些命令都是從Hadoop的shell命令執行。他們被分成使用者命令和管理命令。
User Commands
一:介紹
用於Hadoop叢集使用者命令。
二:archive
建立一個hadoop檔案檔案。參考 Hadoop Archives Guide.
用法:hadoop archive -archiveName name -p <parent> [-r <replication factor>] <src>* <dest>
-archiveName 你想創造檔案的名字.
-p 制定父路徑,制定了後,後面的src dest都是相對路徑
src 檔案系統的路徑名,和通常含正則表達的一樣。
dest 儲存檔案檔案的目標目錄。
三:checknative
這個命令檢查Hadoop原生程式碼的可用性。 See #NativeLibraries.html for more information. 預設情況下,此命令只檢查libhadoop的可用性。
用法: hadoop checknative [-a] [-h]
COMMAND_OPTION Description -a Check all libraries are available. -h print help 四:classpath
列印Hadoop jar和所需的libs的class路徑。
用法: hadoop classpath [--glob |--jar <path> |-h |--help]
COMMAND_OPTION Description --glob expand wildcards --jar path write classpath as manifest in jar named path -h, --help print help 五:credential
用於管理 credentials, passwords and secrets
用法: hadoop credential <subcommand> [options]
COMMAND_OPTION Description create alias [-provider provider-path] Prompts the user for a credential to be stored as the given alias. The hadoop.security.credential.provider.path within the core-site.xml file will be used unless a -provider is indicated. delete alias [-provider provider-path] [-f] Deletes the credential with the provided alias. The hadoop.security.credential.provider.path within the core-site.xml file will be used unless a -provider is indicated. The command asks for confirmation unless -f is specified list [-provider provider-path] Lists all of the credential aliases The hadoop.security.credential.provider.path within the core-site.xml file will be used unless a -provider is indicated. 六:distcp
遞迴複製檔案或目錄. More information can be found at Hadoop DistCp Guide.
七:fs
這個命令在 File System Shell Guide描述. 在HDFS使用中,hdfs,dfs是相同的。
八:jar
執行一個jar檔案。使用yarn jar來執行Yarn app來代替。
使用: hadoop jar <jar> [mainClass] args...
九:key
通過KeyProvider來管理keys。
十:trace
檢視和修改Hadoop tracing 設定。 See the Tracing Guide.
十一:version
列印版本
用法:hadoop version
十二:CLASSNAME
指令碼可用於調呼叫任何類
用法:hadoop CLASSNAME
Administration Commands
一:介紹
用於管理Hadoop cluster
二:daemonlog
獲取/設定在後臺Log的級別
用法:hadoop daemonlog -getlevel <host:httpport> <classname>
hadoop daemonlog -setlevel <host:httpport> <classname> <level>例如: $ bin/hadoop daemonlog -setlevel 127.0.0.1:50070 org.apache.hadoop.hdfs.server.namenode.NameNode DEBUG
File System Shell
一:介紹
呼叫檔案系統(FS)Shell命令應使用 bin/hadoop fs <args>的形式。 所有的的FS shell命令使用URI路徑作為引數。URI格式是scheme://authority/path。對HDFS檔案系統,scheme是hdfs,對本地檔案系統,scheme是file。其中scheme和authority引數都是可選的,如果未加指定,就會使用配置中指定的預設scheme。一個HDFS檔案或目錄比如/parent/child可以表示成hdfs://namenode:namenodeport/parent/child,或者更簡單的/parent/child(假設你配置檔案中的預設值是namenode:namenodeport)。大多數FS Shell命令的行為和對應的Unix Shell命令類似,不同之處會在下面介紹各命令使用詳情時指出。出錯資訊會輸出到stderr,其他資訊輸出到stdout。
二:appendToFile
附加單個或多個src從本地檔案系統到目標檔案系統,另外從stdin讀取輸入並追加到目標檔案系統。
用法: hadoop fs -appendToFile <localsrc> ... <dst>
三:cat
將路徑指定檔案的內容輸出到stdout。
用法: hadoop fs -cat URI [URI ...]
四:checksum
返回檔案的校驗資訊。
用法: hadoop fs -checksum URI
五:chgrp
改變檔案所屬的組。使用-R將使改變在目錄結構下遞迴進行。命令的使用者必須是檔案的所有者或者超級使用者
用法: hadoop fs -chgrp [-R] GROUP URI [URI ...]
六:chmod
改變檔案的許可權。使用-R將使改變在目錄結構下遞迴進行。命令的使用者必須是檔案的所有者或者超級使用者
用法: hadoop fs -chmod [-R] <MODE[,MODE]... | OCTALMODE> URI [URI ...]
七:chown
改變檔案的擁有者。使用-R將使改變在目錄結構下遞迴進行。命令的使用者必須是超級使用者
用法:hadoop fs -chown [-R] [OWNER][:[GROUP]] URI [URI ]
八:copyFromLocal
除了限定源路徑是一個本地檔案外,和put命令相似。
用法:hadoop fs -copyFromLocal <localsrc> URI
九:copyToLocal
除了限定目標路徑是一個本地檔案外,和get命令類似。
用法: hadoop fs -copyToLocal [-ignorecrc] [-crc] URI <localdst>
十:count
計算在匹配指定檔案模式的路徑下的目錄、檔案和位元組數
用法: hadoop fs -count [-q] [-h] [-v] <paths>
十一:cp
將檔案從源路徑複製到目標路徑。這個命令允許有多個源路徑,此時目標路徑必須是一個目錄。
用法: hadoop fs -cp [-f] [-p | -p[topax]] URI [URI ...] <dest>
十二:createSnapshot
See HDFS Snapshots Guide.
十三:deleteSnapshot
See HDFS Snapshots Guide.
十四:df
顯示free空間。
用法: hadoop fs -df [-h] URI [URI ...]
十五:du
顯示目錄中所有檔案的大小,或者當只指定一個檔案時,顯示此檔案的大小
用法: hadoop fs -dus <args>
十六:expunge
清空回收站。請參考HDFS Architecture Guide以獲取更多關於回收站特性的資訊。
用法: hadoop fs -expunge
十七:find
查詢與指定表示式匹配的所有檔案,並將選定的操作應用於它們。如果沒有指定路徑,則預設為當前工作目錄。如果沒有指定表示式,則預設為列印。
用法: hadoop fs -find <path> ... <expression> ...
十八:get
複製檔案到本地檔案系統。可用-ignorecrc選項複製CRC校驗失敗的檔案。使用-crc選項複製檔案以及CRC資訊。
用法: hadoop fs -getfacl [-R] <path>
十九:getfacl
顯示訪問控制列表(ACL)的檔案和目錄。如果一個目錄中有一個預設的ACL,然後getfacl也顯示預設的ACL。
用法: hadoop fs -getfacl [-R] <path>
二十:getfattr
顯示檔案或目錄的擴充套件屬性名和值(如果有的話)
用法: hadoop fs -getfattr [-R] -n name | -d [-e en] <path>
二十一:getmerge
接受一個源目錄和一個目標檔案作為輸入,並且將源目錄中所有的檔案連線成本地目標檔案。addnl是可選的,用於指定在每個檔案結尾新增一個換行符。
用法: hadoop fs -getmerge <src> <localdst> [addnl]
二十二:help
返回使用輸出
用法: hadoop fs -help
二十三:ls
如果是檔案,則按照如下格式返回檔案資訊:
檔名 <副本數> 檔案大小 修改日期 修改時間 許可權 使用者ID 組ID
如果是目錄,則返回它直接子檔案的一個列表,就像在Unix中一樣。目錄返回列表的資訊如下:
目錄名 <dir> 修改日期 修改時間 許可權 使用者ID 組ID用法: hadoop fs -ls [-d] [-h] [-R] [-t] [-S] [-r] [-u] <args>
二十四:lsr
ls命令的遞迴版本。類似於Unix中的ls -R。
用法: hadoop fs -lsr <args>
二十五:mkdir
接受路徑指定的uri作為引數,建立這些目錄。其行為類似於Unix的mkdir -p,它會建立路徑中的各級父目錄。
用法: hadoop fs -mkdir [-p] <paths>
二十六:moveFromLocal
類似put的用法,在copy後除了source localsrc都刪除。
用法: hadoop fs -moveFromLocal <localsrc> <dst>
二十七:moveToLocal
輸出一個”not implemented“資訊。
用法: hadoop fs -moveToLocal [-crc] <src> <dst>
二十八:mv
將檔案從源路徑移動到目標路徑。這個命令允許有多個源路徑,此時目標路徑必須是一個目錄。不允許在不同的檔案系統間移動檔案。
用法: hadoop fs -mv URI [URI ...] <dest>
二十九:put
從本地檔案系統中複製單個或多個源路徑到目標檔案系統。也支援從標準輸入中讀取輸入寫入目標檔案系統。
用法: hadoop fs -put <localsrc> ... <dst>
三十:renameSnapshot
See HDFS Snapshots Guide.
三十一:rm
刪除指定的檔案。只刪除非空目錄和檔案。請參考rmr命令瞭解遞迴刪除。
用法: hadoop fs -rm [-f] [-r |-R] [-skipTrash] URI [URI ...]
三十二:rmdir
刪除一個資料夾
用法: hadoop fs -rmdir [--ignore-fail-on-non-empty] URI [URI ...]
三十三:rmr
delete的遞迴版本。
用法: hadoop fs -rmr [-skipTrash] URI [URI ...]
三十四:setfacl
設定訪問控制列表(ACL)的檔案和目錄
用法: hadoop fs -setfacl [-R] [-b |-k -m |-x <acl_spec> <path>] |[--set <acl_spec> <path>]
三十五:setfattr
設定一個檔案或目錄的擴充套件屬性名和值
用法: hadoop fs -setfattr -n name [-v value] | -x name <path>
三十六:setrep
改變一個檔案的副本系數。-R選項用於遞迴改變目錄下所有檔案的副本系數。
用法: hadoop fs -setrep [-R] [-w] <numReplicas> <path>
三十七: stat
返回指定路徑的統計資訊。
用法: hadoop fs -stat [format] <path> ...
三十八:tail
將檔案尾部1K位元組的內容輸出到stdout。支援-f選項,行為和Unix中一致。
用法: hadoop fs -tail [-f] URI
三十九:test
選項:
-e 檢查檔案是否存在。如果存在則返回0。
-z 檢查檔案是否是0位元組。如果是則返回0。
-d 如果路徑是個目錄,則返回1,否則返回0。用法: hadoop fs -test -[defsz] URI
四十:text
將原始檔輸出為文字格式。允許的格式是zip和TextRecordInputStream。
用法: hadoop fs -text <src>
四十一:touchz
建立一個0位元組的空檔案。
用法: hadoop fs -touchz URI [URI ...]
四十二:truncate
截斷指定檔案模式指定的長度匹配的所有檔案。
用法: hadoop fs -truncate [-w] <length> <paths>
四十三:usage
返回單個命令的幫助。
用法: hadoop fs -usage command
--------------------------------------------------------------------
到此,本章節的內容講述完畢。
引用
Apache hadoop commands:http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/CommandsManual.html
Apache File System Shell:http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/FileSystemShell.html
Apache 1.04 中文:http://hadoop.apache.org/docs/r1.0.4/cn/commands_manual.html
系列索引
本文版權歸mephisto和部落格園共有,歡迎轉載,但須保留此段宣告,並給出原文連結,謝謝合作。
文章是哥(mephisto)寫的,SourceLink