linux檔案合併、去重、拆分
一、兩個檔案的交集、並集(前提條件:每個檔案中不得有重複行)
1. 取出兩個檔案的並集(重複的行只保留一份)
cat file1 file2 | sort | uniq > file3
2. 取出兩個檔案的交集(只留下同時存在於兩個檔案中的檔案)
cat file1 file2 | sort | uniq -d > file3
3. 刪除交集,留下其他的行
cat file1 file2 | sort | uniq -u > file3
二、兩個檔案合併
1. 一個檔案在上,一個檔案在下
cat file1 file2 > file3
2. 一個檔案在左,一個檔案在右
paste file1 file2 > file3
三、一個檔案去掉重複的行
1. 重複的多行記為一行
sort file |uniq
2. 重複的行全部去掉
sort file |uniq -u
四、檔案拆分
1.split 命令
使用方式:split [OPTION] [INPUT [PREFIX]
OPTION 有
- l<行數>或-l<行數> 指定每多少行就要切成一個小檔案。
-b<位元組> 指定每多少字就要切成一個小檔案。支援單位:m,k
-C<位元組> 與-b引數類似,但切割時儘量維持每行的完整性。
如:
a>按照 指定分割後檔案行數
對於文字檔案,可以通過指定分割後檔案的行數來進行檔案分割。
命令:split -l 300 large_file.log new_file_prefi
b>按照 指定分割後檔案大小
對於文字檔案,可以通過指定分割後檔案的行數來進行檔案分割。
命令:split -l 300 large_file.log new_file_prefix
相關文章
- shell 檔案合併 去重 分割
- 資料檔案合併與拆分
- python合併多個csv檔案並去重Python
- Linux下合併檔案Linux
- C#陣列 多個集合和陣列的操作(合併,去重,拆分,判斷)C#陣列
- 大型檔案去重
- Linux split拆分檔案Linux
- java 拆分與合併字串Java字串
- Linux大檔案的切割與合併Linux
- linux下檔案分割與合併 (轉)Linux
- linux下檔案分割與合併(轉)Linux
- windows合併檔案Windows
- 合併iso檔案
- Goldengate的拆分與合併Go
- Linux檔案分割與合併:split&catLinux
- Linux - 檔案的分割(split)與合併(cat)Linux
- linux下檔案的切割與合併(轉)Linux
- Hive小檔案合併Hive
- PDFsam Basic for mac合併拆分PDF文件Mac
- 命令列中的拆分與合併命令列
- 如何在linux 中合併兩個檔案為一個檔案pasteLinuxAST
- git合併分支,如果選擇性的合併檔案?Git
- Aspose.Words使用教程之如何寫入純文字(TXT)檔案,表的合併與拆分
- 分享:SQL中 LEFT JOIN 左表合併去重實用技巧SQL
- python3 大檔案去重Python
- java快速分割及合併檔案Java
- 檔案切割以及合併筆記筆記
- Python之合併PDF檔案Python
- 超級檔案分割《合併》機(分割大檔案)
- Linux下檔案的切分與合併的簡單方法Linux
- Tux3檔案系統有望合併到Linux KernelLinux
- opencv 影像的 ROI、通道的拆分與合併OpenCV
- Oracle 11g 分割槽拆分與合併Oracle
- 辦公自動化:PDF檔案合併器,將多個PDF檔案進行合併
- Mac如何使用預覽應用合併PDF檔案 Mac合併PDF檔案教程詳解Mac
- 合併PDF檔案怎樣做?分享兩種PDF合併方法
- nodejs 讀取excel檔案,並去重NodeJSExcel
- Linux命令根據某一列對檔案內容去重Linux