linux檔案合併、去重、拆分
一、兩個檔案的交集、並集(前提條件:每個檔案中不得有重複行)
1. 取出兩個檔案的並集(重複的行只保留一份)
cat file1 file2 | sort | uniq > file3
2. 取出兩個檔案的交集(只留下同時存在於兩個檔案中的檔案)
cat file1 file2 | sort | uniq -d > file3
3. 刪除交集,留下其他的行
cat file1 file2 | sort | uniq -u > file3
二、兩個檔案合併
1. 一個檔案在上,一個檔案在下
cat file1 file2 > file3
2. 一個檔案在左,一個檔案在右
paste file1 file2 > file3
三、一個檔案去掉重複的行
1. 重複的多行記為一行
sort file |uniq
2. 重複的行全部去掉
sort file |uniq -u
四、檔案拆分
1.split 命令
使用方式:split [OPTION] [INPUT [PREFIX]
OPTION 有
- l<行數>或-l<行數> 指定每多少行就要切成一個小檔案。
-b<位元組> 指定每多少字就要切成一個小檔案。支援單位:m,k
-C<位元組> 與-b引數類似,但切割時儘量維持每行的完整性。
如:
a>按照 指定分割後檔案行數
對於文字檔案,可以通過指定分割後檔案的行數來進行檔案分割。
命令:split -l 300 large_file.log new_file_prefi
b>按照 指定分割後檔案大小
對於文字檔案,可以通過指定分割後檔案的行數來進行檔案分割。
命令:split -l 300 large_file.log new_file_prefix
相關文章
- shell 檔案合併 去重 分割
- 資料檔案合併與拆分
- Linux下合併檔案Linux
- python3 大檔案去重Python
- Python之合併PDF檔案Python
- PDFsam Basic for mac合併拆分PDF文件Mac
- 命令列中的拆分與合併命令列
- Linux命令根據某一列對檔案內容去重Linux
- git合併分支,如果選擇性的合併檔案?Git
- Aspose.Words使用教程之如何寫入純文字(TXT)檔案,表的合併與拆分
- nodejs 讀取excel檔案,並去重NodeJSExcel
- Python合併多個csv檔案Python
- java快速分割及合併檔案Java
- 辦公自動化:PDF檔案合併器,將多個PDF檔案進行合併
- 多個 EXCEL 檔案如何合併成一個檔案Excel
- 分享:SQL中 LEFT JOIN 左表合併去重實用技巧SQL
- 合併PDF檔案怎樣做?分享兩種PDF合併方法
- PDF轉換器可以做到PDF轉Office,TXT,HTM,PDF檔案;PDF合併拆分,壓縮,加密解密!加密解密
- opencv 影像的 ROI、通道的拆分與合併OpenCV
- 多個excel檔案合併成一個excel表的方法 如何快速合併多個excel檔案Excel
- Linux 使用 crontab 定時拆分日誌、清理過期檔案Linux
- 一款免費使用的PDF檔案批次合併工具,可操作pdf檔案順序,按順序合併pdf檔案。
- 一款免費使用的PDF檔案批量合併工具,可操作pdf檔案順序,按順序合併pdf檔案。
- 請求合併與拆分在併發場景中應用
- PDF多檔案合併怎麼完成?PDF合併的簡單方法分享
- Hive表小檔案合併方法總結Hive
- git合併單個檔案到其他分支Git
- Git 合併指定檔案或資料夾Git
- iceberg合併小檔案衝突測試
- pdf檔案合併工具(abelssoft easy pdf 2020)
- 【BIM】基於BIMFACE的空間拆分與合併
- wireshark使用-----拆分抓包檔案
- 陣列及陣列物件操作 ----------包括排序,去重,合併,翻轉等陣列物件排序
- Pandas之EXCEL資料讀取/儲存/檔案分割/檔案合併Excel
- PDF Merge PDF Splitter for Mac(PDF合併和拆分軟體)Mac
- Spark優化之小檔案是否需要合併?Spark優化
- 檔案拆分命令 split 使用簡介
- 如何在 Acrobat Pro DC 與其它檔案合併建立單個 PDF 檔案?BAT