Linux下批量把GDK編碼的文章轉化為UTF-8編碼的文章以及“iconv: 未知 xxx 處的非法輸入序列”錯誤處理
Linux下批量轉換GBK檔案到UTF-8編碼方法
檢視檔案編碼
file -i filename
1.遞迴轉換(包括子資料夾)
find default -type d -exec mkdir -p utf/{} \;
find default -type f -exec iconv -f GBK -t UTF-8 {} -o utf/{} \;
這兩行命令將default目錄下的檔案由GBK編碼轉換為UTF-8編碼,目錄結構不變,轉碼後的檔案儲存在utf/default目錄下。
2.轉換
命令格式如下
$enca -L 當前語言 -x 目標編碼 檔名
例如要把當前目錄下的所有檔案都轉成utf-8
$enca -L zh_CN -x utf-8 *
iconv: 未知 xxx 處的非法輸入序列
linux命令列bash下,使用iconv轉換UTF-8編碼到gb2312的時候遇到問題: iconv: 未知 xx 處的非法輸入序列
在iconv中加入 -c 選項,忽略無效的字元,竟然成功了。
/*--------------------------------我是分割線--------------------------------*/
以上參考http://hi.baidu.com/maleung/blog/item/a75403ed6ea19fd8b21cb1db.html
-----------------------------------------------------------------
這裡還可以像php裡一樣,引數中加入//IGNOR,如下
iconv -f gbk//IGNORE -t utf8//IGNORE hufu.csv> hufu-utf8.csv
也可以正常執行
相關文章
- Qt處理中文編碼出現錯誤QT
- 文字編碼轉換工具iconv 附批量轉換檔案編碼命令
- C++ url中文編碼處理 編碼轉為UTF8 CChineseCode下載C++
- ptyon 特殊處理 url 編碼與解碼,字元編碼轉化 unicode字元Unicode
- iconv字元編碼轉換字元
- hbase 故障的處理方案。 (轉載文章)
- Bash 指令碼中的錯誤處理指令碼
- C++中的字串編碼處理C++字串編碼
- Java 處理 \x 開頭的編碼Java
- Asp.net把UTF-8編碼轉換為GB2312編碼ASP.NET
- COM的錯誤處理 (轉)
- codecs 編碼處理
- Linux批量編碼轉換Linux
- 解決NSData中包含非法UTF-8編碼
- UTF-8編碼與GBK編碼之間的轉換
- Linux下編輯處理數理化公式(轉)Linux公式
- Python 編碼轉換與中文處理Python
- .net例項:Asp.net把UTF-8編碼轉換為GB2312編碼ASP.NET
- lxml處理xml時的字元編碼問題XML字元
- Android Studio 錯誤: 編碼UTF-8的不可對映字元Android字元
- 檔案輸入和輸入出處理(六)-序列化和反序列化
- python處理抓取中文編碼和判斷編碼Python
- 錯誤處理的一點思考 (轉)
- 錯誤碼全域性處理(一)
- 錯誤碼全域性處理(二)
- 字元編碼與檔案處理字元
- maven編譯遇到"編碼GBK的不可對映字元"警告的處理Maven編譯字元
- iconv更改檔案編碼
- go的錯誤處理Go
- PHP中文字元gbk編碼與UTF-8編碼的轉換PHP字元
- Linux 和 Windows 下編碼問題處理 codestyle 解決方法LinuxWindows
- linux下gdb如何處理coredump錯誤Linux
- Laravel Excpetions(錯誤處理) 原始碼分析Laravel原始碼
- asp連線Mysql及編碼處理MySql
- axios 的錯誤處理iOS
- 批量修改檔案的編碼
- PHP中的字串、編碼、UTF-8PHP字串
- Linux下Terminal的密碼輸入(轉)Linux密碼