Windows轉到linux中，檔案亂碼，檔案編碼轉換

YatHo發表於2017-03-16

原文網址 : https://www.cnblogs.com/YatHo/p/6559141.html

最近，學習又重新開始Linux學習，所以一直在Centos中，昨天一朋友把他在Windows下寫的C程式發給我，我欣然答應，本以為很快就能在我的Linux系統中執行起來。沒想到出現了亂碼，結果想把這個問題解決，一下子就搞了近三個小時沒有解決。今天，又想起來這個問題，竟然一下子就解決了，現在把學到的一些東西總結如下。

首先Windows下的檔案拿到Linux中來檢視出現亂碼是一種很常見的現象，這方面的資料在網上也有很多。但解決方法大多都類似，有些概念沒有解釋清楚，也許是個人沒有理解清楚。

嘗試方法一：

一碰到這個問題，我想到的是Linux課上學到的一個命令dos2unix，以前也沒用過，這次用了也沒有解決問題。

因為，這個命令主要是用來處理Dos與Linux之間斷行的差異的。DOS下的文字檔案是以\r\n作為斷行標誌的，表示成十六進位制就是0D 0A。而Unix下的文字檔案是以\n作為斷行標誌的，表示成十六進位制就是 0A。有時我們會遇到這樣一種情況，dos下的檔案在unix下顯示是不出現斷行，顯得很亂，這時用這個命令就OK。

後來在網上查了下，知道是編碼格式不一致導致的。因為Dos下編輯的文字預設是以GBK儲存的，而Linux預設採取的儲存方式是UTF-8，當然會出現亂碼了，但是如何去將Dos下的GBK檔案轉換成UTF-8呢？

嘗試方法二：更改Vim讀取時採用的編碼

先補充一個知識，參考部落格http://blog.csdn.net/kl222/article/details/4550269

vim編碼方面的基礎知識：
存在3個變數：
encoding—-該選項使用於緩衝的文字(你正在編輯的檔案)，暫存器，Vim 指令碼檔案等等。你可以把 'encoding' 選項當作是對 Vim 內部執行機制的設定。
fileencoding—-該選項是vim寫入檔案時採用的編碼型別。
termencoding—-該選項代表輸出到客戶終端（Term）採用的編碼型別。

所以，我嘗試了在Vim中

:set encoding

:set fileencoding=utf-8 #讓Vim將gbk的文字轉換成utf-8後，顯示出來

經過這樣改了之後，果然，Vim中看到的亂碼消失了，此時心情小小的激動了一下子。

但是，當我退出Vim再次開啟檔案時，亂碼又出現了，原來是我更改的Vim設定只是臨時的，所以我決定將其寫死到vim配置檔案當中去，操作如下：

編輯~/.vimrc檔案，加上如下幾行：

set fileencodings=utf-8,ucs-bom,gb18030,gbk,gb2312,cp936

set termencoding=utf-8

set encoding=utf-8

這時，每次用Vim開啟檔案時都不出現亂碼了，本以為問題解決了，我開始編譯程式，當我執行的時候，亂碼還是出現了。。。。此時，欲哭無淚

後來，我仔細想了一下，我更改Vim的配置，只是讓我們看到的沒有亂碼，但從根本上講，檔案的編碼方式還是沒有變，所以當我用gcc編譯後，檔案的編碼格式應該還是gbk的。這樣導致的亂碼。所以，我決定找個工具，直接講gbk檔案轉換成utf-8。

嘗試三：

1.檢視檔案儲存格式

#file test.cpp

test.cpp: ISO-8859 English text, with CRLF line terminators

可以看出檔案是以ISO-8859儲存的。

2.檢視系統語言設定

#cat /etc/sysconfig/i18n

LANG="en_US.UTF-8"
SYSFONT="latarcyrheb-sun16"
可以看出Linux是以UTF-8編碼的

3.利用工具將檔案從ISO-8859轉換成UTF-8（這裡我採用的是iconv命令）

＃iconv -f ISO-8859 -t UTF-8 test.c -o test_u.c

這時竟然出現了一個錯誤：

iconv: conversion from `ISO-8859' is not supported

Try `iconv --help' or `iconv --usage

解決方案：

將ISO-8859換成GBK

＃iconv -f GBK -t UTF-8 test.c -o test_u.c

轉換Linux 檔案編碼方式
2020-11-16
Linux
檢測檔案編碼，轉換檔案編碼
2022-05-24
如何進行Linux下檔案編碼格式轉換
2020-12-11
Linux
Mac系統下檔案編碼轉換工具enca
2018-10-26
Mac
Linux與Windows共享檔案Samba(轉)
2019-06-28
LinuxWindowsSamba
PDF檔案轉換為DWF檔案
2022-02-11
PDF檔案如何轉換為能編輯的CAD檔案
2018-08-07
transfer 全平臺Windows linux mac配置檔案轉換工具
2018-08-27
WindowsLinuxMac
linux Typora修改Windows檔案產生亂碼（未解決）
2024-06-17
LinuxWindows
Linux 檔案編碼大挪移
2020-03-23
Linux
Idea編碼UTF-8中.properties 配置檔案中文亂碼
2024-03-19
Idea
把 .xyz 檔案轉換成 .ply 檔案
2024-06-15
python批次將檔案編碼格式轉換為 UTF8帶標籤的格式，解決linux環境下中文編碼亂碼的問題
2024-12-04
PythonLinux
編碼轉換統一防止亂碼
2024-05-31
在linux中使用 Pandoc 轉換檔案技巧
2022-07-16
Linux
如何將.ipynb檔案轉換為.py檔案
2020-11-10
Mxnet模型檔案轉換為Pb模型檔案
2019-05-28
模型
Json檔案轉換為Excel檔案!涉及讀檔案,時間戳轉化,寫文件
2021-04-25
JSONExcel時間戳
aspose word轉換pdf檔案後將pdf檔案轉換為圖片png
2024-09-07
Linux下把sra檔案轉成fastq檔案
2019-10-25
LinuxAST
plist檔案格式轉換器
2023-04-12
heic檔案如何轉換jpg？
2021-04-06
從普通二維碼到檔案生成二維碼的轉變
2024-04-07
caj檔案怎麼轉換成word文件，簡單的檔案格式轉換教程
2021-04-24
Linux下刪除亂碼或特殊字元檔案
2020-03-07
Linux字元
透過HHDESK，將windows中的檔案轉移至Linux系統中
2023-03-17
WindowsLinux
GBFF檔案轉GFF檔案
2024-07-12
如何使用python把json檔案轉換為csv檔案
2021-03-12
PythonJSON
檔案上傳經由ZUUL轉發，導致的檔名（OriginalFilename）亂碼問題
2018-10-16
Zuul
Hadoop檢視檔案///hadoop 清洗檔案出現亂碼
2018-08-22
Hadoop
windows共享到linux系統檔案
2023-01-14
WindowsLinux
RTF 批量轉換為 DOCX 檔案
2018-04-26
使用 Fstransform 轉換檔案系統
2018-08-31
ORM
Torrent檔案的解析與轉換
2020-11-13
java 字串與檔案相互轉換
2020-09-29
Java字串
將DBF檔案(dBase, FoxPro等)中的資料轉換到SQLite
2024-07-17
SQLite
編碼轉換
2020-05-03
MounRiver Studio開啟檔案亂碼
2024-05-16
前端檔案編碼方式
2019-01-05
前端

Windows轉到linux中，檔案亂碼，檔案編碼轉換

相關文章