Linux亂碼轉換(一)

longer3281發表於2016-01-13
帶有中文的檔案傳到Linux伺服器,開啟後,看到的全是windows亂碼。下面介紹如何將在Linux環境下開啟中文字元檔案,而不出現亂碼。
1)載window下檢視檔案: Hadoop權威指南.txt

在這本《Hadoop權威指南(第3版)》即將出版之際,我十分高興地再次向廣大讀者推薦這本書。
  一本書的價值最重要的是取決於它的用途。今天,開源的Hadoop已經成為研究大資料十分重要的平臺,
在我國已經形成一個龐大的Hadoop使用者社群,他們對學習、掌握和提高Hadoop提出了很高的需求,
《Hadoop權威指南(第3版)》恰好滿足這樣的需要,其用途和價值不言而喻。這一點也可以從下面的事實中得到佐證:
從2011年年底出版至今,本書的第2版已經實現了12次印刷,擁有近3.5萬名讀者並連續兩年位列專業圖書暢銷榜榜首。
  一本書的價值還來自於它的內容。原著是用英文寫作的,它的內容組織得當,思路清晰,緊密結合實際。
但是要把它翻譯成中文介紹給中國的讀者,並非易事。它不單單要求譯者能夠熟練地掌握英文,還要求他們對
書中的技術性內容有深入、準確的瞭解和掌握。從這兩點來審視,本書的譯者團隊完全足以勝任。作為大學老師,
他們不僅在大資料領域從事一線教學和科研,同時還負責指導研究生從事資料庫方面的研究。從 2006 年開始,
他們就在計算機叢集上部署了Hadoop併成功完成了很多項研究。在這幾年的工作過程中,他們對Hadoop及其應用
開發有著深入的理解和認識,這是本書翻譯質量有保證的重要前提。
  經過再一次升級、修訂和更新,值此《Hadoop權威指南(第3版)》出版之際,我衷心地希望這本書繼續為廣
大讀者帶來更高的學習價值,更友好的閱讀體驗。



2)強中檔案字元檔案  AA亂碼.txt 上傳至Linux伺服器,放在 /root/demo下。

3)#cat Hadoop權威指南.txt 
??????Hadoop??????(??3??)??????????????????????????????????????????顣
?????????????????????????????????????????????Hadoop???????о???????????????????
?????????γ?????????Hadoop??????????????????????????Hadoop????????????
??Hadoop??????(??3??)???????????????????????????????????????????????????????????е???????
??2011??????????????????????2??????????12????????н?3.5?????????????????λ??????鳩?????????
????????????????????????????????????????д??????????????????????·?????????????????
????????????????????????й?????????????????????????????????????????????????????????
???е???????????????????????????????????????????????????????????????????Ρ????????????
???????????????????????????????У?????????????о?????????????????о????? 2006 ?????
??????????????????????Hadoop????????????????о???????????????????У??????Hadoop??????
???????????????????????????????鷭???????б??????????
????????????????????????????????Hadoop??????(??3??)??????????????????????????????
?????????????????????????????????顣

4)檢視檔案編碼型別 file Hadoop權威指南.txt 
#file Hadoop權威指南.txt
Hadoop權威指南.txt: ISO-8859 text, with CRLF line terminators

5)檢視系統字符集設定
# echo $LANG
en_US.UTF-8
編碼為UTF-8
6)下面就將 Hadoop權威指南.txt 轉換為 UTF-8

由第 4)步看到檔案的型別為ISO-8859,其實在windows中文字元實際為GBK

所以可以進行如下轉換:
# iconv -f GBK -t UTF-8 Hadoop權威指南.txt -o Hadoop權威指南_UTF8.txt
iconv: 無法開啟輸入檔案“Hadoop權威指南.txt”: 沒有那個檔案或目錄
報錯
以上報錯說明iconv無法識別檔名
我們還需要把檔名轉換一下。
可以使用工具convmv
執行如下:
# convmv -f GBK -t UTF-8 --notest Hadoop權威指南.txt
Skipping, already UTF-8: ./Hadoop權威指南.txt
Ready!
然後再執行如上命令檔案內容轉換命令
# iconv -f GBK -t UTF-8 Hadoop權威指南.txt -o Hadoop權威指南_UTF8.txt  ##無結果回顯
檢視轉碼後的檔案內容,如下:

# cat Hadoop權威指南_UTF8.txt
在這本《Hadoop權威指南(第3版)》即將出版之際,我十分高興地再次向廣大讀者推薦這本書。
  一本書的價值最重要的是取決於它的用途。今天,開源的Hadoop已經成為研究大資料十分重要的平臺,
在我國已經形成一個龐大的Hadoop使用者社群,他們對學習、掌握和提高Hadoop提出了很高的需求,
《Hadoop權威指南(第3版)》恰好滿足這樣的需要,其用途和價值不言而喻。這一點也可以從下面的事實中得到佐證:
從2011年年底出版至今,本書的第2版已經實現了12次印刷,擁有近3.5萬名讀者並連續兩年位列專業圖書暢銷榜榜首。
  一本書的價值還來自於它的內容。原著是用英文寫作的,它的內容組織得當,思路清晰,緊密結合實際。
但是要把它翻譯成中文介紹給中國的讀者,並非易事。它不單單要求譯者能夠熟練地掌握英文,還要求他們對
書中的技術性內容有深入、準確的瞭解和掌握。從這兩點來審視,本書的譯者團隊完全足以勝任。作為大學老師,
他們不僅在大資料領域從事一線教學和科研,同時還負責指導研究生從事資料庫方面的研究。從 2006 年開始,
他們就在計算機叢集上部署了Hadoop併成功完成了很多項研究。在這幾年的工作過程中,他們對Hadoop及其應用
開發有著深入的理解和認識,這是本書翻譯質量有保證的重要前提。
  經過再一次升級、修訂和更新,值此《Hadoop權威指南(第3版)》出版之際,我衷心地希望這本書繼續為廣
大讀者帶來更高的學習價值,更友好的閱讀體驗。


以上即為在linux環境下中文內容檔案的顯示。














來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/9606353/viewspace-1975971/,如需轉載,請註明出處,否則將追究法律責任。

相關文章