Linux亂碼轉換(一)
帶有中文的檔案傳到Linux伺服器,開啟後,看到的全是windows亂碼。下面介紹如何將在Linux環境下開啟中文字元檔案,而不出現亂碼。
1)載window下檢視檔案: Hadoop權威指南.txt
在這本《Hadoop權威指南(第3版)》即將出版之際,我十分高興地再次向廣大讀者推薦這本書。
一本書的價值最重要的是取決於它的用途。今天,開源的Hadoop已經成為研究大資料十分重要的平臺,
在我國已經形成一個龐大的Hadoop使用者社群,他們對學習、掌握和提高Hadoop提出了很高的需求,
《Hadoop權威指南(第3版)》恰好滿足這樣的需要,其用途和價值不言而喻。這一點也可以從下面的事實中得到佐證:
從2011年年底出版至今,本書的第2版已經實現了12次印刷,擁有近3.5萬名讀者並連續兩年位列專業圖書暢銷榜榜首。
一本書的價值還來自於它的內容。原著是用英文寫作的,它的內容組織得當,思路清晰,緊密結合實際。
但是要把它翻譯成中文介紹給中國的讀者,並非易事。它不單單要求譯者能夠熟練地掌握英文,還要求他們對
書中的技術性內容有深入、準確的瞭解和掌握。從這兩點來審視,本書的譯者團隊完全足以勝任。作為大學老師,
他們不僅在大資料領域從事一線教學和科研,同時還負責指導研究生從事資料庫方面的研究。從 2006 年開始,
他們就在計算機叢集上部署了Hadoop併成功完成了很多項研究。在這幾年的工作過程中,他們對Hadoop及其應用
開發有著深入的理解和認識,這是本書翻譯質量有保證的重要前提。
經過再一次升級、修訂和更新,值此《Hadoop權威指南(第3版)》出版之際,我衷心地希望這本書繼續為廣
大讀者帶來更高的學習價值,更友好的閱讀體驗。
2)強中檔案字元檔案 AA亂碼.txt 上傳至Linux伺服器,放在 /root/demo下。
3)#cat Hadoop權威指南.txt
??????Hadoop??????(??3??)??????????????????????????????????????????顣
?????????????????????????????????????????????Hadoop???????о???????????????????
?????????γ?????????Hadoop??????????????????????????Hadoop????????????
??Hadoop??????(??3??)???????????????????????????????????????????????????????????е???????
??2011??????????????????????2??????????12????????н?3.5?????????????????λ??????鳩?????????
????????????????????????????????????????д??????????????????????·?????????????????
????????????????????????й?????????????????????????????????????????????????????????
???е???????????????????????????????????????????????????????????????????Ρ????????????
???????????????????????????????У?????????????о?????????????????о????? 2006 ?????
??????????????????????Hadoop????????????????о???????????????????У??????Hadoop??????
???????????????????????????????鷭???????б??????????
????????????????????????????????Hadoop??????(??3??)??????????????????????????????
?????????????????????????????????顣
4)檢視檔案編碼型別 file Hadoop權威指南.txt
#file Hadoop權威指南.txt
Hadoop權威指南.txt: ISO-8859 text, with CRLF line terminators
5)檢視系統字符集設定
# echo $LANG
en_US.UTF-8
由第 4)步看到檔案的型別為ISO-8859,其實在windows中文字元實際為GBK
所以可以進行如下轉換:
# iconv -f GBK -t UTF-8 Hadoop權威指南.txt -o Hadoop權威指南_UTF8.txt
iconv: 無法開啟輸入檔案“Hadoop權威指南.txt”: 沒有那個檔案或目錄
報錯
以上報錯說明iconv無法識別檔名
我們還需要把檔名轉換一下。
可以使用工具convmv
執行如下:
# convmv -f GBK -t UTF-8 --notest Hadoop權威指南.txt
Skipping, already UTF-8: ./Hadoop權威指南.txt
Ready!
1)載window下檢視檔案: Hadoop權威指南.txt
在這本《Hadoop權威指南(第3版)》即將出版之際,我十分高興地再次向廣大讀者推薦這本書。
一本書的價值最重要的是取決於它的用途。今天,開源的Hadoop已經成為研究大資料十分重要的平臺,
在我國已經形成一個龐大的Hadoop使用者社群,他們對學習、掌握和提高Hadoop提出了很高的需求,
《Hadoop權威指南(第3版)》恰好滿足這樣的需要,其用途和價值不言而喻。這一點也可以從下面的事實中得到佐證:
從2011年年底出版至今,本書的第2版已經實現了12次印刷,擁有近3.5萬名讀者並連續兩年位列專業圖書暢銷榜榜首。
一本書的價值還來自於它的內容。原著是用英文寫作的,它的內容組織得當,思路清晰,緊密結合實際。
但是要把它翻譯成中文介紹給中國的讀者,並非易事。它不單單要求譯者能夠熟練地掌握英文,還要求他們對
書中的技術性內容有深入、準確的瞭解和掌握。從這兩點來審視,本書的譯者團隊完全足以勝任。作為大學老師,
他們不僅在大資料領域從事一線教學和科研,同時還負責指導研究生從事資料庫方面的研究。從 2006 年開始,
他們就在計算機叢集上部署了Hadoop併成功完成了很多項研究。在這幾年的工作過程中,他們對Hadoop及其應用
開發有著深入的理解和認識,這是本書翻譯質量有保證的重要前提。
經過再一次升級、修訂和更新,值此《Hadoop權威指南(第3版)》出版之際,我衷心地希望這本書繼續為廣
大讀者帶來更高的學習價值,更友好的閱讀體驗。
2)強中檔案字元檔案 AA亂碼.txt 上傳至Linux伺服器,放在 /root/demo下。
3)#cat Hadoop權威指南.txt
??????Hadoop??????(??3??)??????????????????????????????????????????顣
?????????????????????????????????????????????Hadoop???????о???????????????????
?????????γ?????????Hadoop??????????????????????????Hadoop????????????
??Hadoop??????(??3??)???????????????????????????????????????????????????????????е???????
??2011??????????????????????2??????????12????????н?3.5?????????????????λ??????鳩?????????
????????????????????????????????????????д??????????????????????·?????????????????
????????????????????????й?????????????????????????????????????????????????????????
???е???????????????????????????????????????????????????????????????????Ρ????????????
???????????????????????????????У?????????????о?????????????????о????? 2006 ?????
??????????????????????Hadoop????????????????о???????????????????У??????Hadoop??????
???????????????????????????????鷭???????б??????????
????????????????????????????????Hadoop??????(??3??)??????????????????????????????
?????????????????????????????????顣
#file Hadoop權威指南.txt
Hadoop權威指南.txt: ISO-8859 text, with CRLF line terminators
5)檢視系統字符集設定
# echo $LANG
en_US.UTF-8
編碼為UTF-8
6)下面就將 Hadoop權威指南.txt 轉換為 UTF-8由第 4)步看到檔案的型別為ISO-8859,其實在windows中文字元實際為GBK
所以可以進行如下轉換:
# iconv -f GBK -t UTF-8 Hadoop權威指南.txt -o Hadoop權威指南_UTF8.txt
iconv: 無法開啟輸入檔案“Hadoop權威指南.txt”: 沒有那個檔案或目錄
報錯
以上報錯說明iconv無法識別檔名
我們還需要把檔名轉換一下。
可以使用工具convmv
執行如下:
# convmv -f GBK -t UTF-8 --notest Hadoop權威指南.txt
Skipping, already UTF-8: ./Hadoop權威指南.txt
Ready!
然後再執行如上命令檔案內容轉換命令
# iconv -f GBK -t UTF-8 Hadoop權威指南.txt -o Hadoop權威指南_UTF8.txt ##無結果回顯
檢視轉碼後的檔案內容,如下:
# cat Hadoop權威指南_UTF8.txt
在這本《Hadoop權威指南(第3版)》即將出版之際,我十分高興地再次向廣大讀者推薦這本書。
一本書的價值最重要的是取決於它的用途。今天,開源的Hadoop已經成為研究大資料十分重要的平臺,
在我國已經形成一個龐大的Hadoop使用者社群,他們對學習、掌握和提高Hadoop提出了很高的需求,
《Hadoop權威指南(第3版)》恰好滿足這樣的需要,其用途和價值不言而喻。這一點也可以從下面的事實中得到佐證:
從2011年年底出版至今,本書的第2版已經實現了12次印刷,擁有近3.5萬名讀者並連續兩年位列專業圖書暢銷榜榜首。
一本書的價值還來自於它的內容。原著是用英文寫作的,它的內容組織得當,思路清晰,緊密結合實際。
但是要把它翻譯成中文介紹給中國的讀者,並非易事。它不單單要求譯者能夠熟練地掌握英文,還要求他們對
書中的技術性內容有深入、準確的瞭解和掌握。從這兩點來審視,本書的譯者團隊完全足以勝任。作為大學老師,
他們不僅在大資料領域從事一線教學和科研,同時還負責指導研究生從事資料庫方面的研究。從 2006 年開始,
他們就在計算機叢集上部署了Hadoop併成功完成了很多項研究。在這幾年的工作過程中,他們對Hadoop及其應用
開發有著深入的理解和認識,這是本書翻譯質量有保證的重要前提。
經過再一次升級、修訂和更新,值此《Hadoop權威指南(第3版)》出版之際,我衷心地希望這本書繼續為廣
大讀者帶來更高的學習價值,更友好的閱讀體驗。
以上即為在linux環境下中文內容檔案的顯示。
# iconv -f GBK -t UTF-8 Hadoop權威指南.txt -o Hadoop權威指南_UTF8.txt ##無結果回顯
檢視轉碼後的檔案內容,如下:
# cat Hadoop權威指南_UTF8.txt
在這本《Hadoop權威指南(第3版)》即將出版之際,我十分高興地再次向廣大讀者推薦這本書。
一本書的價值最重要的是取決於它的用途。今天,開源的Hadoop已經成為研究大資料十分重要的平臺,
在我國已經形成一個龐大的Hadoop使用者社群,他們對學習、掌握和提高Hadoop提出了很高的需求,
《Hadoop權威指南(第3版)》恰好滿足這樣的需要,其用途和價值不言而喻。這一點也可以從下面的事實中得到佐證:
從2011年年底出版至今,本書的第2版已經實現了12次印刷,擁有近3.5萬名讀者並連續兩年位列專業圖書暢銷榜榜首。
一本書的價值還來自於它的內容。原著是用英文寫作的,它的內容組織得當,思路清晰,緊密結合實際。
但是要把它翻譯成中文介紹給中國的讀者,並非易事。它不單單要求譯者能夠熟練地掌握英文,還要求他們對
書中的技術性內容有深入、準確的瞭解和掌握。從這兩點來審視,本書的譯者團隊完全足以勝任。作為大學老師,
他們不僅在大資料領域從事一線教學和科研,同時還負責指導研究生從事資料庫方面的研究。從 2006 年開始,
他們就在計算機叢集上部署了Hadoop併成功完成了很多項研究。在這幾年的工作過程中,他們對Hadoop及其應用
開發有著深入的理解和認識,這是本書翻譯質量有保證的重要前提。
經過再一次升級、修訂和更新,值此《Hadoop權威指南(第3版)》出版之際,我衷心地希望這本書繼續為廣
大讀者帶來更高的學習價值,更友好的閱讀體驗。
以上即為在linux環境下中文內容檔案的顯示。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/9606353/viewspace-1975971/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Linux亂碼轉換(二)Linux
- 編碼轉換統一防止亂碼
- Windows轉到linux中,檔案亂碼,檔案編碼轉換WindowsLinux
- java的中文亂碼轉換Java
- SpringMVC的亂碼與時間轉換SpringMVC
- Linux批量編碼轉換Linux
- 上傳Text文件並轉換為PDF(解決亂碼)
- 轉換Linux 檔案編碼方式Linux
- linux終端亂碼Linux
- Linux字符集不統一導致亂碼的解決步驟(轉)Linux
- 亂碼演算法大全(一)Uuencode (轉)演算法
- Linux 字元編碼 檢視與轉換Linux字元
- 解決Linux中文亂碼Linux
- Linux以下銀行亂碼Linux
- Linux 轉換換行符Linux
- Kettle資料抽取(轉換)mysql出現亂碼問題解決方法MySql
- C++中string轉換為char*型別返回後亂碼問題C++型別
- linux亂碼和資料庫亂碼的問題簡單排查Linux資料庫
- linux下sqlplus 亂碼LinuxSQL
- [轉]Linux系統出現亂碼問題的終極解決方法(轉)Linux
- [轉]Linux、windows下回車換行格式轉換LinuxWindows
- 編碼轉換
- Linux版本凌亂痛失市場(轉)Linux
- javascript 字元轉換為ascii碼,ascii碼轉換為字元JavaScript字元ASCII
- mysql字元轉化以及亂碼原因MySql字元
- 亂碼演算法大全 (轉)演算法
- linux 下刪除亂碼檔案Linux
- linux啟動時出現亂碼Linux
- xshell連線linux中文亂碼Linux
- 內碼轉換技術 (轉)
- 用Javascript轉換原始碼 (轉)JavaScript原始碼
- libreoffice轉換檔案為pdf檔案亂碼問題解決辦法
- 如何進行Linux下檔案編碼格式轉換Linux
- 字元編碼轉換字元
- URL編碼轉換
- JS簡碼轉換JS
- Linux下轉換字符集(UTF8轉換)Linux
- mysql 插入中文亂碼解決方案 轉MySql