小說軟體開發,java獲取文字檔案的編碼格式
小說軟體開發,java獲取文字檔案的編碼格式實現的相關程式碼
/** * 獲取檔案的編碼格式 * @param file * @return */ public String GetCharset(File file) { String charset = "GBK"; byte[] first3Bytes = new byte[3]; try { boolean checked = false; //BufferedInputStream bis = new BufferedInputStream( //new FileInputStream(file)); //bis.mark(0); //int read = bis.read(first3Bytes, 0, 3); InputStream is = new FileInputStream(file); int read = is.read(first3Bytes, 0, 3); if (read == -1) return charset; //Log.i(TAG,"[GetCharset]first3Bytes[0]:"+first3Bytes[0]+", first3Bytes[1]:"+first3Bytes[1]+",first3Bytes[2]:"+first3Bytes[2]); if (first3Bytes[0] == (byte) 0xFF && first3Bytes[1] == (byte) 0xFE) { charset = "UTF-16LE"; checked = true; } else if (first3Bytes[0] == (byte) 0xFE && first3Bytes[1] == (byte) 0xFF) { charset = "UTF-16BE"; checked = true; } else if (first3Bytes[0] == (byte) 0xEF && first3Bytes[1] == (byte) 0xBB && first3Bytes[2] == (byte) 0xBF) { charset = "UTF-8"; checked = true; }else if (first3Bytes[0] == (byte) 0xA && first3Bytes[1] == (byte) 0x5B && first3Bytes[2] == (byte) 0x30) { charset = "UTF-8"; checked = true; }else if (first3Bytes[0] == (byte) 0xD && first3Bytes[1] == (byte) 0xA && first3Bytes[2] == (byte) 0x5B) { charset = "GBK"; checked = true; }else if (first3Bytes[0] == (byte) 0x5B && first3Bytes[1] == (byte) 0x54 && first3Bytes[2] == (byte) 0x49) { charset = "windows-1251"; checked = true; } //bis.reset(); InputStream istmp = new FileInputStream(file); if (!checked) { int loc = 0; while ((read = istmp.read()) != -1) { loc++; if (read >= 0xF0) break; if (0x80 <= read && read <= 0xBF) break; if (0xC0 <= read && read <= 0xDF) { read = istmp.read(); if (0x80 <= read && read <= 0xBF) continue; else break; } else if (0xE0 <= read && read <= 0xEF) { read = istmp.read(); if (0x80 <= read && read <= 0xBF) { read = istmp.read(); if (0x80 <= read && read <= 0xBF) { charset = "UTF-8"; break; } else break; } else break; } } } is.close(); istmp.close(); } catch (Exception e) { e.printStackTrace(); } return charset; }
以上就是 小說軟體開發,java獲取文字檔案的編碼格式實現的相關程式碼,更多內容歡迎關注之後的文章
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69978258/viewspace-2845378/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 文字檔案的編碼格式
- Loadrunner+引數化檔案編碼格式+獲取請求報文發生異常
- 前端獲取視訊編碼格式前端
- ofd是什麼格式的檔案 ofd格式檔案用什麼軟體開啟
- Android開發:APK的反編譯(獲取程式碼和資原始檔)AndroidAPK編譯
- 軟體著作權檔案格式
- dwg格式檔案用什麼軟體開啟(線上看dwg格式檔案)
- dwg格式檔案用什麼軟體開啟 dwg是什麼檔案格式
- 電腦如何開啟ofd格式檔案 什麼軟體可以開啟ofd格式檔案
- mpp檔案用什麼軟體開啟 如何開啟mpp格式檔案
- dxf是什麼檔案格式 dxf檔案格式用什麼軟體怎麼開啟
- Java中的獲取檔案的物理絕對路徑,和讀取檔案Java
- Storyist for Mac(mac小說編輯軟體)Mac
- 直播軟體搭建,java程式碼獲取記憶體資訊Java記憶體
- 讀取txt檔案將文字行組合成特定格式
- swf是什麼檔案格式 swf檔案要用什麼軟體開啟
- plt是什麼格式檔案 plt檔案要用什麼軟體開啟
- fepk檔案格式說明
- C#讀取文字檔案和寫文字檔案C#
- java 猜測 檔案編碼Java
- Java爬蟲學習——例項:獲取起點中文網站小說並儲存成txt檔案Java爬蟲網站
- python 讀取文字檔案Python
- 編譯生產pdb檔案的軟體編譯
- rtf是什麼格式的檔案 rtf用什麼軟體開啟
- PDF檔案掃描文字識別軟體
- 檔案開啟的格式
- Mac文字編輯軟體Mac
- PHP 獲取檔案 副檔名 的常用方法小結【五種方式】PHP
- 反編譯獲取任何微信小程式原始碼編譯微信小程式原始碼
- emmx檔案用什麼軟體開啟電腦 電腦怎麼開啟emmx格式檔案
- 直播系統原始碼,讀取多行文字、讀取檔案分割多行文字原始碼
- [軟考考點解析]軟體設計師--常用媒體檔案格式
- java獲取B站彈幕檔案的兩種方案Java
- 小說軟體原始碼的快取設計,保證服務的正常執行原始碼快取
- eml是什麼檔案格式 eml用什麼軟體開啟
- 免費版軟體文件檔案格式轉換
- 如何進行Linux下檔案編碼格式轉換Linux
- IDEA如何設定編碼格式,字元編碼,全域性編碼和專案編碼格式Idea字元