Unicode編碼和中文互轉（JAVA實現）

rodertW發表於2019-01-21

原文網址 : https://blog.csdn.net/qq_40374604/article/details/86582717

	/**
	 * 獲取字串的unicode編碼 漢字“木”的Unicode 碼點為Ox6728
	 *
	 * @param s
	 *            木
	 * @return \ufeff\u6728 \ufeff控制字元 用來表示「位元組次序標記（Byte Order Mark）」不佔用寬度
	 *         在java中一個char是採用unicode儲存的 佔用2個位元組 比如 漢字木 就是 Ox6728
	 *         4bit+4bit+4bit+4bit=2位元組
	 */
	public static String stringToUnicode(String s) {
		try {
			StringBuffer out = new StringBuffer("");
			// 直接獲取字串的unicode二進位制
			byte[] bytes = s.getBytes("unicode");
			// 然後將其byte轉換成對應的16進製表示即可
			for (int i = 0; i < bytes.length - 1; i += 2) {
				out.append("\\u");
				String str = Integer.toHexString(bytes[i + 1] & 0xff);
				for (int j = str.length(); j < 2; j++) {
					out.append("0");
				}
				String str1 = Integer.toHexString(bytes[i] & 0xff);
				out.append(str1);
				out.append(str);
			}
			return out.toString();
		} catch (UnsupportedEncodingException e) {
			e.printStackTrace();
			return null;
		}
	}

	/**
	 * Unicode轉 漢字字串
	 *
	 * @param str
	 *            \u6728
	 * @return '木' 26408
	 */
	public static String unicodeToString(String str) {

		Pattern pattern = Pattern.compile("(\\\\u(\\p{XDigit}{4}))");
		Matcher matcher = pattern.matcher(str);
		char ch;
		while (matcher.find()) {
			// group 6728
			String group = matcher.group(2);
			// ch:'木' 26408
			ch = (char) Integer.parseInt(group, 16);
			// group1 \u6728
			String group1 = matcher.group(1);
			str = str.replace(group1, ch + "");
		}
		return str;
	}

python實現中文和unicode轉換
2023-05-14
PythonUnicode
中文字串轉 unicode 編碼的字串
2019-02-25
字串Unicode
C++ string互轉wstring/Unicode互轉ANSI/Unicode互轉UTF8
2018-07-16
C++Unicode
中文被 json_encode 編碼成 unicode 之後如何轉換回中文
2020-12-23
JSONUnicode
Unicode編碼解碼
2023-12-09
Unicode
ptyon 特殊處理 url 編碼與解碼，字元編碼轉化 unicode
2020-05-19
字元Unicode
C++ UTF8 互轉 Unicode
2018-10-25
C++Unicode
Unicode編碼介紹
2024-09-05
Unicode
Redis中文顯示為Unicode編碼亂碼的解決辦法
2021-09-06
RedisUnicode
unicode轉碼工具類
2021-09-09
Unicode
Java實現BCD編碼與十進位制轉換
2022-08-22
Java
java中文字串漢字轉GBK編碼
2020-12-15
Java字串
Java實現過濾中文亂碼
2020-03-06
Java
Java 如何獲取字元所對應的UniCode編碼
2019-04-15
Java字元Unicode
解碼返回Unicode編碼的文字
2024-04-22
Unicode
元件使用總結：使用 JAXB 實現 XML檔案和java物件互轉
2019-03-02
元件XMLJava物件
字符集編碼（三）：Unicode
2022-02-28
Unicode
Unicode編碼 - 代理區和4位元組codePoint
2024-09-12
Unicode
Unicode編碼解碼的全面介紹
2024-03-30
Unicode
unicode編碼 asis_2019_unicorn_shop
2024-05-03
Unicode
字符集編碼（上）：Unicode 之前
2022-02-17
Unicode
帶你瞭解 Unicode和UTF-8編碼知識
2020-11-16
Unicode
PHP中文GBK編碼轉UTF-8
2019-02-16
PHP
Python 編碼轉換與中文處理
2021-09-09
Python
AI來實現程式碼轉換！Python轉Java，Java轉Go不在話下？
2023-03-12
AIPythonJavaGo
用Javascript實現UTF8編碼轉換成gb2312編碼
2023-03-07
JavaScript
json.dumps(data.__dict__) 會把中文字元轉義為 Unicode 碼點
2024-09-09
JSON字元Unicode
音樂格式轉換：java程式碼實現
2024-05-12
Java
java安全編碼指南之:字串和編碼
2020-09-16
Java字串
[20231012]如何檢視unicode編碼內容.txt
2023-10-16
Unicode
字元編碼：Unicode & UTF-16 & UTF-8
2023-01-01
字元Unicode
影片轉碼編輯工具：Cornpressor for Mac中文版
2023-12-01
Mac
Python 中文編碼
2018-10-11
Python
JAVA實現編寫平臺程式碼生成器
2018-04-13
Java
JavaScript 如何正確處理 Unicode 編碼問題！
2019-01-08
JavaScriptUnicode
JavaScript如何正確處理Unicode編碼問題！
2019-01-07
JavaScriptUnicode
Unicode、GBK、UTF-8、ASCII的編碼簡介
2020-04-06
UnicodeASCII
Qt處理中文編碼出現錯誤
2024-07-17
QT

Unicode編碼和中文互轉（JAVA實現）

相關文章