java.sql.SQLException: Incorrect string value

無名_四葉草發表於2020-04-05

轉自:http://comeonbabye.iteye.com/blog/1467272


//注: 裡面的*不是導致問題的特殊字元,因為特殊字元無法顯示,總之是某個轉成utf8後有4bytes的字元

背景: 
資料庫編碼,建表編碼,Content欄位編碼都設定為utf8,collation是預設的utf8_default(也嘗試過修改為其他的,未果,似乎不是collation的問題)

mysql> status;
--------------
mysql  Ver 14.14 Distrib 5.1.49, for debian-linux-gnu (i686) using readline 6.1

Connection id:		1402357
Current database:	**
Current user:		**
SSL:			Not in use
Current pager:		stdout
Using outfile:		''
Using delimiter:	;
Server version:		5.0.38 Debian etch distribution
Protocol version:	10
Connection:		** via TCP/IP
Server characterset:	gbk
Db     characterset:	utf8
Client characterset:	utf8
Conn.  characterset:	utf8
TCP port:		4307
Uptime:			187 days 22 hours 51 min 18 sec
--------------

現象: 
插入的資料中如果含有某些特殊字元,會導致插入資料失敗,例如字串”測試*插入資料”,在console中insert是正常的,但是使用java程式碼insert的時候報錯:

// 輸出很長,重點就一行
2012-02-06 14:44:43,741 ERROR BlaBlaServiceImpl:110 - insertOrUpdateBlaBla failed!
--- Cause: java.sql.SQLException: Incorrect string value: '
\xF0\x9F\x
92\x90</...' for column ……

問題的可能原因:(未證實) 
mysql中規定utf8字元MaxLen=3,但是某些unicode字元轉成utf8編碼之後有4個位元組,於是就杯具了

String c = "*"  ; // *代表某個utf8編碼後有4個byte的字元
byte[] bytes = c.getBytes("utf8");
for(byte b : bytes){
    System.out.print(Integer.toHexString(0x00FF & b)+" ");
}// 輸出 f0 9f 8d 8e
//
mysql> show character set;
+----------+-----------------------------+---------------------+--------+
| Charset  | Description                 | Default collation   | Maxlen |
+----------+-----------------------------+---------------------+--------+
| utf8     | UTF-8 Unicode               | utf8_general_ci     |      3 |
+----------+-----------------------------+---------------------+--------+

解決方案: 
修改Content欄位為MEDIUMBLOB(原來是MEDIUMTEXT),並且把SELECT語句修改成

SELECT CAST(Content AS CHAR CHARACTER SET utf8) AS Content ....

INSERT語句不需要修改,測試ok


相關文章