hive表查詢中文顯示亂碼

chengzipg發表於2018-06-04

  hive在查詢表資訊時,中文顯示亂碼,數字或者url顯現null問題解決思路。

1、確定create hive表時指定的row format delimited fields terminated by ‘xxx’中“xxx”格式是否和原始匯入表的data的行列分隔格式一致,如不一致,則會出現select結果中數字或者url顯現null等問題,所以需先統一格式。

2、Windows使用的GB2312編碼,大多數Linux系統支援的是UTF-8編碼,而在Windows遠端登陸時使用的是本地編碼,實際要求客戶端和伺服器端都要‘UTF-8’編碼。

3、SSH Secure Shell Client查詢結果中文顯示亂碼這是該軟體多年未解決的短板(網上如是說,實際上筆者並未去查證,只是實際操作確實遇到了該情況)。

4、SSH Secure Shell Client若中文有亂碼可選擇其他軟體,如:Xshell 4等,可設定編碼方式為UTF-8。

5、匯入的資料可使用Notepad++等軟體先設定好‘UTF-8’編碼,在通過load data…等方式匯入到hive表中。

  以上情況檢查後,基本可排除hive表查詢顯示亂碼或者其他問題的情況。

 

相關文章