impala整合kerberos問題一例薦

菜菜光發表於2014-03-21

最近在折騰hadoop+kerberos，由於線上使用的元件比較多，遇到不少問題，記錄下來，碰到同樣問題的同學可以參考下。

在hdfs+mapred+kerberos執行正常後，開始嘗試整合impala.

其中statestore的引數：

export IMPALA_STATE_STORE_ARGS=${IMPALA_STATE_STORE_ARGS:- -log_dir=${IMPALA_LOG_DIR} 
    -state_store_port=${IMPALA_STATE_STORE_PORT} -kerberos_reinit_interval=60 -principal=impala/xxxxxx@KERBEROS_HADOOP -keytab_file=/etc/impala/conf.dist/impala.keytab}

impala-server的引數：

export IMPALA_SERVER_ARGS=${IMPALA_SERVER_ARGS:- -log_dir=${IMPALA_LOG_DIR} 
  -state_store_port=${IMPALA_STATE_STORE_PORT} -use_statestore -state_store_host=${IMPALA_STATE_STORE_HOST} 
  -be_port=${IMPALA_BACKEND_PORT} -statestore_subscriber_timeout_seconds=${STATESTORE_SUBSCRIBER_TIMEOUT_SECONDS} -mem_limit=50% 
    -kerberos_reinit_interval=60 -principal=impala/xxxxx@KERBEROS_HADOOP -keytab_file=/etc/impala/conf.dist/impala.keytab}

啟動statestore沒有異常，因為在impala 1.1.1版本中，statestore只是做一個監控impala-server程式的作用，不涉及和hadoop的通訊，而在啟動impala-server時，發現程式執行一段時間之後就會crash,通過設定impala的日誌級別export GLOG_v=3，可以在日誌中觀察到下面的錯誤：

E0305 17:29:06.696974 12551 UserGroupInformation.java:1411] PriviledgedActionException as:impala/datanode@KERBEROS_HADOOP (auth:KERBEROS)
cause:java.io.IOException: Couldn`t setup connection for impala/gd6g12s103-hadooptest-datanode.idc.vipshop.com@KERBEROS_HADOOP to hdfs/namenode@KERBEROS_HADOOP
E0305 17:29:06.699252 12551 impala-server.cc:339] Could not read the HDFS root directory at hdfs://bipcluster. Error was:
Failed on local exception: java.io.IOException: Couldn`t setup connection for impala/gdatanode@KERBEROS_HADOOP to
hdfs/namenode@KERBEROS_HADOOP; Host Details : local host is: "datanode/ip";
destination host is: "namenode":8020;
E0305 17:29:06.699296 12551 impala-server.cc:341] Aborting Impala Server startup due to improper configuration

可以看到確實再用kerbers做驗證登陸，但是在datanode和namenode通訊時出現錯誤，因為線上用了namenode的ha，在日誌中發現有ha的報錯，因為懷疑是ha的問題，在關閉ha後，問題仍然存在。

日誌中還有tgt相關的報錯：

Caused by: javax.security.sasl.SaslException: GSS initiate failed [Caused by GSSException: No valid credentials provided (Mechanism level: Failed to find any Kerberos tgt)]

但是手動通過kinit驗證，是可以獲取tgt的，說明tgt的驗證是ok的。

在datanode端，執行hadoop fs -ls 的命令時，報錯。通過export HADOOP_ROOT_LOGGER=DEBUG,console 設定hadoop命令的日誌級別，發現也是同樣報了tgt相關的錯誤。

在通過klist檢視tgt的cache，發現tgt竟然過期了，而且不能進行kinit -R.

klist
Ticket cache: FILE:/tmp/krb5cc_501
Default principal: hdfs/namenode@KERBEROS_HADOOP
Valid starting     Expires            Service principal
03/11/14 18:45:52  03/12/14 18:45:52  krbtgt/KERBEROS_HADOOP@KERBEROS_HADOOP
        renew until 03/11/14 18:45:56

這是由於renew expires導致，kerberos中有兩個時間比較重要：

max_list,tgt的有效時間，max_renewable_life ,renew的時間，在max_renewable_life 時間內，過期的tgt可以renew，如果時間超過max_renewable_life就不能renew了。。

檢視線上的設定：

max_life = 25h
max_renewable_life = 4w

而實際renew 的最大時間卻是4s（03/11/14 18:45:56-03/11/14 18:45:52），看來w不是week的意思。。不知道算不算bug，修正下，改成30d，重新kinit，就正常了。。

後面如果報Kerberos: Couldn`t find mech GSSAPI 說明是cyrus-sasl-gssapi的相關包沒有安裝。

啟動正常後驗證：

impala-shell -i  ip -k  -s impala
Starting Impala Shell in secure mode (using Kerberos)
[10.19.111.106:21000] > use cdnlog;
Query: use cdnlog
[10.19.111.106:21000] > select count(1) from dd_log;
Query: select count(1) from dd_log
Query finished, fetching results ...
+----------+
| count(1) |
+----------+
| 5000000  |
+----------+

可以看到已經正常跑了，自己對kerberos的瞭解還是太少了，在解決kerberos的相關問題的時候，第一步就應該用klist驗證。。

Kerberos問題總結
2020-12-08
ROS
Kerberos加密級別不支援的問題
2018-12-03
ROS加密
關於Kerberos安裝的幾個問題(轉)
2007-08-12
ROS
zk 啟用kerberos後 hbase連線不上問題
2020-09-27
ROS
MySQL 5.7鎖的問題一例
2017-12-06
MySql
Oracle效能問題診斷一例
2012-09-11
Oracle
DRM引起的問題解決一例
2015-03-21
Hue的Impala模組沒有釋放連線的問題解決
2021-09-09
kerberos
2021-05-21
ROS
SQL Server database mail問題診斷一例
2019-10-31
SQLServerDatabaseAI
Oracle DRM引起的問題解決一例
2017-08-02
Oracle
在hadoop叢集部署hbase並開啟kerberos薦
2014-09-04
HadoopROS
MySQL主從複製問題解決一例
2021-09-09
MySql
GoldenGate Extract程式hang問題解決一例
2015-05-25
Go
表格不能垂直居中問題解決一例 (轉)
2007-08-17
Hibernate，Weblogic整合問題
2003-08-11
Web
JBOSS與JBuilder的整合問題！
2003-08-29
UI
oracle並行查詢一例薦
2009-04-07
Oracle並行
linux遠端訪問問題薦
2010-11-28
Linux
徵集對Oracle的問題薦
2009-10-07
Oracle
Kerberos協議
2015-06-08
ROS協議
透過Kerberos認證訪問Oracle11g
2021-03-05
ROSOracle
namenode gc導致的故障一例薦
2014-05-29
GC
處理mysql複製故障一例薦
2011-11-18
MySql
Apache Impala 架構
2022-01-23
Apache架構
oracle dbca報Exception in thread main 問題解決一例
2010-04-20
OracleExceptionthreadAI
解決Restarting死程式QMN0問題一例
2007-05-23
REST
解決HIS叢集系統的效能問題一例
2009-12-13
淺談天涯收費問題薦
2009-06-17
使用SpringMVC整合SpringSession的問題
2015-05-17
SpringMVCGseSession
apache和weblogic整合後很慢問題
2009-03-29
ApacheWeb
MongoDB報錯"not authorized on root to execute command"問題解決一例
2017-09-27
MongoDBZed
oracle system 表空間32G問題解決一例
2014-03-10
Oracle
impala 條件函式
2020-11-19
函式
python 安裝 impala
2018-06-07
Python
DBeaver如何連線impala
2024-10-29
Android APN的設定問題薦
2010-09-08
Android
keycloak整合微信登陸~解決國內微信整合的問題
2021-01-13

impala整合kerberos問題一例薦

相關文章