cdh版spark on yarn與idea直連操作sql遇到的一些問題
spark on yarn與idea直連操作sql遇到的一些問題
先上程式碼
SparkConf conf = new SparkConf().setAppName("programdept").setMaster("yarn-client")
.set("yarn.resourcemanager.hostname", "10.100.200.11")
// .set("spark.executor.instances","1")
// .set("spark.executor.memory","3500M")
.setJars(new String[]{"D:\\code\\sparkonyarn\\out\\artifacts\\sparkonyarn.jar"})
.set("spark.yarn.preserve.staging.files","false")
.set("spark.executor.extraClassPath"," /opt/cloudera/parcels/CDH-5.14.0-1.cdh5.14.0.p0.24/lib/hive/lib/*");
JavaSparkContext sparkContext = new JavaSparkContext(conf);
HiveContext hiveContext = new HiveContext(sparkContext.sc());
// hiveContext.clearCache();
hiveContext.sql("use oracle_table");
DataFrame sql = hiveContext.sql("select count(1) from com_organization")
sparkContext.close();
}
其實就是一個很簡單的需求,通過hive與spark整合從而來查詢hive表中的資料
-
首先你要把配置檔案放入idea中
-
你的程式碼設定為spark on yarn模式,參考上方程式碼
-
設定好你的包
-
執行一直失敗,參考日誌
-
缺少某些包,接著把yarn site中設定相應的包
-
還差hive的包,通過上方的方式匯入不行,就直接在程式碼中新增
set(“spark.executor.extraClassPath”," /opt/cloudera/parcels/CDH-5.14.0-1.cdh5.14.0.p0.24/lib/hive/lib/* -
最終執行成功,在出現此種錯的時候去翻看其他人的解決方法,而沒有細分析自己的日誌,導致做了很多無用功,自己出現問題自己先找好自己的
相關文章
- 記錄一次spark連線mysql遇到的問題SparkMySql
- Apache Kyuubi 助力 CDH 解鎖 Spark SQLApacheSparkSQL
- Python操作SAP時候遇到的一些常見問題Python
- Spark:Yarn-client與Yarn-clusterSparkYarnclient
- spark 與 yarn 結合SparkYarn
- git 操作遇到問題Git
- 小程式遇到的一些問題
- 提交Spark作業遇到的NoSuchMethodError問題總結SparkError
- VisualStudio遇到的一些初級問題
- 面試中遇到的一些問題面試
- Docker遇到的一些問題和感想Docker
- CDH版Hadoop-zookeeper-hbase-spark安裝文件HadoopSpark
- 關於操作駁回遇到的問題
- Spark on Yarn 和Spark on MesosSparkYarn
- spark2.2.0 配置spark sql 操作hiveSparkSQLHive
- [20211221]分析sql語句遇到的問題.txtSQL
- Spark之HiveSupport連線(spark-shell和IDEA)SparkHiveIdea
- vue工作中遇到的一些小問題Vue
- docker開荒hyperf遇到的一些問題Docker
- 12 Spark on YARNSparkYarn
- Spark SQL:通用的load和save操作SparkSQL
- C#操作時區轉換時遇到的一些問題和解決方法分享C#
- npm與yarn的一些筆記NPMYarn筆記
- [IDE][IDEA]教你一些IDEA比較騷的操作Idea
- 專案中遇到的一些問題小結
- maven專案遇到的一些問題記錄Maven
- atxserver2 部署遇到一些問題Server
- laravel開發中遇到的問題與bug修復的一些總結Laravel
- Spark SQL中出現 CROSS JOIN 問題解決SparkSQLROS
- Spark UI (基於Yarn) 分析與定製SparkUIYarn
- git的一些常用操作和問題Git
- Spark on Yarn 實踐SparkYarn
- CDH 5.13.0安裝Spark 2.2Spark
- Idea裡開發遇到所有專案的所有程式碼爆紅的問題與解決Idea
- 工作中遇到的一些問題和處理
- 配置pycharm 編譯器時遇到的一些問題PyCharm編譯
- 阿里面試中遇到的一些架構問題阿里面試架構
- 測試管理者常遇到的一些問題