cdh版spark on yarn與idea直連操作sql遇到的一些問題

Karas911發表於2018-12-21

原文網址 : https://blog.csdn.net/Karas911/article/details/85159189

spark on yarn與idea直連操作sql遇到的一些問題

先上程式碼

 SparkConf conf = new SparkConf().setAppName("programdept").setMaster("yarn-client")
               .set("yarn.resourcemanager.hostname", "10.100.200.11")
//                .set("spark.executor.instances","1")
//               .set("spark.executor.memory","3500M")
                .setJars(new String[]{"D:\\code\\sparkonyarn\\out\\artifacts\\sparkonyarn.jar"})
                .set("spark.yarn.preserve.staging.files","false")
                .set("spark.executor.extraClassPath"," /opt/cloudera/parcels/CDH-5.14.0-1.cdh5.14.0.p0.24/lib/hive/lib/*");

        JavaSparkContext sparkContext = new JavaSparkContext(conf);
        HiveContext hiveContext = new HiveContext(sparkContext.sc());
//      hiveContext.clearCache();

       hiveContext.sql("use oracle_table");
        DataFrame sql = hiveContext.sql("select count(1) from com_organization")
        sparkContext.close();
    }

其實就是一個很簡單的需求，通過hive與spark整合從而來查詢hive表中的資料

首先你要把配置檔案放入idea中
你的程式碼設定為spark on yarn模式，參考上方程式碼
設定好你的包
執行一直失敗，參考日誌
缺少某些包，接著把yarn site中設定相應的包
還差hive的包，通過上方的方式匯入不行，就直接在程式碼中新增
set(“spark.executor.extraClassPath”," /opt/cloudera/parcels/CDH-5.14.0-1.cdh5.14.0.p0.24/lib/hive/lib/*
最終執行成功，在出現此種錯的時候去翻看其他人的解決方法，而沒有細分析自己的日誌，導致做了很多無用功，自己出現問題自己先找好自己的

記錄一次spark連線mysql遇到的問題
2018-08-15
SparkMySql
Apache Kyuubi 助力 CDH 解鎖 Spark SQL
2021-11-18
ApacheSparkSQL
Python操作SAP時候遇到的一些常見問題
2024-04-28
Python
Spark:Yarn-client與Yarn-cluster
2019-02-15
SparkYarnclient
spark 與 yarn 結合
2019-07-23
SparkYarn
git 操作遇到問題
2019-03-28
Git
小程式遇到的一些問題
2024-04-15
提交Spark作業遇到的NoSuchMethodError問題總結
2021-09-05
SparkError
VisualStudio遇到的一些初級問題
2018-08-09
面試中遇到的一些問題
2018-07-01
面試
Docker遇到的一些問題和感想
2022-03-03
Docker
CDH版Hadoop-zookeeper-hbase-spark安裝文件
2020-04-05
HadoopSpark
關於操作駁回遇到的問題
2024-06-08
Spark on Yarn 和Spark on Mesos
2018-11-20
SparkYarn
spark2.2.0 配置spark sql 操作hive
2018-09-23
SparkSQLHive
[20211221]分析sql語句遇到的問題.txt
2021-12-22
SQL
Spark之HiveSupport連線（spark-shell和IDEA）
2018-09-17
SparkHiveIdea
vue工作中遇到的一些小問題
2018-08-13
Vue
docker開荒hyperf遇到的一些問題
2020-08-18
Docker
12 Spark on YARN
2021-09-09
SparkYarn
Spark SQL：通用的load和save操作
2018-09-26
SparkSQL
C#操作時區轉換時遇到的一些問題和解決方法分享
2020-05-14
C#
npm與yarn的一些筆記
2020-11-08
NPMYarn筆記
[IDE][IDEA]教你一些IDEA比較騷的操作
2019-03-28
Idea
專案中遇到的一些問題小結
2018-06-30
maven專案遇到的一些問題記錄
2018-04-22
Maven
atxserver2 部署遇到一些問題
2020-10-14
Server
laravel開發中遇到的問題與bug修復的一些總結
2021-02-01
Laravel
Spark SQL中出現 CROSS JOIN 問題解決
2019-10-13
SparkSQLROS
Spark UI (基於Yarn) 分析與定製
2021-09-09
SparkUIYarn
git的一些常用操作和問題
2024-11-30
Git
Spark on Yarn 實踐
2018-05-27
SparkYarn
CDH 5.13.0安裝Spark 2.2
2018-10-30
Spark
Idea裡開發遇到所有專案的所有程式碼爆紅的問題與解決
2024-03-14
Idea
工作中遇到的一些問題和處理
2019-04-17
配置pycharm 編譯器時遇到的一些問題
2019-03-09
PyCharm編譯
阿里面試中遇到的一些架構問題
2018-09-11
阿里面試架構
測試管理者常遇到的一些問題
2024-09-29

cdh版spark on yarn與idea直連操作sql遇到的一些問題

spark on yarn與idea直連操作sql遇到的一些問題

相關文章