手把手教你在IDEA搭建 SparkSQL的開發環境

學而不思則罔！發表於2022-05-14

原文網址 : https://www.cnblogs.com/bajiaotai/p/16270916.html

1. 建立maven專案在IDEA中新增scala外掛並新增scala的sdk

https://www.cnblogs.com/bajiaotai/p/15381309.html

2. 相關依賴jar的引入配置pom.xml

2.1 pom.xml 示例 (spark版本: 3.0.0 scala版本: 2.12)

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>

    <groupId>com.dxm.sparksql</groupId>
    <artifactId>sparksql</artifactId>
    <version>1.0-SNAPSHOT</version>

    <!-- 指定變數 spark的版本資訊 scala的版本資訊--> 
    <properties>
        <spark.version>3.0.0</spark.version>
        <scala.version>2.12</scala.version>
    </properties>

    <dependencies>

        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-core_${scala.version}</artifactId>
            <version>${spark.version}</version>
        </dependency>

        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-yarn_${scala.version}</artifactId>
            <version>${spark.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-sql_${scala.version}</artifactId>
            <version>${spark.version}</version>
        </dependency>

        <dependency>
            <groupId>mysql</groupId>
            <artifactId>mysql-connector-java</artifactId>
            <version>5.1.27</version>
        </dependency>

        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-hive_${scala.version}</artifactId>
            <version>${spark.version}</version>
        </dependency>

        <dependency>
            <groupId>org.apache.hive</groupId>
            <artifactId>hive-exec</artifactId>
            <version>1.2.1</version>
        </dependency>

    </dependencies>


</project>

2.2 spark版本與scala版本對應關係的問題

#根據下面連結 即可查詢 spark版本和scala版本的對應關係及依賴配置
https://www.cnblogs.com/bajiaotai/p/16270971.html

2.3 在scala程式碼中檢視執行時的scala版本

println(util.Properties.versionString)

2.4 FAQ 因Spark版本和Scala版本不一致導致的報錯

待補充

3. 程式碼測試

object TestSparkSQLEnv extends App {

  //1.初始化 SparkSession 物件
  val spark = SparkSession
    .builder
    .master("local")
    //.appName("SparkSql Entrance Class SparkSession")
    //.config("spark.some.config.option", "some-value")
    .getOrCreate()

  //2.通過 SparkSession 獲取 SparkContext
  private val sc: SparkContext = spark.sparkContext

  //3.設定日誌級別
  // Valid log levels include: ALL, DEBUG, ERROR, FATAL, INFO, OFF, TRACE, WARN
  // This overrides any user-defined log settings //會覆蓋掉 使用者設定的日誌級別 比如 log4j.properties
  sc.setLogLevel("ERROR")

  import spark.implicits._

  //4.建立DataFream
  private val rdd2DfByCaseClass: DataFrame = spark.sparkContext
    .makeRDD(Array(Person("疫情", "何時"), Person("結束", "呢")))
    .toDF("名稱", "行動")
  rdd2DfByCaseClass.show()
  //  +----+----+
  //  |名稱|行動|
  //  +----+----+
  //  |疫情|何時|
  //  |結束|  呢|
  //  +----+----+

  //5.關閉資源
  spark.stop()

}

4. 結束語

如果能正常執行,恭喜你環境搭建沒問題,如果遇到問題請留言共同探討

idea開發之springboot環境搭建
2021-09-09
IdeaSpring Boot
【MIT6.S081/6.828】手把手教你搭建開發環境
2021-09-03
MIT開發環境
1分鐘手把手教你搭建Hyperf+Docker本地開發環境
2020-10-04
Docker開發環境
手把手教你搭建ffmpeg命令列環境
2020-02-17
命令列
使用IntelliJ IDEA 搭建 spring mvc開發環境
2019-03-04
IntelliJIdeaSpringMVC開發環境
基於 idea+maven 的 jmeter 開發環境搭建
2020-10-19
IdeaMavenJMeter開發環境
Windows下1分鐘手把手教你搭建Hyperf+Docker本地開發環境
2020-10-04
WindowsDocker開發環境
【Hadoop】：Windows下使用IDEA搭建Hadoop開發環境
2020-12-29
HadoopWindowsIdea開發環境
手把手教你搭建一個灰度釋出環境
2020-03-31
手把手教你在win10下搭建pytorch GPU環境（Anaconda+Pycharm）
2020-08-16
Win10PyTorchGPUPyCharm
手把手教你搭建hadoop+hive測試環境(新手向)
2018-05-10
HadoopHive
Linux環境搭建 | 手把手教你配置Linux虛擬機器
2021-09-09
Linux虛擬機
使用multipass在mac搭建linux開發環境
2023-05-13
MacLinux開發環境
在 macOS Catalina 10.15 搭建 PHP 開發環境
2019-11-04
MacPHP開發環境
在Mac OS中搭建superset開發環境
2018-03-21
Mac開發環境
在Windows10搭建WebAssembly開發環境
2021-03-15
WindowsWeb開發環境
搭建vue的開發環境
2018-05-10
Vue開發環境
Flutter開發入門之開發環境搭建(VSCode搭建Flutter開發環境)
2019-12-03
Flutter開發環境VSCode
詳解Window10下使用IDEA搭建Hadoop開發環境
2021-07-21
IdeaHadoop開發環境
1 – 搭建開發環境
2019-02-23
開發環境
Androdi開發環境搭建
2019-01-22
開發環境
Cordova 開發環境搭建
2018-06-02
開發環境
GeoServer開發環境搭建
2024-05-04
Server開發環境
Qt開發環境搭建
2024-05-01
QT開發環境
前端開發環境搭建
2020-09-25
前端開發環境
QEMU 開發環境搭建
2020-10-15
開發環境
搭建go開發環境
2019-01-31
Go開發環境
JAVA開發環境搭建
2024-10-10
Java開發環境
搭建VUE開發環境
2018-04-25
Vue開發環境
lua 開發環境搭建
2024-06-01
開發環境
Theia 開發環境搭建
2023-03-28
開發環境
rollup 開發環境搭建
2021-08-16
開發環境
Linux搭建開發環境
2020-12-13
Linux開發環境
在Mac搭建react-native iOS開發環境
2019-01-17
MacReactiOS開發環境
在 Windows 上搭建 React Native IOS 開發環境
2019-03-01
WindowsReact NativeiOS開發環境
簡易的開發環境搭建
2018-12-24
開發環境
Android的開發環境搭建教程
2020-11-30
Android開發環境
在Ubantu16.04下Hyperledger fabric開發環境的搭建
2019-03-05
開發環境

手把手教你 在IDEA搭建 SparkSQL的開發環境

1. 建立maven專案 在IDEA中新增scala外掛 並新增scala的sdk

2. 相關依賴jar的引入 配置pom.xml

2.1 pom.xml 示例 (spark版本: 3.0.0 scala版本: 2.12)

2.2 spark版本與scala版本對應關係的問題

2.3 在scala程式碼中檢視執行時的scala版本

2.4 FAQ 因Spark版本和Scala版本不一致導致的報錯

3. 程式碼測試

4. 結束語

相關文章

手把手教你在IDEA搭建 SparkSQL的開發環境

1. 建立maven專案在IDEA中新增scala外掛並新增scala的sdk

2. 相關依賴jar的引入配置pom.xml