SparkSQL部署與簡單使用
一、執行環境
Ø JDK : 1.8.0_45 64 位
Ø hadoop-2.6.0-cdh5.7.0
Ø Scala : 2.11.8
Ø spark-2.3.1-bin-2.6.0-cdh5.7.0(需要自己編譯)
Ø hive-1.1.0-cdh5.7.0
Ø MySQL5.6
二、SparkSQL執行準備
#後設資料存在MySQL,啟動MySQL
[root@hadoop001 ~]# su mysqladmin [mysqladmin@hadoop001 root]$ cd ~ [mysqladmin@hadoop001 ~]$ service mysql start Starting MySQL [ OK ]
#啟動HDFS
[hadoop@hadoop001 sbin]$ ./start-dfs.sh
#配置SparkSQL 的hive-site.xml
[hadoop@hadoop001 ~]$ cp $HIVE_HOME/conf/hive-site.xml $SPARK_HOME/conf/
三、SparkSQL啟動
#spark-sehll方式啟動:
[hadoop@hadoop001 bin]$ ./spark-shell --master local[2] \ --jars ~/software/mysql-connector-java-5.1.34-bin.jar scala> spark.sql("use hive_data2").show(false) scala> spark.sql("select * from emp").show(false) +-----+------+---------+----+----------+-------+------+------+ |empno|ename |job |mgr |hiredate |salary |comm |deptno| +-----+------+---------+----+----------+-------+------+------+ |7369 |SMITH |CLERK |7902|1980-12-17|800.0 |null |20 | |7499 |ALLEN |SALESMAN |7698|1981-2-20 |1600.0 |300.0 |30 | |7521 |WARD |SALESMAN |7698|1981-2-22 |1250.0 |500.0 |30 | |7566 |JONES |MANAGER |7839|1981-4-2 |2975.0 |null |20 | |7654 |MARTIN|SALESMAN |7698|1981-9-28 |1250.0 |1400.0|30 | |7698 |BLAKE |MANAGER |7839|1981-5-1 |2850.0 |null |30 | |7782 |CLARK |MANAGER |7839|1981-6-9 |2450.0 |null |10 | |7788 |SCOTT |ANALYST |7566|1987-4-19 |3000.0 |null |20 | |7839 |KING |PRESIDENT|null|1981-11-17|5000.0 |null |10 | |7844 |TURNER|SALESMAN |7698|1981-9-8 |1500.0 |0.0 |30 | |7876 |ADAMS |CLERK |7788|1987-5-23 |1100.0 |null |20 | |7900 |JAMES |CLERK |7698|1981-12-3 |950.0 |null |30 | |7902 |FORD |ANALYST |7566|1981-12-3 |3000.0 |null |20 | |7934 |MILLER|CLERK |7782|1982-1-23 |1300.0 |null |10 | |8888 |HIVE |PROGRAM |7839|1988-1-23 |10300.0|null |null | +-----+------+---------+----+----------+-------+------+------+
#spark-sql方式啟動:
[hadoop@hadoop001 bin]$ ./spark-sql --master local[2] \ --driver-class-path ~/software/mysql-connector-java-5.1.34-bin.jar #進入資料庫 spark-sql> use hive_data2; 18/08/30 20:36:52 INFO HiveMetaStore: 0: get_database: hive_data2 18/08/30 20:36:52 INFO audit: ugi=hadoop ip=unknown-ip-addr cmd=get_database: hive_data2 Time taken: 0.114 seconds #查詢資料 spark-sql> select * from emp; 18/08/30 20:37:05 INFO DAGScheduler: Job 0 finished: processCmd at CliDriver.java:376, took 1.292944 s 7369 SMITH CLERK 7902 1980-12-17 800.0 NULL 20 7499 ALLEN SALESMAN 7698 1981-2-20 1600.0 300.0 30 7521 WARD SALESMAN 7698 1981-2-22 1250.0 500.0 30 7566 JONES MANAGER 7839 1981-4-2 2975.0 NULL 20 7654 MARTIN SALESMAN 7698 1981-9-28 1250.0 1400.0 30 7698 BLAKE MANAGER 7839 1981-5-1 2850.0 NULL 30 7782 CLARK MANAGER 7839 1981-6-9 2450.0 NULL 10 7788 SCOTT ANALYST 7566 1987-4-19 3000.0 NULL 20 7839 KING PRESIDENT NULL 1981-11-17 5000.0 NULL 10 7844 TURNER SALESMAN 7698 1981-9-8 1500.0 0.0 30 7876 ADAMS CLERK 7788 1987-5-23 1100.0 NULL 20 7900 JAMES CLERK 7698 1981-12-3 950.0 NULL 30 7902 FORD ANALYST 7566 1981-12-3 3000.0 NULL 20 7934 MILLER CLERK 7782 1982-1-23 1300.0 NULL 10 8888 HIVE PROGRAM 7839 1988-1-23 10300.0 NULL NULL
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31441024/viewspace-2213260/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- SkyWalking部署及.Net Core簡單使用
- goc 學習:原始碼部署和簡單使用Go原始碼
- SparkSQL與Hive metastore ParquetSparkSQLHiveAST
- JDBC入門與簡單使用JDBC
- windows tomcat 簡單部署WindowsTomcat
- x-easypdf 初始與簡單使用
- RediSearch的簡單使用與總結Redis
- Redis叢集搭建與簡單使用Redis
- channel的單向用法與select,range簡單使用
- Jumpserver簡介,部署使用Server
- Go 原生 RPC 與 APRC 的簡單使用GoRPC
- Flutter Dio http簡單封裝與使用FlutterHTTP封裝
- Redis安裝與使用之簡單案例Redis
- SparkSql與Redis綜合練習SparkSQLRedis
- SpringBoot簡單打包部署(附工程)Spring Boot
- nginx部署及簡單優化Nginx優化
- Flume安裝及簡單部署
- forms元件補充與ModelForm簡單使用與cookie與sessionORM元件CookieSession
- PMM--簡介與部署
- Mac下PostgreSQL的安裝與簡單使用MacSQL
- 關於 RabbitMQ 的安裝與簡單使用MQ
- Java註解知識梳理與簡單使用Java
- python的下載安裝與簡單使用Python
- js與ios橋接使用WebViewJavascriptBridge簡單理解JSiOS橋接WebViewJavaScript
- Redis部署與使用Redis
- Redash視覺化BI系統部署安裝及簡單使用視覺化
- 使用ollama + AnythingLLM快速且簡單的在本地部署llama3
- Linux下簡單部署伺服器Linux伺服器
- git簡單使用Git
- OpenFeign簡單使用
- jq 簡單使用
- Quartz 簡單使用quartz
- LinqPad簡單使用
- kvm簡單使用
- 簡單使用 rocketmqMQ
- Badger簡單使用
- Drozer簡單使用
- Github 簡單使用Github