從0到1搭建DeltaLake大資料平臺

ZH谢工發表於2024-10-16

1. 下載VMWare，安裝CentOS9虛擬機器

2. 配置使用者，建立目錄

1. 以管理員身份登入，建立Spark使用者給Spark使用

sudo adduser sparkuser

2. 修改新使用者密碼（123456）

sudo passwd sparkuser

3. 給新使用者Sparkuser Sudo許可權

　　切換到Root: su -

　　給sparkuser許可權： sparkuser ALL=(ALL) NOPASSWD:ALL

　　退出儲存： :qw

4. 以新建的sparkuser使用者登入，建立Spark目錄

sudo mkdir /opt/spark

5. 修改spark目錄owner為sparkuser

sudo chown -R sparkuser:sparkuser /opt/spark

3. 下載spark包，上傳到虛擬機器，解壓到spark目錄

sudo tar -xvzf spark-3.5.3-bin-hadoop3.tgz -C /opt/spark --strip-components=1

(The --strip-components=1 option removes the top-level directory from the extracted files, so they go directly into /opt/spark.)

　　sudo chown -R sparkuser:sparkuser /opt/spark

4. 設定環境變數

Add Spark to your PATH by editing the .bashrc or .bash_profile of the Spark user.

echo "export SPARK_HOME=/opt/spark" >> /home/sparkuser/.bashrc

echo "export PATH=\$PATH:\$SPARK_HOME/bin" >> /home/sparkuser/.bashrc

source /home/sparkuser/.bashrc

5. JAVA Setup

　　安裝Java

sudo yum install java-11-openjdk-devel

　　檢視版本

java -version

　　檢視路徑

readlink -f $(which java)

　　設定環境變數

echo "export JAVA_HOME=/usr/lib/jvm/java-11-openjdk-11.0.20.1.1-2.el9.x86_64" >> /home/sparkuser/.bashrc

echo "export PATH=$JAVA_HOME/bin:$PATH" >> /home/sparkuser/.bashrc

source /home/sparkuser/.bashrc

6. 啟動Spark

spark-shell

7. 啟動spark deltalake

bin/spark-shell --packages io.delta:delta-spark_2.12:3.2.0 \
--conf "spark.sql.extensions=io.delta.sql.DeltaSparkSessionExtension" \
--conf "spark.sql.catalog.spark_catalog=org.apache.spark.sql.delta.catalog.DeltaCatalog"

8. 測試deltalake

val data = spark.range(0, 5)
data.write.format("delta").save("/tmp/delta-table")

DNSLOG平臺搭建從0到1
2020-06-27
DNS
五個篇章講明白如何從0到1搭建大資料平臺
2023-03-03
大資料
從0到1搭建自助分析平臺
2020-09-09
回顧·大資料平臺從0到1之後
2019-03-03
大資料
某二手交易平臺大資料平臺從 0 到 1 演進與實踐
2020-06-06
大資料
2020實戰覆盤：如何從0到1搭建資料傳輸平臺產品DTS？
2021-01-05
聯童科技基於incubator-dolphinscheduler從0到1構建大資料排程平臺之路
2021-02-20
BAT大資料
保姆級教程，帶你認識大資料，從0到1搭建 Hadoop 叢集
2020-12-19
大資料Hadoop
從0-1搭建一個自動化部署平臺
2024-03-10
從0到1，成為大資料行業領袖
2018-03-26
大資料行業
從0到1，資料治理一週年大紀實
2022-07-25
大資料平臺CDH搭建
2019-02-11
大資料
大資料治理——搭建大資料探索平臺
2021-04-09
大資料
汽車之家資料庫服務化平臺從0到1的實踐過程
2018-08-23
資料庫
怎樣搭建大資料平臺
2022-03-29
大資料
中原銀行如何從0到1建設敏捷BI平臺？
2023-04-10
敏捷
小專案從0到1之跨平臺方案選型
2022-11-29
短影片平臺怎麼做，教你從0到1實現一個資料庫系統
2024-11-23
資料庫
從0開始搭建自己的直播平臺
2024-11-05
從0開始搭建seldom-platform平臺
2024-06-26
Platform
大資料平臺是什麼？有哪些功能？如何搭建大資料平臺？
2019-08-08
大資料
[打包優化]從0到1搭建element後臺框架優化篇
2019-04-26
優化框架
大資料平臺Hadoop叢集搭建
2020-09-28
大資料Hadoop
0到1搭建企業級資料治理體系
2022-08-02
從0到1搭建和部署個人部落格
2018-04-26
教你從0到1搭建小程式音視訊
2018-07-17
從0到1搭建域名郵件伺服器
2021-09-25
伺服器
手把手從0到1：搭建Kubernetes叢集
2021-11-09
易觀CTO郭煒：從0到N，建立高價效比大資料平臺
2020-04-04
大資料
大資料分析平臺搭建方式有哪些
2021-12-07
大資料
PHash從0到1
2020-12-09
從0到1搭建element後臺框架許可權設計與優化
2019-04-16
框架優化
從0到1開始搭建vue2+element ui 後臺管理系統
2024-07-12
VueUI
從 0 到 1，打造新一代開源函式計算平臺
2021-12-08
函式
資料視覺化平臺搭建，警務實戰平臺大資料應用
2020-12-28
視覺化大資料
智慧警務大資料平臺開發，資料視覺化分析平臺搭建
2021-01-06
大資料視覺化
大資料分析平臺的搭建方式有哪些
2021-11-09
大資料
企業為何需要搭建大資料平臺
2020-12-22
大資料

從0到1搭建DeltaLake大資料平臺

相關文章