[Spark base]-01

cauchemare_li發表於2017-05-08

首先學習基本的linux指令是必須的

下面給出ubuntu環境下搭載Spark網址：

http://blog.csdn.net/u010171031/article/details/51849562

其中特別是要找到spark-1.6.1-bin-hadoop2.6/usr 的絕對位置,，加上source /etc/profile,然後可以執行任何的python_shell(scala),pyspark(python),sparkR(R)

Spark首要概念是RDD（分散式資料集，可創造，可轉換,不可迭代）:

1)RDD

Actions：返回一個值

transformations:返回一個指向新RDDs的指標

#create RDD
textFile=sc.textFile("README.md")
#simple operations
#actions

textFile.count()

textFile.first()#transformationlinesWithSpark=textFile.filter(lambda line: "Spark" in line)

linesWithSpark.count()

#使用資料流模式（mapreduce）
wordcounts=textFile.flatMap(lambda line:line.split()).map(lambda word :(word,1)).reduceByKey(lambda a,b :a+b)
wordcounts.collect()  #收集每個字的統計次數

01_spark入門
2024-07-11
Spark
2014 Spark亞太峰會
2014-11-25
Spark
oracle base
2007-02-26
Oracle
base/publicPath
2024-04-08
Ubuntu base
2024-05-20
Ubuntu
Spark之spark shell
2018-09-13
Spark
【Spark篇】---Spark初始
2018-02-01
Spark
分散式base
2022-06-21
分散式
SQL management base
2014-03-02
SQL
oracle base topic
2015-03-08
Oracle
base.js
2013-06-25
JS
oracle-base
2005-06-05
Oracle
base標籤
2024-08-30
base64
2024-09-20
spark架構設計&程式設計模型01
2015-11-25
Spark架構程式設計模型
Spark on Yarn 和Spark on Mesos
2018-11-20
SparkYarn
Spark系列 - (3) Spark SQL
2023-02-23
SparkSQL
2018-06-15： Java 將網路圖片SRC轉換為Base64, Base64轉 MultipartFile
2018-06-15
Java
cout.setf(ios_base::fixed,ios_base::floatfield);
2017-05-15
iOS
Base64 原理
2021-08-24
Base64原理
2018-10-24
Views and Base Tables (243)
2007-11-24
View
Spark學習進度-Spark環境搭建&Spark shell
2021-01-04
Spark
【Spark】Spark容錯機制
2021-09-09
Spark
Spark導論（Spark自學一）
2017-10-10
Spark
都知道Base64，Base32你能實現嗎？
2021-01-26
spark
2022-07-05
Spark
spark學習筆記--Spark SQL
2018-07-13
Spark筆記SQL
Spark記錄（一）：Spark全景概述
2021-11-06
Spark
Spark開發-Spark核心細說
2017-09-21
Spark
Spark開發-spark環境搭建
2017-09-10
Spark
使用Apache的Base64類實現Base64加解密
2016-11-16
Apache解密
Base64工具類
2020-04-05
BASE理論之思考
2021-06-06
CAP原理和BASE思想
2018-11-19
Android Base64
2018-07-25
Android
Base64簡介
2017-03-11
Base64筆記
2008-06-23
筆記

[Spark base]-01

相關文章