好程式設計師大資料學習路線分享Scala系列之集合操作函式
好程式設計師大資料學習路線繼續為大家分享Scala系列之集合操作函式
4.6 集合的重要函式
4.6.1sum/max/min/count
在序列中查詢最大或最小值是一個極常見的需求,如下:
val numbers = Seq(11, 2, 5, 1, 6, 3, 9)
numbers.max
//11
numbers.min
//1
更高階的例子,其中包含一個書的序列
case
class Book(title: String, pages: Int)
val books = Seq( Book("Future of Scala developers", 85),
Book("Parallel algorithms", 240),
Book("Object Oriented Programming", 130),
Book("Mobile Development", 495) )
//Book(Mobile Development,495)
books.maxBy(book => book.pages)
//Book(Future of Scala developers,85)
books.minBy(book => book.pages)
如上所示,minBy & maxBy 方法解決了複雜資料的問題。你只需選擇決定資料最大或最小的屬性。
4.6.2 過濾
過濾一個數字 List,只獲取奇數的元素。
val numbers = Seq(1,2,3,4,5,6,7,8,9,10) numbers.filter(n => n % 2 == 0)
val books = Seq( Book("Future of Scala developers", 85),
Book("Parallel algorithms", 240),
Book("Object Oriented Programming", 130),
Book("Mobile Development", 495) )
books.filter(book => book.pages >= 120)
4.6.3 Flatten
val abcd = Seq('a', 'b', 'c', 'd')
val efgj = Seq('e', 'f', 'g', 'h')
val ijkl = Seq('i', 'j', 'k', 'l')
val mnop = Seq('m', 'n', 'o', 'p')
val qrst = Seq('q', 'r', 's', 't')
val uvwx = Seq('u', 'v', 'w', 'x')
val yz = Seq('y', 'z')
val alphabet = Seq(abcd, efgj, ijkl, mnop, qrst, uvwx, yz)
//
// List(a, b, c, d, e, f, g, h, i, j, k, l, m, n, o, p, q, r, s, t,
// u, v, w, x, y, z)
alphabet.flatten
當有一個集合的集合,然後你想對這些集合的所有元素進行操作時,就會用到 flatten。
4.6.4 集合之間的操作
差集、交集和並集
val num1 = Seq(1, 2, 3, 4, 5, 6)
val num2 = Seq(4, 5, 6, 7, 8, 9)
//List(1, 2, 3)
num1.diff(num2)
//List(4, 5, 6)
num1.intersect(num2)
//List(1, 2, 3, 4, 5, 6, 4, 5, 6, 7, 8, 9)
num1.union(num2)
上述示例中的 union 保留了重複的元素。如果我們不需要重複怎麼辦?這時可以使用 distinct 函式
//List(1, 2, 3, 4, 5, 6, 7, 8, 9)
num1.union(num2).distinct
下面是上述功能的圖示:
4.6.5 map (對映)列表元素
map 是 Scala 集合最常用的一個函式。它的功能十分強大:
val numbers = Seq(1,2,3,4,5,6)
//List(2, 4, 6, 8, 10, 12)
numbers.map(n => n * 2)
val chars = Seq('a', 'b', 'c', 'd')
//List(A, B, C, D)
chars.map(ch => ch.toUpper)
map 函式的邏輯是遍歷集合中的元素並對每個元素呼叫函式。
4.6.6 flatMap
flatMap 是由下列這兩個函式組成的:
map & flatten
例子:
val abcd = Seq('a', 'b', 'c', 'd')
//List(A, a, B, b, C, c, D, d)
abcd.flatMap(ch => List(ch.toUpper, ch))
4.6.7 對整個集合進行條件檢查
1. val numbers = Seq(3, 7, 2, 9, 6, 5, 1, 4, 2)
2. //ture numbers.forall(n => n < 10)
3. //false numbers.forall(n => n > 5)
而 forall 函式就是為處理這類需求而建立的。
4.6.8 對集合進行分組
比如把某個集合拆分成偶數集和奇數集,partition 函式可以幫我們做到這一點:
val numbers = Seq(3, 7, 2, 9, 6, 5, 1, 4, 2)
//(List(2, 6, 4, 2), List(3, 7, 9, 5, 1))
numbers.partition(n => n % 2 == 0)
4.6.9 Fold
另一個流行的操作是 fold,通常可以考慮 foldLeft 和 foldRight。他們是從不同的方面做同樣的工作:
val numbers = Seq(1, 2, 3, 4, 5)
//15 numbers.foldLeft(0)((res, n) => res + n)
val words = Seq("apple", "dog", "table")
//13 words.foldLeft(0)((resultLength, word) => resultLength + word.length)
foldLeft, reduceRight, and foldRight
方法foldLeft與reduceLeft工作方法很象,但是它讓你指定一個值作為第一個元素。
scala>
val a = Array(1, 2, 3)
a: Array[Int] = Array(1, 2, 3)
scala> a.reduceLeft(_+_)
res6: Int = 6
scala> a.foldLeft(100)(_+_)
res7: Int = 106
scala> a.foldLeft(200)(_+_)
res8: Int = 206
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69913892/viewspace-2656635/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 好程式設計師大資料學習路線分享Scala系列之物件程式設計師大資料物件
- 好程式設計師大資料學習路線分享Scala系列之抽象類程式設計師大資料抽象
- 好程式設計師大資料學習路線分享Scala系列之陣列程式設計師大資料陣列
- 好程式設計師大資料學習路線分享Scala系列之泛型程式設計師大資料泛型
- 好程式設計師大資料學習路線分享spark之Scala程式設計師大資料Spark
- 好程式設計師大資料學習路線分享Scala系列之對映Map程式設計師大資料
- 好程式設計師大資料學習路線分享Scala系列之基礎篇程式設計師大資料
- 好程式設計師大資料學習路線分享UDF函式程式設計師大資料函式
- 好程式設計師大資料學習路線分享高階函式程式設計師大資料函式
- 好程式設計師大資料教程分享Scala系列之Option_偏函式_String程式設計師大資料函式
- 好程式設計師大資料學習路線分享Scala分支和迴圈程式設計師大資料
- 好程式設計師大資料學習路線分享大資料之字串程式設計師大資料字串
- 好程式設計師大資料學習路線分享函式+map對映+元祖程式設計師大資料函式
- 好程式設計師大資料學習路線分享Lambda表示式程式設計師大資料
- 好程式設計師大資料教程Scala系列之高階函式程式設計師大資料函式
- 好程式設計師大資料教程分享Scala系列之閉包程式設計師大資料
- 好程式設計師大資料分享Scala系列之柯里化程式設計師大資料
- 好程式設計師大資料學習路線分享MAPREDUCE程式設計師大資料
- 好程式設計師大資料學習路線分享SparkSQl程式設計師大資料SparkSQL
- 好程式設計師大資料學習路線分享scala單列和伴生物件程式設計師大資料物件
- 好程式設計師大資料學習路線hive內部函式程式設計師大資料Hive函式
- 好程式設計師大資料學習路線分享大資料之執行緒程式設計師大資料執行緒
- 好程式設計師大資料學習路線分享Hbase指令學習程式設計師大資料
- 好程式設計師大資料教程Scala系列之類程式設計師大資料
- 好程式設計師大資料學習路線分享大資料之基礎語法程式設計師大資料
- 好程式設計師大資料教程分享Scala系列之檔案以及正規表示式程式設計師大資料
- 好程式設計師大資料學習路線Hadoop學習乾貨分享程式設計師大資料Hadoop
- 好程式設計師大資料學習路線分享HDFS學習總結程式設計師大資料
- 好程式設計師大資料學習路線分享hdfs學習乾貨程式設計師大資料
- 好程式設計師大資料學習路線分享Actor學習筆記程式設計師大資料筆記
- 好程式設計師大資料學習路線分享Map學習筆記程式設計師大資料筆記
- 好程式設計師大資料學習路線之mapreduce概述程式設計師大資料
- 好程式設計師大資料培訓分享spark之Scala程式設計師大資料Spark
- 好程式設計師大資料學習路線分享HDFS讀流程程式設計師大資料
- 好程式設計師大資料學習路線分享AWK詳解程式設計師大資料
- 好程式設計師大資料教程Scala系列之繼承程式設計師大資料繼承
- 好程式設計師web前端學習路線分享函式基礎程式設計師Web前端函式
- 好程式設計師大資料學習路線分享彈性分散式資料集RDD程式設計師大資料分散式