關於這場Python 和Scala的較量，你怎麼看？

格伯納發表於2018-05-21

原文網址 : http://blog.itpub.net/31509949/viewspace-2154824/

關於這場Python 和Scala的較量，你怎麼看？

當談到ApacheSPark框架時，資料科學（網路）社群分為兩個陣營：有的認為Scala好用，有的認為Python好用。本文的目的就是比較兩者的優缺點，以供大家參考。

ApacheSPark是目前最流行的大資料分析框架（之一）。可以為Scala、Python、Java和R語言提供API支援，但本文只討論前兩種語言。因為Java不支援讀寫—評估—輸出這一迴圈，R語言普及度又不高。前兩種中，認為Scala好用的人表示，用Scala編寫ApacheSPark很快。而且Scala作為靜態型別的語音，已經被編譯收錄到了JVM（Java虛擬機器）。作者認為，每一種方法都有其優缺點，最終的選擇應取決於應用程式的型別。

效能

Scala的執行速度通常比Python快10倍左右。（因為JVM技術支援Scala語言的執行。）相比之下，作為動態類語言的Python，速度明顯緩慢。因為在Python中呼叫ApacheSPark庫需要大量的程式碼處理。所以從效能方面講，Scala更適合對有限資料庫的呼叫。

此外，Scala基於JVM技術，又根植於Hadoop框架下的HDFS檔案系統，所以它同Hadoop框架的互動、相容非常好。相比之下，Python於Hadoop框架的互動就及其糟糕了。開發人員甚至得使用第三方外掛才行(如hadopy)。

關於這場Python 和Scala的較量，你怎麼看？

學習曲線

這兩種語言都是功能性、面向特定物件的語言，它們具有相似的語法構造。與Python相比，Scala可能要複雜一些，因為它的功能更加高階。Python適合於簡單的邏輯處理，而Scala更適合於複雜的工作流。但Python也不是一無是處，因為Python語法簡單，有著更加標準的程式庫。

併發性

Scala有多個標準程式庫，而且支援在大資料生態系統中快速整合資料庫。它可以使用多個併發基元編寫程式碼，而Python不支援併發或多執行緒編寫程式碼。不過，Python支援重量級程式分叉。只不過它一次只能有一個執行緒處於活躍狀態。而且每當編寫新程式碼時，都必須重新啟動其他程式，這無疑會增加記憶體的佔用。

實用性

Python的特點是簡潔、容易上手。而Scala則在框架、庫、隱式、巨集等方面有著極大的優勢。這也是Scala在MapReduce框架中有著優秀表現的原因。由於Scala的API採集一致，因此許多Scala資料框架遵循著相似的資料型別。開發人員只需學習它常用的標準程式庫，就可以輕鬆地掌握其他庫。ApacheSPark是用Scala編寫的，因此瞭解Scala也可以幫助您認識並修改ApacheSPark內部的功能。但對於NLP來說，Python則是首選。（因為Scala缺乏用於機器學習或NLP的工具。）此外，Python也是GraphX、GraphFrames和MLLib的不二之選。Python的視覺化庫是對Pyspark的補充。這是ApacheSPark和Scala都沒有的東西。

程式碼恢復與安全

Scala作為靜態類語言，它支援我們查詢編譯時犯的錯誤。而Python是動態類語言。也就是說，在每次更改現有程式碼時，Python語音更容易出錯。因此，用Scala重構程式碼比Python重構更容易。

關於這場Python 和Scala的較量，你怎麼看？

結語

Python執行速度較慢，但上手容易。Scala是執行最快且上手能力適中的程式語言。通過Scala能幫助你能更加全面的瞭解ApacheSPark，因為ApacheSPark就是用Scala編寫的（但也不是絕對）。要知道，對程式語言的選擇取決於專案的特徵，我們要根據專案的特徵做到靈活變通。Python面向分析，Scala面向工程，但這兩種語言都是構建資料科學應用程式的優秀語言。總的來說，Scala更能充分的利用ApacheSPark的特徵。

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/31509949/viewspace-2154824/，如需轉載，請註明出處，否則將追究法律責任。

關於建表欄位是否該使用not null這個問題你怎麼看?
2024-09-25
Null
突發！Python再次衛冕，Java和C下降，你怎麼看？
2020-04-04
PythonJava
關於 JavaScript 中的特殊函式，你應該這樣看
2020-10-26
JavaScript函式
怎麼快速學習Python？請看這裡
2018-09-04
Python
關於技術書籍，我是這麼來選書和看書的
2021-04-12
[養兒防老]這個觀念你怎麼看？
2022-01-12
絕了！Python玩大了？程式設計師：這招太狠...你怎麼看？
2020-03-31
Python程式設計師
對於async和await的使用方式、作用效果不怎麼理解 ?沒關係，初步看這篇就夠了
2022-12-12
AI
怎麼看python包的版本
2021-09-11
Python
關於面試，我這樣看
2019-04-21
面試
scala怎麼退出
2024-04-21
關於python，你有什麼想要知道的嗎?
2020-08-12
Python
Python系列(三)：關於迭代器和生成器，你該瞭解這些
2020-03-19
Python
對於5G的到來，你是怎麼看的？說說你的想法
2024-11-23
完了！Python黃了！ 80%的程式設計師：痛快！你怎麼看？
2020-02-26
Python程式設計師
關於.gitignore怎麼保留子目錄的子目錄這件事
2024-04-07
Git
思想戰場上的較量
2022-01-17
確認! Python奪冠，80%的程式設計師：痛快！你怎麼看？
2020-11-03
Python程式設計師
這三個關於Python包匯入的知識點你知道嗎
2021-01-26
Python
這三個關於Python包匯入的知識點你知道嗎？
2021-01-16
Python
關於流量清洗，看這篇就夠了
2019-12-21
關於scala中的主建構函式
2020-09-24
函式
基於內容定址的分散式儲存系統IPFS，你怎麼看？
2019-02-25
分散式
已確認！Python 封王，Java 和 C宣佈永久退出競爭舞臺，你怎麼看？
2019-04-09
PythonJava
反轉！Python再次衛冕2020年程式設計榜，Java和C回落，你怎麼看？
2020-04-02
Python程式設計Java
你的MacOS待機時耗電嚴重嗎？怎麼解決看這裡
2020-08-15
Mac
怎麼看python是否安裝成功
2021-09-11
Python
關於SwiftUI，看這一篇就夠了
2020-06-24
SwiftUI
Python能幹什麼?python怎麼這麼火？
2021-12-24
Python
關於Flutter你要知道的可能都在這兒
2019-11-10
Flutter
這些關於WebSocket的知識，你知道多少？
2019-04-27
Web
關於Python的一切：2018年，你讀這8本書就夠了
2018-05-30
Python
關於Python縮排，你知道多少？
2019-04-25
Python
自建資料中心or公有云?對於企業業務你怎麼看
2018-04-19
關於雲原生，這些你要知道
2023-03-06
關於“算力”，這篇文章值得一看
2022-08-12
關於python，你知道它的優缺點嗎？
2020-06-18
Python
讓Python帶你看一場唯美的橫飄雪!
2019-01-10
Python

關於這場Python 和Scala的較量，你怎麼看？

關於這場Python 和Scala的較量，你怎麼看？

相關文章