六大對比維度,Redshift與BigQuery選型指南!

資料庫頻道發表於2018-12-14

雲資料倉儲一直是熱度很高的領域,Amazon Redshift和Google BigQuery作為最受歡迎的資料倉儲一直是企業選型的重點。為了更加有效的幫助大家選型,我們將在技術環境、價格、資料靈活性和可伸縮性等多個方面進行了比較。

Amazon Redshift和Google BigQuery

Redshift最初是在2012年由亞馬遜釋出的。Redshift的靈感來自於PostgreSQL的關係本質,可應用於OLAP和BI應用程式,基於PostgreSQL 8.0.2,由ParAccel建立,其中ParAccel是專為BI高階分析而設計的資料庫管理系統。

BigQuery最初只是在Google內部使用,後來才向外推廣。BigQuery是基於Dremel開發的Web服務,其將Dremel呈現在REST介面之上,BigQuery類似於混合系統,基於列操作,支援資料整合。

技術環境

兩家公司都建立了強大而全面的技術環境,可透過資料整合支援系統,也可透過分析工具提升BI分析能力,同時也提供了開發人員社群和技術諮詢。

價格

如果單純比較價格,那麼Redshift要比BigQuery貴得多,Redshift大概是每GB 0.08美元,而BigQuery是每GB為0.02美元。但是,BigQuery只提供儲存不提供查詢服務,如果要使用查詢服務,那該平臺會以5美元/ TB的價格單獨收取費用。由於BigQuery缺少索引和各種分析查詢,因此掃描資料是一個巨大而昂貴的過程。而使用者之所以會選擇Amazon Redshift,很大的原因是它可預測,且資料的使用和分析很簡單。

資料靈活性

如果在事務期間發生任何事情,Amazon Redshift允許使用者執行回滾以確保資料返回到一致狀態。BigQuery的工作原理是僅附加資料,其儲存引擎也嚴格遵循這一要求,所以當在事務處理期間出現問題時,使用者就不得不從頭開始或者從某個特定點開始重新啟動。

另外,BigQuery中的重複資料難以實現且成本高昂。這兩種技術都對插入流資料有所保留,Redshift透過保證資料儲存得到了使用者的青睞,而BigQuery則透過使用時間視窗來支援流資料的重複資料刪除。

場景支援

BigQuery在統一場景中要優於Redshift,因為BigQuery將底層硬體元件、資料庫和其他形式的細節都分開了。而Redshift的學習使用具有一定的複雜性,需要具備深厚的知識和特定的技能。

支援分配

BigQuery會測量使用者想要執行的每個查詢所需的插槽數,可按需增加;而Redshift則是透過限制組成叢集所需的裝置來遵循經典過程。Redshift的另一個缺點是大小調整,使用者需要將所有資料重新定位到新叢集。

安全

首先,兩個產品都提供了傳統的身份驗證和安全功能。

Google BiqQuery支援雲身份和訪問管理,允許使用者使用OAuth獲取叢集。

Amazon Redshift依靠IAM為使用者提供亞馬遜管理訪問和身份,該系統是一個功能強大,可在訪問和身份管理的情況下監控複雜情況。

選型建議

Redshift和BigQuery都採用雲託管技術,提供類似於分析資料庫的功能和技術。使用者在選擇時,可參考自己公司的需求和財務狀況,如果是小公司和初創公司,建議使用Google BigQuery,因為其簡單且經濟實惠,對雲資料庫技術不熟悉的人也能輕鬆掌握,因為它不會涉及太多的複雜問題。亞馬遜Redshift靈活性不太好,涉及叢集建立等複雜操作,適合技術實力比較強的公司,另外,Redshift還可以透過可預測技術和叢集使用來詳細分析具體情況。

來自 “ https://www.analyticsindiamag.com/redshift-vs-bigq ”,原文連結:http://blog.itpub.net/31545814/viewspace-2285237/,如需轉載,請註明出處,否則將追究法律責任。

相關文章