[譯]2018 年度最佳資料庫即服務解決方案

cf020031308發表於2018-09-23

從應用程式到工作流,隨處都有資料庫的用武之地,而為大多數企業部署這些資料引擎的最佳方式便是成本低廉且功能先進的資料庫即服務(DBaaS)。這裡我們測評了一些頂級 DBaaS 解決方案供您參考,您可根據自身業務選擇其中最合適的。

[譯]2018 年度最佳資料庫即服務解決方案

什麼是資料庫即服務(DBaaS)?

資料庫即服務(DBaaS)是雲上資料庫儲存和服務的術語。它具有許多其他雲服務常見的優缺點,例如一方面是更好的成本控制,另一方面是比內部替代方案更有限的功能。不同的是,它可兼作引擎式軟體,支援從直接相關的資料視覺化工具到整個組織的企業資源規劃(ERP)平臺的大量其他軟體即服務(SaaS)應用。同時 DBaaS 這種解決方案仍繼承著資料庫功能所特有的優缺點。

DBaaS 的好處之一是令之前只能用於大型企業的技術更易使用,也降低了數字時代特有用例的准入門檻,例如物聯網(IoT)資料流、機器學習(ML)資料訓練,以及輔助邊緣計算的混合應用等。

DBaaS 的缺點包括資料庫的普遍僵化、資料科學的複雜性、整合的不靈活性、網路效能問題以及大量資料傳輸帶來的複雜性。這些限制可能導致不得不需要資料庫管理員(DBA)的幫助,儘管許多 DBaaS 供應商聲稱他們的平臺是可自助服務且對使用者友好的。

重要的是,哪怕 DBaaS 產品中資料庫的啟動和配置已有一定程度的自動化,資料科學仍不容易。但在眾多 DBaaS 產品選項中,還是有比其它更易用,即使普通開發者和商業分析師也足以掌握的產品服務的。

我從開發者和分析師的角度做了這個測評,因此這對於內部 IT 資源很少的中小型企業(SMB)也有借鑑意義。這個測評的目的不是要從嚴格的技術角度排出誰優誰劣,而是確定一個普通使用者在沒有 DBA 的幫助下可以將該服務使用到何種程度,同時仍保留該技術的全部優勢。如果僅考慮技術方面,那麼供應商排名可能會有所不同。

在 DBaaS 中“易於使用”意味著什麼

與任何其他 SaaS 產品一樣,DBaaS 實際上是其他人伺服器上的軟體。即使在不幸名為“無伺服器”的模型中也是如此。本文的“易於使用”不僅測評使用者介面是否對使用者友好,還涉及以下方面:

  1. 是否提供指導,幫助使用者根據自身資料或工作量選擇合適的資料庫型別或引擎,
  2. 載入和傳輸資料的容易程度,
  3. 伺服器硬體配置和服務配置項的自動化智慧程度,以及
  4. 備份和恢復過程的自動化程度。

如果使用者單是配置資料庫就得做出一長串決策,那麼無論 UI 上有多少下拉選單和說明框,它對於非 DBA 人士來說就都不算易用。然而出於不同目的或是另一種測評標準,它對 DBA 來說就是容易用的,甚至說得上是好用。換句話說,為了使 DBaaS 成為一個強大的自助服務平臺,它需要在每一個實際互動細節上消除對 DBA 的需求。

另一方面,如果它是已有資料庫的備份,或是混合資料庫的一部分,甚至是公司主資料庫(雲時代的公司通常是這種情況),那麼是否利於 DBA 使用和監控就應該是要考慮的首要因素。例如,如果您的公司多年來一直在本地執行 Microsoft SQL Server 例項,而現在選擇新增一個 Microsoft Azure SQL 資料庫例項作為雲上備份,則大多數終端使用者將永遠用不到這個例項。同樣,如果資料庫的主要任務是支援另一個應用程式或工作流,那麼使用者通常不需要直接與其進行互動。畢竟,一旦資料庫啟動並執行,使用者就可以藉助商業智慧(BI)、開發者和 DevOps 應用程式等工具來完成他們真正感興趣的工作。大多數情況下,資料庫仍處於後臺,不是 DBA 的話很少需要碰它,即使是高階使用者。

也就是說,這篇測評中的易用性包括所提供的所有服務。這些服務使得開發者、分析師以及少數 SMB 通用技術人員得以隨時啟用資料庫,而只需要很少的指令,以及信用卡和一臺能上網的膝上型電腦。

根據這些引數,Microsoft Azure SQL 資料庫是最容易使用的,MongoDB Atlas 緊隨其後。要從這兩個“主編推薦”獎項得主中選出適合您使用的,應多考慮您的資料格式和業務,而不是易用性。 IBM Db2 on Cloud 也很容易使用,但很多開發者可能會不贊同。除了大多集中在開發者的設計限制上的槽點外,IBM Db2 on Cloud 還有可選擇地區很少的問題,這可能是受限於歐盟通用資料保護法規(GDPR)。誠然,MongoDB Atlas 還不符合健康保險流通與責任法案(HIPAA),但這是暫時的。即便如此,HIPAA 對開發者的影響也比 GDPR 少,這使得後者變成了大量開發者和分析師最大的擔心。

測試版本,以及地區的重要性

對每種產品的測評內容還包括是否有試用版/免費版及其限制。例如,MongoDB Atlas 有一個“永久免費”版本,512 MB 儲存和共享隨機存取儲存器(RAM)。IBM Db2 on Cloud 有一個免費的含企業功能的開發者版本,但其免費商業版 Express-C 不含高階企業功能。付費版本差異較小,因為它們通常與儲存和計算用量而非功能特性相掛鉤。然而,在選擇之前,注意不同版本的可用功能和區域是非常重要的。

顯然,如果一個版本沒有你正需要的高階企業功能,例如 IBM Db2 on Cloud 的 Express-C 版,那它就沒用了。同樣,如果您需要解決 GDPR 的問題,或者您需要為世界各地的大量使用者提供低延遲的應用程式,那麼 Microsoft Azure SQL 資料庫驚人的全球 140 個國家的 50 個可選地區就很重要了。

地區方面,Microsoft Azure SQL 資料庫是迄今為止可選地區最多的。 MongoDB Atlas 排名第二,但這只是因為它託管在 Amazon Web Services(AWS)、Google CloudMicrosoft Azure 上,利用了這三家服務提供的地區。另外,與直覺相反,谷歌 BigQuery 的地區數量最少。

能夠為資料庫選擇地區位置非常重要,原因有兩個。首先,由於 GDPR 等法規,您必須確定資料所在的位置(即使在雲中)、遷移方向以及使用方式。即使您沒有歐盟(EU)客戶資料或歐盟員工資料,為保持符合 GDPR 標準也必須能夠選擇合適的資料庫位置。這裡有好些情況可能觸碰到 GDPR。

例如,員工可能是美國人,因此他的資料不受 GDPR 的影響。他的妻子可能是歐洲人或美國人,但如果他們的孩子出生在歐洲,就可能擁有雙重國籍。那麼他們的保險資料將受 GDPR 的影響。因此,即使公司沒有歐盟客戶或歐盟員工資料,也仍需要符合 GDPR 標準。該法律非常複雜。歐盟甚至還有另外的更復雜的隱私法。因此,謹慎地瞭解您的資料在何處以及發生了什麼,再想想您是否還認為您沒有任何歐盟個人資料需要擔心。

您的資料和應用程式越近,效能就越好,就越不會有滯後或其它問題。您會希望找個與資料庫相同的資料中心部署您的應用程式或將您的資料庫寄存在應用程式旁。

供應商之間以及單個供應商的不同產品線之間,版本也存在很大差異。有些剛開始不貴,但通過各種工具和服務升級來刺激消費,提高成本,例如額外的安全性或備份和恢復服務。注意這一點。

這篇測評中,我主要使用由供應商設定的中等價位測試帳戶,而不是更受限的試用版或免費版。有時我會傳輸自己的測試資料,有時我會載入供應商的測試資料或使用他們載入好的資料集。通常,供應商提供了額度以確保我可以徹底測試他們的系統。有時我用免費的開發者版本測試,比如說 SAP Cloud Platform,因為這些版本通常是功能齊全的。不論如何,我會在每篇測評中都寫明測試的版本。

SQL 還是 NoSQL?

另一個使得本文難以直接對比的因素是資料庫的型別。正如所有資料專業人士所知,SQL 處理結構化資料,NoSQL 用於非結構化資料,但這種區別對於普通使用者來說可能並不明顯。結構化資料的例子是電子表格,而非結構化資料的示例是 Twitter 反饋訊息。SQL 資料庫通常稱為關聯式資料庫,而 NoSQL 資料庫稱為非關聯式資料庫。

但是,當涉及到 DBaaS 時,選項更加多樣化,而不僅僅是確定資料是結構化還是非結構化。例如,開源 NoSQL 的 MongoDB Atlas 執行在其他品牌的雲服務上,如 AWS、Google 和 Microsoft。一些供應商會指導您完成迷宮般的選項,因為他們的品牌 DBaaS 服務提供了其它型別資料庫的產品選項。

例如,IBM Db2 on Cloud 就是 SQL,但它會在一開始就將使用者匯入 IBM 的 NoSQL DBaaS 產品 Cloudant,或開源資料庫 MongoDB on IBM,就像上傳的資料所指示的那樣。這對於那些資料科學技能很少或理解力有限的人來說非常有用。

在每篇測評中,我都會註明 DBaaS 產品是 SQL 還是 NoSQL,以及產品中是否有其他資料庫選項。大多數服務要求您本身就知道您需要什麼型別的資料庫。少數服務,如 IBM Db2 on Cloud,會通過新手教程引導您選擇正確的資料庫。

這有一個快速的經驗法則:如果您使用的是機器可讀的資料,那麼您需要 SQL。想想電子表格和物聯網資料。如果它是人類的想法或表達,那麼你需要 NoSQL。想想社交媒體、視訊資料和音訊資料。但要事先知道,有時應用程式會向推動您選擇某一種型別,通常是 SQL。但有時最終目標會推動您選擇另一種型別:NoSQL,利於更大、更快地擴充套件。

最後,請記住,機器學習輔助處理資料比自己白忙活一通更好。 機器學習的支援也在測評中有註明。

特色資料庫即服務解決方案測評:

Microsoft Azure SQL Database 測評 ⭐️ ⭐️ ⭐️ ⭐️ ⭐️

優點: 功能豐富。使用方便。許多地區都有更多符合 GDPR 標準的選項。遷移中沒有應用程式破損。基於機器學習的自動調整功能。支援 2005 年之後的 SQL 版本。

缺點: 僅適用於結構化資料,因為資料庫是 SQL。非常適合複雜的查詢,但不適合混亂的人類交流資料。

概要: Microsoft Azure SQL 資料庫是一種出色的資料庫即服務(DBaaS)解決方案,適用於開發者、商業分析師和資料庫管理員,因為它易於使用且可控性出色。

測評詳情

MongoDB Atlas 測評 ⭐️ ⭐️ ⭐️ ⭐️ ⭐️

優點: 易於使用。開源,具有強大的擴充套件、分片、無伺服器和機器學習功能。

缺點: 它是 NoSQL,因此它不適合複雜的查詢或需要 HIPAA 合規性的專案。某些應用程式需要 SQL 資料庫才能執行,就無需考慮 NoSQL 資料庫。

概要: MongoDB Atlas 是開發者的理想資料庫,具有非常簡單的使用者介面,比大多數資料庫即服務(DBaaS)解決方案更自動化,高度的靈活性和可控性,內建備份功能與零鎖定。

測評詳情

Amazon 關係型資料庫服務測評 ⭐️ ⭐️ ⭐️ ⭐ ️

優點: 穩定而強大。為使用者提供充分的控制。非常有安全意識。

缺點: 設定和移動資料複雜。需要資料庫管理員和網路專業人員的幫助才能進行設定。貴。

概要: Amazon 關係型資料庫服務不是一種對新手友好的資料庫即服務(DBaaS)解決方案,但如果有合適的專業人員幫助您,它將是一個很棒的關係型資料庫服務。

測評詳情

Google BigQuery 測評 ⭐️ ⭐️ ⭐️ ⭐️

優點: 非常適合大資料專案。資料提取靈活。分析快速。幾乎可以與任何型別的資料整合。

缺點: 專為大資料而設計,因此對小型資料集來說太重了。SQL 方言令人困惑。如果沒有適當關注工具使用和自動擴充套件,將會產生大量成本。更好的統一費率定價。

概要: Google BigQuery 是一個出色的資料庫即服務(DBaaS)解決方案,適用於雲時代的公司以及任何從事機器學習應用程式開發或處理大量資料集的人。

測評詳情

IBM Db2 on Cloud 測評 ⭐️ ⭐️ ⭐️ ⭐️

優點: 資料遷移和設定異常簡單。設計精良。

缺點: 可選地區較少,可能會影響您的效能和合規性要求,具體取決於您對資料庫的使用方式。

概要: IBM Db2 on Cloud 是面向開發者和商業分析師的理想資料庫即服務(DBaaS)解決方案,因為他們可以在沒有資料庫管理員幫助的情況下使用它,而無需太多專業技能。

測評詳情

SAP Cloud Platform 測評 ⭐️ ⭐️ ⭐️

優點: 非常適合 HANA 使用者和大資料開發者。是的,這意味著適合物聯網、機器學習和 Java。

缺點: 擁有兩個不同的開發者環境,這令人困惑,且可能具有限制性。

概要: SAP Cloud Platform 還不夠成熟,但它仍然是一個功能強大且獨特的資料庫即服務(DBaaS)解決方案,具有許多重要功能。

如果發現譯文存在錯誤或其他需要改進的地方,歡迎到 掘金翻譯計劃 對譯文進行修改並 PR,也可獲得相應獎勵積分。文章開頭的 本文永久連結 即為本文在 GitHub 上的 MarkDown 連結。


掘金翻譯計劃 是一個翻譯優質網際網路技術文章的社群,文章來源為 掘金 上的英文分享文章。內容覆蓋 AndroidiOS前端後端區塊鏈產品設計人工智慧等領域,想要檢視更多優質譯文請持續關注 掘金翻譯計劃官方微博知乎專欄

相關文章