陽振坤:從電動汽車看分散式資料庫的發展和崛起
21 世紀初,受環境保護、溫室效應和能源短缺等因素影響,電動汽車再次進入人們的視野,其核心價值卻是自動駕駛,技術門檻非常高,需要具備十分複雜的實時系統。同樣是 21 世紀初,由於網際網路業務的高併發和海量資料等處理需求,分散式資料庫再次被提及,並掀起應用熱潮,但分散式資料庫的核心價值是單個系統同時進行聯機事務處理與聯機分析處理的能力(HTAP),同樣是高技術門檻,需要具備十分複雜的實時系統。
本文將對電動汽車與分散式資料庫的發展進行分析對照。
01 夾縫求生
圖1:世界上第一個汽車專利證照,卡爾·本茨,1886年
1963 年,美國通用電氣公司的查爾斯·巴赫曼(Charles Bachman)等人開發出網狀資料庫 IDS(Integrated Data Store,見圖2)[2],被認為是第一個資料庫。
從 20 世紀初至今,一百多年的時間裡,燃油汽車都是汽車的絕對主流。事實上,電動汽車還先於燃油汽車誕生。法國發明家古斯塔夫·特魯維 (Gustave Trouvé) 於 1881 年發明了電動三輪汽車,並在巴黎市中心的瓦盧瓦街頭試車成功(見圖3)[3]。儘管如此,由於燃油以及發動機在功率體積比和功率重量比等方面的顯著優勢,燃油汽車成為汽車領域的首選。
類似地,從資料庫系統誕生的近六十年的時間裡,集中式資料庫是聯機事務處理(OLTP)的唯一選擇,儘管 1987 年出現 Ingres Star 分散式資料庫(見圖4)[4],但分散式事務的效能以及分散式系統的複雜性,使得分散式資料庫僅在近十年資料量非常大的聯機分析處理(OLAP)場景得到了一些應用。
02 時來運轉
因此,傳統汽車廠商更多地選擇製造混合動力汽車,即在燃油汽車上增加電池動力作為輔助,堵車或低速行駛時採用電池作為動力以節約能源並降低汙染物排放,正常行駛或高速行駛時則採用燃油作為動力。此外,一些新興汽車廠商如特斯拉等,則徹底摒棄燃油方案,開發了純粹以電池作為動力的電動汽車,也稱為純電動汽車。
分散式技術的發展和雲端計算的普及使分散式資料庫“浮出水面”。然而,受限於分散式資料庫更加複雜、故障定位更加困難、分散式事務效能有所降低、系統成熟度有所不足等因素,傳統資料庫廠商選擇“業務分庫分表+中介軟體”的解決方案,即基於集中式資料庫,對業務進行較大幅度的改造和拆解、拆分,使每個拆解、拆分後的部分適合於單個集中式資料庫,這就是分庫分表資料庫。
在很多人看來,電動汽車就是汽車把發動機和燃油換成了電動機和電池:
-
燃油汽車 = 發動機+燃油 + 底盤 + 車身 + 電氣裝置
-
電動汽車 = 電動機+電池 + 底盤 + 車身 + 電氣裝置
事實並非如此。首先,2020 年,電動汽車的王者玩家——特斯拉的市值超越了豐田,成為全球市值最高的汽車公司,緊接著在 2021 年,又超過了包括豐田汽車、大眾汽車、戴姆勒、通用汽車、法拉利和寶馬等在內的全球主要汽車公司市值的總和。再來看這一組資料:2021 年,特斯拉新車交付量突破 93 萬輛,營收 538.23 億美元,GAAP 淨利潤為 55.19 億美元;同期,豐田交付約 1,050 萬輛新車,淨利潤 211.7 億美元。
顯然,特斯拉邁過了年產 20 萬輛車的生死線,並同時保持很高的毛利率和很快的增長速度,這是資本市場青睞特斯拉的前提條件。特斯拉的核心競爭力包括其電池管理等重要技術。當然,最根本的原因是特斯拉的自動駕駛系統:
-
悠閒舒適是個人亙古不變的追求,自動駕駛能夠極大地降低汽車駕駛的勞動強度。
-
降本增效是企業永無止境的追求,自動駕駛不僅節省了人力,還能夠顯著地提升汽車利用率(比如後半夜、高原地區等高風險駕駛環境以及其他不適合人工駕駛的場景),從而極大地降低汽車總體擁有成本。
-
電動機可以無級平滑調速,這是自動駕駛的必要條件,發動機無法做到這一點,因此燃油汽車和包含發動機的混合動力汽車也就無法實現自動駕駛。
-
自動駕駛系統是十分複雜的實時系統,需要長時間的、大量的實際場景打磨,門檻極高。這個極高的門檻,以及傳統車載軟體與自動駕駛系統的巨大差異,使傳統汽車廠商轉型到純電動汽車以及進行自動駕駛技術的積累,都面臨極大挑戰。
-
集中式資料庫系統 = 集中式儲存+計算硬體 + SQL 子系統 + 事務子系統 + 儲存子系統
-
分散式資料庫系統 = 分散式儲存+計算硬體 + SQL 子系統 + 事務子系統 + 儲存子系統
-
悠閒舒適是個人亙古不變的追求,原生分散式資料庫能夠用一個系統同時滿足使用者 OLTP 和 OLAP 的需求,即 HTAP,避免了資料在 OLTP 和 OLAP 兩個系統之間的複製、轉換和載入(ETL),極大地簡化了使用者的操作,還避免了 ETL 導致的資料一致性問題。
-
降本增效是企業永無止境的追求,原生分散式資料庫一個系統、一份儲存,成本顯著低於 OLTP 和 OLAP 兩個系統的兩份儲存,不僅顯著降低使用者總體擁有成本,還避免了 ETL 導致的資料時效問題。
-
分庫分表把業務及資料分拆到多個資料庫,因此分庫分表資料庫無法實現 HTAP。
-
集中式資料庫聯機事務處理已經是開發困難且十分複雜的實時系統,分散式聯機事務處理的開發則更加複雜和困難,需要長時間的、大量的實際場景打磨,門檻極高。這個極高的門檻,以及傳統集中式資料庫與原生分散式資料庫在 SQL 最佳化器、事務處理和儲存架構等方面的顯著差異,使傳統資料庫廠商轉型到原生分散式資料庫並實現 HTAP 面臨很大的挑戰。
03 開源開放
從大到小
電動汽車以特斯拉為例,從跑車到高階型 SUV,再到緊湊型 SUV 與小轎車,從面向小眾到面向大眾;原生分散式資料庫的代表 OceanBase 從叢集版逐漸演變出單機版,從面向龐大業務到兼顧小型業務。
在一款汽車剛誕生時,沒有訂購量,更不會快速獲得利潤,因此,要做量產少、利潤大的產品,後期當成本得以控制時,再量產利潤空間小的產品。同樣對於資料庫來講,比如 OceanBase 首先在支付寶這樣海量資料的場景中落地,由於大業務不那麼在意成本、機器配置,使用大容量的硬碟就比較容易,利用高配置環境支撐業務,再逐步最佳化,達到即便使用小配置,也能支撐大業務的目標。
開源開放
2014年,特斯拉宣佈開放所有專利,在所有人懷疑其背後動機的時候,特斯拉已經認識到了自動駕駛是對汽車行業的顛覆性創新,即使其他企業擁有同樣的電動汽車製造能力,特斯拉也自信其能夠保證在電動汽車市場的領導地位。彼時人們對電動汽車的認可度還很低,特斯拉需要的是電動汽車產業崛起。
2021年,OceanBase 宣佈原始碼開源,與外界共享全球最領先的原生分散式資料庫的核心。同樣面對外界的質疑。OceanBase 堅定開源,一方面希望聚焦使用者價值,解決使用者的具體問題,另一方面期望與外界共建國產分散式資料庫的生態,從另一條賽道超越“IOE”。
04 面向未來
今天,在汽車領域,純電動汽車得到了越來越高的認可:
-
特斯拉 Model 3 標準車型,廠家標稱續航里程達到了 675km,超級充電樁 15 分鐘最大增加 279km 續航里程,續航里程和充電速度都在靠近燃油車。
-
2021 年底,大眾汽車宣佈,2026 年純電動汽車佔比 25%,2030 年純電動汽車佔比 50%,2040 年純電動汽車接近 100%。
-
2019 年,寶馬的研發總監還在怒懟純電動汽車:“歐洲不需要純電動汽車,而燃油汽車至少還能存在 30 年以上的時間”,然而,2021 年底,寶馬宣佈 2030 年純電動汽車至少佔比 50%。
-
2021 年底,豐田汽車宣佈將在 2030 年前推出 30 款純電動汽車。
-
國際事務處理效能委員會 TPC 的聯機事務處理 TPC-C 效能榜,其榜首位置被 OceanBase 原生分散式資料庫在 2020 年 5 月佔據,效能約 7.07 億 tpmC。
-
國際事務處理效能委員會 TPC 的決策支援處理 TPC-DS 效能榜,10,000GB 榜首位置被 Alibaba Cloud AnalyticDB 原生分散式資料庫在 2020 年 6 月佔據,效能約 19M QphDS;100,000GB 榜首位置被 Databricks Photon Engine 原生分散式資料庫在2021年11月佔據,效能約 33M QphDS。
-
國際事務處理效能委員會 TPC 的決策支援處理 TPC-H 效能榜,10,000GB、30,000GB 和 100,000GB 榜首位置均被 EXASOL 原生分散式資料庫在 2021 年 6 月佔據,效能大約都是 23M QphH。
自動駕駛是純電動車對汽車行業的顛覆式創新,純電動汽車是汽車發展的必然選擇;HTAP 是原生分散式資料庫對資料庫行業的顛覆式創新,原生分散式資料庫是資料庫發展的必然選擇。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69909943/viewspace-2857385/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 陽振坤:分散式技術引領關聯式資料庫發展分散式資料庫
- 北京大學拔山講壇 | OceanBase 陽振坤:特斯拉電動汽車的發展對分散式資料庫的啟示分散式資料庫
- 陽振坤:OceanBase如何跨越關聯式資料庫的“死亡之谷”資料庫
- 專訪 OceanBase 資料庫創始人陽振坤: 資料驅動業務發展 共建資料技術未來資料庫
- 陽振坤:OceanBase 資料庫七億 tpmC 的關鍵技術資料庫
- OceanBase創始人陽振坤:什麼是面向未來的資料庫資料庫
- OceanBase 創始人陽振坤 | 十餘年打磨 國產資料庫之路砥礪前行資料庫
- 陽振坤:資料庫天然選擇了計算機,但計算機天然並不適合資料庫資料庫計算機
- 陽振坤:OceanBase 4.0 核心技術解讀
- 分散式資料庫技術的演進和發展方向分散式資料庫
- 分散式 SQL:資料庫的未來發展方向分散式SQL資料庫
- 分散式資料庫強勢崛起,達夢資料庫如何破局?分散式資料庫
- 從資料庫發展史看資料庫未來技術趨勢資料庫
- 國產分散式資料庫發展趨勢與難點分散式資料庫
- 分散式資料庫技術之路未來如何發展?分散式資料庫
- 大資料將促進分散式資料庫發展及去Oracle大資料分散式資料庫Oracle
- 從Facebook看移動開發的發展移動開發
- 電動化浪潮的助力中國汽車產業崛起產業
- 看大咖解讀2022版《分散式資料庫發展趨勢研究報告》分散式資料庫
- 華為雲資料庫首席專家談分散式資料應用挑戰和發展建議資料庫分散式
- 從信通院“可信資料庫”評測結果看圖資料庫發展情況資料庫
- 從資料儲存發展史看IPFS/Filecoin
- KEMET新型電容器推動了電動汽車技術的發展
- 讓資料庫不再成為業務發展瓶頸——分散式資料庫架構設計資料庫分散式架構
- 分散式資料庫分散式資料庫
- 分散式OLTP資料庫發展趨勢(一):徹底去中心化分散式資料庫中心化
- 圖資料庫中的“分散式”和“切圖”資料庫分散式
- 分散式資料庫的定義和特點分散式資料庫
- 圖資料庫中的“分散式”和“資料切分”(切圖)資料庫分散式
- 從Gartner報告,看中國資料庫崛起資料庫
- 真正硬核分散式資料庫:開發分散式SQL資料庫的6種技術挑戰 - YugaByte分散式資料庫SQL
- 從美英韓看全球大資料發展的新動向與新趨勢大資料
- 對話ACE第四期:分散式資料庫未來發展的挑戰和機遇分散式資料庫
- 分散式資料庫概述分散式資料庫
- Greenplum資料庫,分散式資料庫,大資料資料庫分散式大資料
- 分散式發電分散式
- 分散式資料庫 ZNBase 的分散式計劃生成分散式資料庫
- DistSQL 深度解析:打造動態化的分散式資料庫SQL分散式資料庫