2021星環科技春季新品釋出會側記

魚論發表於2022-06-21

2014年末,老魚聽說有家初創公司,名為星環科技(以下簡稱:星環),放言要做“大資料時代的Oracle”,口氣不小,是噱頭還是真有實力?帶著這些疑問,在2015年的DTCC大會上,老魚採訪了其創始人孫元浩。“這是個幹實事的人”,當時在這篇採訪文章下的一條使用者評論,讓老魚至今印象深刻。

2021星環科技春季新品釋出會側記

隨後的星環成長之快,如一路開掛,2016年被Gartner評為全球最具有前瞻性的資料倉儲及資料管理解決方案廠商,2017年被IDC評為中國大資料市場領導者,2018年,成為12年來全球首個完成TPC-DS測試並通過官方審計的資料庫廠商。

截止目前,星環已完成D2輪融資,累計完成融資總額約15億元人民幣。

去年底,星環已與中金公司簽署上市輔導協議,擬科創板掛牌上市。

因此,3月24日,星環春季新品線上釋出會就尤為引人關注。因為新品釋出會是瞭解該公司過去一年成果的重要途徑。當然,作為媒體人,老魚其實更關注這些新產品背後基於使用者推動實現的一系列突破與創新,以及經過多輪融資之後,星環是否還能堅守初心。

此次釋出會上,星環釋出了眾多全新產品版本,主要包括TDC 2.4、TDH 8.0、Sophon 2.7、TDS 2.2、ArgoDB 3.0、KunDB 2.0等。

近三個小時的釋出會,釋出的新品之多、資訊密度之大、技術性之強,著實不太好消化。但換個角度看,或許就容易的多。

從產品體系看,星環產品家族由四大品類組成:

2021星環科技春季新品釋出會側記

從上圖可以看出,分別有資料雲、大資料基礎平臺、資料開發與智慧分析、分散式資料庫。

一、大資料基礎平臺

星環的代表產品是TDH(Transwarp Data Hub):容器化的一站式大資料綜合平臺。

放在第一個說,是因為TDH是星環最早誕生的產品,也是基礎產品,星環其它所有品類產品都是圍繞這個產品展開增強。

眾所周知,TDH最初基於Hadoop,但星環最終放棄了Hahoop技術路線,進行了重構,而完成重構,星環用了6年。

孫元浩告訴老魚,Hadoop是十幾年前的技術,現在已經跟不上硬體的發展,其次,星環一直試圖將Hadoop做到極致,但在高效能高併發的情況下,總是碰到問題無法突破,這是由Hadoop自身架構決定的,因此,與其改來改去還不如重寫。另外,星環要做到世界領先,需要更多的突破與創新。

2021星環科技春季新品釋出會側記

從上圖可以很清楚的看到,TDH技術架構由“藍”變“綠”的變化,從基於Hadoop到超越Hadoop,再到完成自主重構。如今“綠”色的部分越來越多,這意味著星環產品中自主原創的技術越來越多,背後所體現的是星環科技原創領先性研發戰略。

此次釋出的TDH 8.0,從技術架構圖上看,最明顯的變化是儲存層,星環對儲存引擎進行了擴充套件,支援8種儲存引擎(去年是4種)、10種儲存模型,幾乎涵蓋了所有的主流資料模型,將多模資料平臺發揮到極致。

這樣做的好處在於,使用者不再需要維護多個資料庫,一個平臺就能解決所有資料型別,大大降低了使用者運維及開發成本。

據孫元浩介紹,每個儲存引擎,星環都進行了優化和功能增加,尤其是圖資料庫進化比較大,內建了不少分析演算法。

另外,TDH8.0對檔案系統TDFS進行了重構,能支援大規模資料量,並且可以完全分散式。

二、分散式資料庫

根據去年的資訊,星環分散式資料庫在國內的裝機量已經在10萬+級別,今年,老魚還沒拿到最新資料,但肯定資料會增加。

OLAP(分析型資料庫)

分析型資料庫,星環有兩款產品,分別是Inceptor和ArgoDB。

Inceptor是基於Hadoop打造的分析資料庫,ArgoDB則是專為新一代硬體快閃記憶體(傲騰)打造,完全自研的高效能分析型資料庫,目標是替換MPP資料庫。

二者區別在於,Inceptor用於離線處理、資料倉儲業務場景。而ArgoDB則能夠滿足資料倉儲、資料集市混合業務場景。

2018年,星環通關TPC-DS測試,Inceptor是第一個通過的,ArgoDB在效能測試中也取得了亮眼成績。

此次釋出的ArgoDB 3.0,相較於 2.0版本,效能提升5倍以上。同時,ArgoDB3.0採用和TDH8.0一致的技術架構,更好地滿足了資料多模、聯邦計算的需求。

另外與競品不同,星環大部分工程師出自英特爾,因此對於硬體和底層系統軟體有較為深刻的理解,在充分發揮新硬體效能上有著自己獨特的優勢。

OLTP(交易型資料庫)

KunDB是一款純分散式的交易型資料庫,雖然起步較晚,但卻是星環投入重點。

交易型資料庫關鍵技術分散式事務,KunDB提供了全域性事務管理器分配事務ID,通過二階段提交保證事務的原子性,基於事務ID管理可見性範圍,提供了隔離級別,加上redolog和undolog保證永續性,從而確保了全域性事務的ACID屬性。

在信通院組織的金融核心交易效能測試中,KunDB通過了效能測試和高可用測試。

KunDB支援雲上部署,支援跨CPU架構混合部署和線上升級,還有資源隔離、彈性排程等雲技術的深度融合,提供基於雲的多租戶方案。除此之外,KunDB還提供了開發工具鏈和運維工具鏈。

據介紹,目前KunDB已在中石油銷售公司、上海市大資料中心、鄭州地鐵、鶴壁市大資料中心等應用。

與1.5版本相比,此次釋出的KunDB2.0在TPC測試中的成績提升了接近兩倍。

目前,星環還提供ArgoDB與KunDB的整體解決方案,同時提供了TP和AP兩種能力,這是星環的一個殺手鐗。

三、資料開發與智慧分析

資料開發與智慧分析,星環有2款產品:Transwarp Data Studio(TDS一站式資料開發與治理平臺)和Sophon(人工智慧平臺)

此次兩者均有更新:TDS 2.2、Sophon2.7 LTS。

與TDS 1.x 相比,新版本新增了兩個子產品,一個是資料質量管理工具 Governor,用於管理資料從獲取到消亡每個階段裡可能引發的資料質量問題;另一個是資料商城 Transwarp Foresight,它整合了 TDS 的資料服務開發工具 Midgard 和標籤開發工具 StarViewer,為業務人員提供資料資產的檢索、下載、共享的能力,結合著資料血緣幫助資料使用者、開發者和管理者做整體協同,構建其資料運營能力。

除以上提到的四個工具之外,TDS 的子產品還包括:面向資料庫 SQL 程式開發者的桌面整合開發環境 Waterdrop、網頁版的團隊協作的 SQL 開發環境 SQLBook、視覺化的 ETL 開發工具Transporter、資料計算任務的排程平臺 Workflow、資料視覺化工具 Pilot 、資料 API 的開發與管理工具 Midgard以及資料資產管理工具軟體 Catalog。

2021星環科技春季新品釋出會側記

星環AI總監楊一帆表示, Sophon 2.7 LTS,將是Sophon 2.X系列的最後一個長期支援(LTS)版本,提供企業資料、資訊資產和智慧裝置的全鏈路AI方案,覆蓋AI模型和資料全生命週期,支援從資料匯入、資料探索、資料預處理、特徵工程、模型訓練、效能驗證、模型部署、模型管理的全流程,實現AI建模的全生命週期管理。

Sophon 2.7 LTS帶來了三大子產品線,分別是資料科學平臺Sophon Base 2.7 LTS、知識圖譜Sophon KG 2.7 LTS,以及邊緣計算平臺 Sophon Edge 2.7 LTS。作為LTS版本, Sophon2.7三大產品線在效能、功能、可靠性上都有大幅提升或增強。

據介紹,新版本的分散式演算法相較開源有成倍的提升,而優化的模型API,響應時間較上一版本提升5~50倍,吞吐量提升35~160倍。

四、資料雲

資料雲TDC(Transwarp Data Cloud),也有說是資料中臺,包含資料倉儲、資料資產管理等一整套工具,是星環這幾年大力佈局的方向。

Snowflake上市之後,“Data Cloud”這詞就火了,但其實早在2018年,星環就已經率先提出“資料雲”的概念,併發布了TDC 1.0版本。因此,星環可以說是國內最早推出資料雲產品和解決方案的企業。

TDC主要面向企業私有化場景,以資料為中心,打通了資料 PaaS、分析 PaaS、應用 PaaS 三類 PaaS 能力,底層統一基於容器雲平臺構建。

此次釋出會上,星環釋出了TDC 2.4版本,擁有5個核心特性:1、支援多種業務型別的工作負載。2、雲原生排程實現資料與計算區域性性3、分散式計算執行單元場景化擴縮容。4、支援GPU 多租戶共享排程。5、支援異構 CPU 和作業系統混合部署。

寫在最後

很多人可能並不清楚,星環(Transwarp)這家公司的初心其實就蘊含在其公司及產品名字中。

Transwarp是所有科幻小說中是最快的一種引擎,超過曲速引擎,公司取名Transwarp,背後代表的是星環第一層初心,打造一個超高速大資料引擎。星環的第二層初心則是希望打造一個Data Hub(大資料平臺)實現多種模型資料的超高速處理。

很顯然,從此次新品釋出會來看,星環基本做到了。

曾經老魚也困惑,星環到底是家怎樣的公司?資料庫公司?大資料公司?還是人工智慧公司?

從此次釋出會來看,老魚覺得,說星環是一家資料處理工具公司似乎更恰當,因為它幾乎把與資料相關的平臺及工具全部都做了。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70018962/viewspace-2901941/,如需轉載,請註明出處,否則將追究法律責任。

相關文章