9月資料庫圈值得關注的事

qing_yun發表於2023-09-28

9月,不少關於資料庫的會議舉辦,為我們呈現了新的產業動態。有資料指出,截止到去年年底,中國資料庫企業在國內市場份額已經達到75%;向量資料庫仍然是焦點,很多資料庫廠商在積極佈局;Databricks獲得新一輪5億美元融資,投後估值達430億美元……

市場動態

資料庫產業發展現狀與趨勢

在第二十五屆中國國際軟體博覽會·中國資料庫產業峰會上,國家工業資訊保安發展研究中心軟體所副所長李衛在演講中總結了我國資料庫產業發展的未來趨勢:

  • 資料庫多點開花,關係型與非關係型齊頭並進

    我國資料庫排行榜關係型資料庫依舊是主流,關係型和非關係型資料庫(如圖資料庫、實時資料庫)領域全面開花。

  • 技術架構持續演進,成就多元混合資料庫時代

    硬體效能提升,網際網路、雲端計算等新興技術持續發展,資料庫從資料模型、架構、開發和部署模式等方面演進出不同的技術路線,實現架構的躍遷。

  • 新時期資料庫行業應用特點鮮明

    國產資料庫在各領域全面應用,逐步從邊緣系統走向核心系統,同時對資料庫的需求又不盡相同。

國產資料庫市場份額達75%

在2023上海外灘大會“分散式資料庫助力數實融合”見解論壇上,中國電子資訊產業發展研究院副院長喬標說,截止到去年年底,中國資料庫企業在國內市場份額已經達到75%,數量超過200家。

中國信通院釋出《開源資料庫生態發展研究報告》

9月21日,在中國信通院舉辦的2023 OSCAR開源產業大會上,《開源資料庫生態發展研究報告》正式對外亮相。該報告針對MySQL資料庫發展現狀、技術創新、產業應用三方面梳理了發展情況,並對我國基於MySQL技術路線的開源資料庫產業進行展望。

隨著資訊化建設的不斷深入及國內開源資料庫技術水平的增強,國內MySQL技術路線開源資料庫從以下五個維度進行技術創新,打造最符合國內使用者需求的開源資料庫。

  • 一是組複製(MGR)技術增強資料一致性;

  • 二是MySQL雙活架構實現資料庫高可用;

  • 三是推動資料庫OLTP、OLAP效能最佳化,突破MySQL效能瓶頸;

  • 四是透過密碼限制增強、級聯許可權回收能力築牢資料安全防線;

  • 五是打造多種資料庫遷移方案助力MySQL上雲。

透過本次調研瞭解到,安全性、開源服務支援穩定性等問題也加大了使用者使用的擔憂。

Databricks 獲 5 億美元上市前融資

9月14日,Databricks 獲得了5億美元I輪成長融資,投後估值為430億美元。本輪融資由 T. Rowe Price Associates 領投,包括一些現有投資者,如 Andreeson Horowitz 等。參與本輪融資的新投資者包括英偉達公司(Nvidia)和 Capital One Ventures。

5 億美元的投資聽起來不少,但這還遠遠稱不上是 Databricks 最大的一輪投資。它的上一輪融資於 2021 年 8 月完成,金額達 16 億美元,而就在那之前六個月的 G 輪融資則帶來了 10 億美元的資金。

Databricks還公佈了一些有關自己的資料。例如,它表示營收已突破 15 億美元,收入同比增長超過 50%。

產品與解決方案

南大通用釋出向量資料庫

9月1日,由天津市工業和資訊化局指導,天津南大通用資料技術股份有限公司承辦的第二十五屆中國國際軟體博覽會·中國資料庫產業峰會在天津順利召開,會上,GBASE南大通用重磅釋出國產向量資料庫GBase Cloud Vector DB,GBase Cloud Vector DB在GBase 8a叢集基礎上實現,可以被廣泛應用於各類 AI 驅動的應用場景,為大模型關鍵技術和極致數字世界而來,代表了當今資料庫技術的最新發展趨勢和成果,向量資料庫的推出,進一步完善了GBASE全棧的資料庫產品矩陣。

Pigsty v2.3.1 釋出

9月4日訊息,Pigsty v2.3.1 釋出,該版本中 PGVECTOR 迎來 v0.5 更新,新增了新的 HNSW 索引支援。也對新發布的 PostgreSQL 16 RC1 提供了支援。此外,官方文件現在提供中文版本,現有文件也進行了豐富與完善。此外,還有例行的軟體版本更新與問題修復。

Apache Doris 2.0.1 & 1.2.7 版本正式釋出

9 月 4 日 ,Apache Doris 2.0.1 和 Apache Doris 1.2.7 這兩個版本正式釋出,這兩個版本由上百名位貢獻者共同努力完成,提供了更多有用的新特性,同時修復了若干已知的問題,進一步提升了系統的效能和穩定性。

滴普科技釋出Deepexi企業大模型產品

9月6日,在2023中國國際服務貿易交易會成果釋出會上,滴普科技釋出了Deepexi企業大模型及落地成果,Deepexi是滴普科技打造的首個企業大模型產品,包含了多個領域模型、基礎模型棧、模型工具鏈三大核心能力。基於FastData,滴普科技在服務企業數字化轉型過程中,積累了豐富的知識語料庫,並以此為基石打造了生產製造、運營管理、財經管控、數字雙碳等多個領域模型以及模型應用。

此外,滴普科技企業服務領域的多模態模型工具鏈已在社群開源,回饋和建設企業服務領域的模型產業落地。

螞蟻集團正式開源萬億規模圖學習系統AGL

9月7日下午,上海外灘大會“融合機器學習與運籌最佳化”論壇上,螞蟻集團正式開源圖學習系統Ant Graph Learning (AGL),這是行業首個通用的工業圖學習系統。 AGL目前實現了萬億規模圖資料上的資訊協同和結構感知,構建了多個行業數字化圖智慧方案,也沉澱了多個優秀的演算法實踐。螞蟻集團基於AGL,發表CCF-A/B類國際期刊會議論文60餘篇,授權發明專利40餘項,五項國際榜單、競賽第一,也是圖神經網路國家標準的核心參與單位。 本次開源AGL v0.1版本,同時提供螞蟻多年打磨的工業級圖學習系統和一系列經過業務實踐驗證的開箱即用的圖學習演算法,程式碼倉庫已於當天上架GitHub。

騰訊雲原生資料庫TDSQL- C Serverless 2.0版釋出

9月7日,在2023騰訊全球數字生態大會雲原生資料庫技術演進與實踐專場上,騰訊雲分享了在該領域的多項前沿探索和核心技術解析,並重磅釋出雲原生資料庫TDSQL- C Serverless 2.0版本。

TDSQL-C採用了創新的“存算分離”架構,具備100%相容MySQL、超百萬QPS效能、多執行緒並行查詢、一體化HTAP、金融級容災等多種核心特性。其Serverless 2.0新版本具有三大核心特性:

  • 提供Serverless混合叢集版,支援只讀節點和Proxy彈效能力。該架構的升級也豐富了Serverless當前的應用場景。

  • 可釋放儲存架構,叢集無訪問時段資料可落冷歸檔,啟動時可瞬時恢復服務,無需等待資料全量恢復。當例項暫停後,資料會歸檔儲存,其儲存成本同比分散式儲存最高可降低80%。

  • 平滑彈性擴容,TDSQL-C還首次做到了縮容場景無慢查詢,實現了真正意義上的彈性擴縮容。

騰訊雲TDSQL融合版釋出

9月7日,在2023騰訊全球數字生態大會騰訊雲資料庫TDSQL技術與實踐專場上,騰訊雲正式釋出TDSQL融合版,該版本整合了之前TDSQL系列產品核心的優勢,並在核心架構、Oracle相容能力、效能、隔離、遷移工具等多個關鍵能力上進行了大幅增強最佳化。

HTAP實現上,TDSQL採取松耦合度行列混存架構,在底層透過多個資料分片將資料表均勻分散在不同的儲存節點中,並透過主從複製的能力實現資料高可用,既保證了線上交易效能,又保證了高速的分析能力,能夠支撐企業超高併發的線上交易型業務。

首個知識圖譜融合大模型平臺推出

9月11日訊息,近日,CCTV報導,由中國工程院院士、清華大學計算機系教授、海致科技首席科學家鄭緯民領銜海致科技與高效能圖計算院士工作站共同開發的首個知識圖譜融合大模型平臺正式釋出。該平臺面向廣大B端使用者,運用知識圖譜這項人工智慧基礎技術,幫助大模型在企業級和工業界應用中克服“幻覺”,實現基於行業與場景的精準推演。目前已經在能源、金融、政務等領域的場景中進行部署和應用,力圖打通通用人工智慧進入B端和工業應用的“最後一公里”。

Bytebase 2.8.0釋出,全新升級的資料脫敏功能

9月14日訊息,Bytebase 2.8.0釋出,全新升級資料脫敏等功能。具體新功能包括:

  • 全新升級的資料脫敏功能,提供更加細化的脫敏·和訪問許可權配置。

  • 全新升級的 SQL 編輯器介面。

  • 庫表同步功能支援 Oracle。

  • 支援設定公告。

微軟與甲骨文擴大合作關係,推出Oracle Database@Azure

甲骨文公司和微軟公司宣佈推出Oracle Database@Azure,讓客戶可以直接訪問在 Oracle 雲基礎設施遠端軟體服務(Oracle Cloud Infrastructure,OCI) 上執行並部署在 Microsoft Azure 資料中心的 Oracle 資料庫服務。Oracle Database@Azure 打造了更簡潔的環境,簡化了 Oracle 資料庫和 Azure 服務之間的採購和管理流程。

從北美和歐洲地區開始,Oracle 將直接在 Microsoft 資料中心內執行和管理這些 OCI 服務。

沃趣科技國產資料庫雲產品釋出

9月15日,在沃趣科技2023國產資料庫雲產品釋出會上,釋出更新了多款沃趣產品,包括:高效能國產資料庫專有云、QData T7高效能資料庫雲平臺、QFusion資料庫私有云、DBMotion、DBTwin等自動化運維工具集。

甲骨文OCW年度峰會推出整合向量資料庫

美國當地時間2023年9月18日,一年一度的Oracle CloudWorld如期在美國拉斯維加斯舉行。

Oracle推出整合向量資料庫,Oracle 宣佈計劃在 Oracle Database 23c 中新增使用 AI 向量的語義搜尋功能。此功能集合稱為 AI Vector Search,其中包括新的向量資料型別、向量索引和向量搜尋 SQL 運算子,使 Oracle 資料庫(Oracle Database)能夠將文件、影像和其他非結構化資料的語義內容儲存為向量,並以此快速執行相似性查詢。這些新功能還支援 Retrieval Augmented Generation (RAG),這是一種創新性的生成式 AI 技術,將大型語言模型 (LLM) 和私有商業資料相結合,以回答自然語言問題。RAG 提供更高的準確性,並透過將私有資料包含在 LLM 培訓資料中來避免洩露私有資料。

Fabarta 產品與使用者大會成功舉辦

9 月 19 日,在Fabarta 首屆產品與使用者大會上,創始人兼 CEO 高雪峰指出,構建面向智慧應用的資料基礎設施,是助力企業實現決策智慧化的關鍵所在。Fabarta 構築了以資料為中心的 AIGC 落地架構正規化,圍繞著資料以及資料之間的關係(圖和向量融合)所代表的企業資料,可以幫助大模型進行推理增強,減少模型的幻覺,實現資料的安全可控,併為其提供長效記憶能力。會上還介紹了公司的一體兩翼產品矩陣,以多模態引擎為基礎,資料與 AI 平臺為雙翼,為企業提供全鏈路支援,助力企業實現決策智慧化”。其多模態智慧引擎 ArcNeural 架構面向雲原生,並同時支援圖與向量的同表管理。

ByConity 0.2.0 版本釋出

9月20日訊息,ByConity 0.2.0 版本正式釋出,新版本提供多項有用的新特性,同時修復了若干已知的問題,進一步提升了系統的效能和穩定性。

  • 冷讀最佳化,包括 IOScheduler 和 Preload 能力

  • 資料湖支援,包括 Hive,Hudi,Multi-Catalog 等支援

  • ELT 長時任務支援,包括非同步執行,佇列,運算元 Spill 等

  • RBAC

亞信科技釋出AntDB 8.0 產品

9月20日,亞信科技釋出AntDB資料庫8.0版本,AntDB資料庫8.0產品實現了兩大特性的重磅升級:“超融合架構”從實驗室走向生產,流式計算升級為“超融合流式實時數倉”。同時,浙江移動、用友、麒麟軟體、華錄高誠、金雲智聯等行業夥伴及業界專家共同探討了國產資料庫發展現狀及未來藍圖。

TimescaleDB 現在也是向量資料庫了

9月25日,時序資料庫廠商Timescale釋出了Timescale Vector,TimescaleDB 正式成為向量資料庫。

TimescaleDB採用了 postgres 的開源向量庫 pgvector。除了採用 pgvector 之外,該公司還透過使用近似近鄰(ANN)演算法增強了向量功能,並聲稱這種演算法的效能比普通 pgvector 和專用向量資料庫都要好得多。

幾個月前,Timescale 向雲客戶推出了向量支援,今天它正式宣佈開始預覽計劃。該公司的向量功能已經吸引了一些早期採用者,其中包括歐洲回收解決方案提供商 PolyPerception。

ClickHouse 宣佈推出 ClickPipes

9月26日,ClickHouse 宣佈推出 ClickPipes,幫助簡化實時分析的資料管道。Clickpipes是Clickhouse雲的一項持續資料攝取服務。它將外部資料來源直接連線到 ClickHouse Cloud,使使用者能夠快速高效地建立資料管道。ClickPipes將與Apache Kakka、亞馬遜MSK和Confluent Cloud整合,並計劃增加更多整合。

在ClickPipes全面上市之前,ClickHouse Cloud已經經歷了一年的發展和擴張。隨著ClickHouse Cloud於2022年10月推出,ClickHouse已成為安全、可擴充套件的無服務雲產品。公司最近宣佈首次推出專有的 SharedMergeTree 表引擎,從而提高了 ClickHouse Cloud 的效能。ClickPipes完全託管的雲產品現已在Google Cloud Platform和AWS上推出。

Confluent 在 Confluent Cloud 上釋出 Apache Flink

9月27日訊息,Confluent公司日前宣佈開放預覽Confluent Cloud上的Apache Flink,這是一項針對流處理的全面託管服務,可讓企業更輕鬆地利用Flink過濾、連線和豐富資料流。此外,Confluent 還發布了資料門戶(Data Portal),以幫助團隊發現組織內的所有實時資料流;釋出了企業叢集(Enterprise Clusters),以降低無伺服器私有網路的 Apache Kafka 成本;並降低了 Confluent Cloud 的儲存成本。

The Others

達夢資料博士後科研工作站正式啟動

9月25日下午,武漢東湖高新區未來科技城,達夢資料成功召開了博士後科研工作站啟動會暨學術專家委員會成立大會。本次大會上,達夢資料博士後科研工作站正式宣佈啟動。研究物件主要包括資料庫領域前沿技術,資料與資訊保安、雲端計算、人工智慧等深度融合技術以及中國資料庫行業創新發展過程中的現實性、前瞻性、戰略性問題。

在大會的致辭中,達夢資料董事長馮裕才強調,達夢博士後科研工作站的設立,對達夢來說是一個新起點。

HTAP Summit 2023:揭秘 Databricks、LinkedIn 等使用者喜愛 TiDB 的幕後故事

9 月 20 日 - 21 日,HTAP Summit 2023 在美國加州計算機歷史博物館成功舉辦,應用開發者、資料庫從業者齊聚一堂,現場分享、體驗前沿 HTAP 技術。

本次大會共計 30 餘個主題分享,嘉賓來自包括 Databricks、Meta、Google、Pinterest、LinkedIn、Bolt、PayPay、Airbnb、Flipkart、Plaid 等公司,分享了他們關於資料庫、人工智慧等領域的前沿探索,以及使用 TiDB 的真實體驗。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69925873/viewspace-2986535/,如需轉載,請註明出處,否則將追究法律責任。

相關文章