SAP HANA設計師:記憶體技術將引領新的計算時代

dicksonjyl560101發表於2015-04-27

【TechTarget中國原創】我們所熟悉的哈索博士(Hasso Plattner)經常被稱為是SAP HANA之父,但在HANA背後其實還有一個人,是他與哈索共同完成了HANA的最初設計,這個人就是亞歷山大.蔡爾(Alexander Zeier)。蔡爾曾在SAP公司和哈索博士研究機構長期任職,在此期間,他還與哈索博士共同出版著名的《記憶體資料管理》一書,被稱為是記憶體資料庫系統的最權威書籍。

SAP HANA設計師

  蔡爾目前的研究方向包括實時資料分析、預測分析以及大資料等。兩個月以前,蔡爾離開了麻省理工客座教授的職位,選擇加入了埃森哲公司,擔任記憶體解決方案的全球總監。TechTarget記者有幸對蔡爾進行了專訪,讓他來談一談對記憶體計算的看法,以及當初在進行HANA設計時的一些軼事。

  蔡爾透露,當初他的工作是與SAP最大的客戶一同搭建HANA裝置:“最早是和哈索博士一起為高露潔公司搭建一個原型系統,他們擁有全球最大的SAP系統之一。在使用HANA之前,連線關係型資料庫進行2.8億個單據處理的速度是20分鐘,而使用HANA之後,我們只用了1.5秒。”

  這個原型系統是在5年之前搭建的,蔡爾表示,現在的HANA系統,95-99%的響應時間都是不到1秒鐘的。

  事實上,這樣的效能改善主要源自於英特爾的技術,他們在不斷改進記憶體與處理器核心之間的資料吞吐速率。蔡爾介紹,當構建第一個HANA系統的時候,那時候的英特爾處理器的最大資料吞吐速度是每秒5-6個GB,而現在已經達到了上百GB的速度。將近20倍的效能提升,意味著HANA在相同的時間裡能夠處理更多的資料,查詢速度將實現質的飛躍。

  蔡爾介紹,HANA還使用了並行程式設計技術來實現多列資料的同時處理,所以隨著處理器核心的不斷新增,HANA還能實現查詢效能的線性提升。每個處理器核心在1毫秒時間內能夠處理的資料是2 MB,考慮到每個硬體配置中的刀鋒伺服器能夠使用80個處理核心,蔡爾相信HANA在未來的擴充套件空間還是非常大的。

  那麼,具備如此強大效能的HANA記憶體裝置,企業該如何使用它來為業務服務呢?蔡爾表示,HANA可以被視為企業業務流程創新的一個基石。人類的思維反應速度是700毫秒,HANA的處理速度基本上可以趕上人類大腦的速度,也就是說基於HANA的應用可以視為是即時的。比如,金融機構可以使用HANA來進行實時的風險預測。

  關於記憶體資料庫的爭論

  目前業界有些聲音認為,像HANA這樣的記憶體資料庫技術只適合一些大型的跨國企業,他們的資料量非常多,當然“錢包也非常鼓”。蔡爾表示並不同意這樣的說法。

  他認為,HANA在資料中心計算層面的成本是相對較低的,現在花10萬美元可以買1TB的記憶體計算能力。另外,關於記憶體資料庫裝置是否是專有的問題,蔡爾表示HANA是開放的。它的硬體架構是基於英特爾x86處理器的,包括思科、IBM、HP等在內的硬體合作伙伴都會為HANA系統提供支援。

  蔡爾介紹,HANA的底層作業系統是SuSE Enterprise 11 Linux。但要改進效能,HANA還涉及了更低階別的程式語言,來對英特爾處理器Level 1、2、3的cache進行最佳化。

  IT技術的未來

  商業計算始於大型機,然後逐漸轉向CS計算。蔡爾認為,記憶體處理將主宰未來的計算時代,如果說SAP R/2代表了主機時代,SAP R/3代表了CS架構時代,那麼未來的R/4就將是由HANA來充當主角。

  從剛剛結束的SAP TechED大會可以看出SAP將主推HANA作為核心企業應用的底層資料庫。蔡爾透露,在2006年最初開發HANA的時候,它就是可以作為單一的資料來源來進行交易和分析系統的處理。

  儘管有段時間,SAP已經將HANA主要定位在商業分析領域(整合SAP 360 CRM),但是可以看到現在已經迴歸最初的定位。也就是說,HANA會是一個支援交易和分析混合負載的記憶體資料庫裝置。

TechTarget中國原創內容,原文連結:

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29829936/viewspace-1605945/,如需轉載,請註明出處,否則將追究法律責任。

相關文章