牛!阿里資料庫掌門人李飛飛獲選ACM傑出科學家

阿里技術_發表於2018-11-09

11月8日,美國計算機協會(ACM)公佈2018年度的傑出科學家名單,全球資料庫領域領軍人物、達摩院資料庫首席科學家、阿里巴巴資料庫事業部負責人李飛飛教授入選。

 

ACM是國際上歷史最悠久、規模最大、最權威的計算機專業學會,著名的圖靈獎即由該組織評定頒佈。ACM傑出科學家必須是對計算機領域做出重大成就和影響的研究人員。


640?wx_fmt=jpeg

美國計算機協會傑出科學家

達摩院資料庫首席科學家李飛飛

 

此次獲得ACM殊榮的達摩院科學家李飛飛,與史丹佛大學的著名人工智慧學者李飛飛同名,但這位“男版”李飛飛在計算機領域取得成就卻毫不遜色。

 

此前,作為美國猶他大學計算機系的終身正教授、世界級的資料庫系統專家,他曾屢次獲得電氣和電子工程師協會( IEEE)與ACM資料庫領域的最具影響力論文獎。

 

2018年,李飛飛教授放棄多家跨國公司和知名高校的工作邀請,正式加入阿里巴巴達摩院,帶領團隊投入到具有自主智慧財產權的研究當中,包括新一代分散式資料庫、非結構化資料管理、資料安全、智慧化資料庫等關鍵技術,並致力於將中國資料庫技術水平提升至國際前沿,打破寡頭企業對資料庫核心技術的壟斷。

 

此次ACM向其頒發傑出科學家,也是對達摩院研究水平和成果的認可。

 

目前,李飛飛教授帶領的阿里巴巴資料庫事業部所研發的新一代分散式資料庫系統,支撐了阿里巴巴集團的複雜業務、海量資料和雙11交易洪峰的挑戰,已經被應用於多個城市的智慧城市交通網路管理,實現城市內數千萬智慧終端資料的瞬間調取與分析。此外,中國氣象的國家氣象大資料分析平臺也應用其技術,實現了毫秒級的氣象資料查詢與分析,該資料庫儲存了1957年建站以來,6萬多氣象站的分鐘級資料。


資料對於數字經濟社會的價值不言而喻,近年來,阿里巴巴達摩院孵化出了世界級的資料庫技術。阿里巴巴CTO、達摩院院長張建鋒曾表示,阿里巴巴數字經濟體已經沉澱了海量的應用資料。為更好地挖掘、利用海量資料的價值,阿里已經構建了世界級的基礎設施,並展開了一系列自主創新。



附:李飛飛老師專訪


Q:恭喜飛飛老師獲得ACM傑出科學家大獎。許多人很好奇,作為學術圈大神級別的人物,您為什麼會選擇從學術界轉向工業界?又為何獨獨看中了阿里?


資料庫系統是核心基礎軟體系統之一,隨著硬體技術的快速發展,上層應用的不斷演進,和資料量以及資料形態的爆發式增長,系統方向的研發越來越需要大規模的叢集部署,海量資料下的高併發高可用測試,和複雜的業務邏輯來驗證,迭代,和推進。工業界在這些方向處在戰鬥的最前沿,有第一手和第一線的挑戰和場景,阿里豐富的業務場景和雙11這樣的技術挑戰,以及對核心基礎技術的堅定投入是阿里最吸引我的地方。 


Q: 雙11即將到來,在您看來,從學術上的“讀書”到企業中的“讀人”,帶領團隊從學術前沿走向工程技術(雙11)的巔峰,有什麼不一樣的地方?


學術前沿科研挑戰的是單兵作戰和尖刀連突破的能力,大規模系統的工程技術攻關考驗的是集團作戰規劃和衝鋒的能力,取得最後的勝利一定需要兩者有機的結合。”讀書”和”讀人”有共同的地方也有不同的地方,讀書和讀人都需要用心去體會,而書的內容是固定的,需要讀的人去結合實踐情況消化理解並靈活應用;人的狀態和心裡是不斷動態變化的,需要讀的人去不停的交流,溝通,和配合。


Q: 阿里非常注重與學術界的合作,近些年在產學研生態圈也動作頻頻,後續達摩院實驗室與高校計劃在哪些方向擴充合作?您如何在學術和產業之間尋找平衡點?


小到資料庫系統,大到計算機產業都是一個應用性非常強的領域,同時又是一個有很深的基礎科學問題挑戰的領域,這就決定了核心技術的攻關和突破一定是需要產業界和學術界形成良性的互動和互補。達摩院實驗室從成立之初就積極擴充與高校和科研院所的合作,從青橙獎的設立到推廣AIR計劃到建立聯合實驗室到接待訪問學者計劃,阿里巴巴達摩院在推進產學研合作方向是不遺餘力的,為中國的計算機科研事業添磚加瓦,貢獻一份力量。學術和產業之間的平衡點在於如何有效的將產業界的應用和系統裡面的核心挑戰問題抽象化,然後如何讓科研解決方案與系統和實際應用有機整合並落地,這個是一個需要因地制宜的過程。


Q: 如今雲端計算企業“跨界”資料庫已不是新鮮事,未來阿里資料庫產品主要會往哪些技術方向探索?


雲資料庫是一個快速發展的市場,吸引客戶上雲的一個核心路徑就是雲端資料庫系統。相比較於傳統的資料庫系統,雲資料庫系統對高可用,服務水平協議,相容性,彈性計算和彈性縮擴容,資料庫管理工具,計算儲存分離,及資料庫安全(例如加密資料庫以及資料隱私保護查詢技術)都提出了新的挑戰。


除此之外,儲存計算資源和資料庫例項的智慧化排程,以及智慧化管控也是雲端資料庫需要探索和突破的方向。


Q: 從實際應用考慮,阿里所面對的龐大資料量和複雜的業務場景是很多企業級使用者無法觸及的。針對非極端場景的應用條件,阿里資料庫有哪些優化?


阿里巴巴資料庫系統除了在為了應對電商應用在高併發、高可用、分散式等核心技術點上進行了突破,也針對常態化應用所需要的簡單易用,高效可靠,以及相容性上做了很多工作,比如軟硬體一體化設計,儲存計算分離等。除了支撐雙11這種極端技術挑戰的企業級分散式資料庫系統X-DB之外,阿里巴巴資料庫產品也包括了像POLARDB這樣的雲原生資料庫系統,其特點就是高效可靠以及高度相容現有資料庫生態系統。


Q:在今年的SIGMOD 2018上,“機器學習/機器智慧與資料庫的結合”成了最熱門的主題之一。在您看來,未來資料庫和機器智慧/機器學習技術將如何相互滲透?


智慧化資料庫核心和智慧化資料庫管控運維平臺一定是下一代資料庫系統核心競爭力的主力戰場之一。隨著資料庫系統設計向精細化和複雜化演進,使用者資料的不斷增長和使用者工作負載的多樣化變化,傳統依賴於基本統計學原理和簡單成本模型的資料庫核心優化技術已經不能高效的適應於這些高緯度的調優挑戰。


同時,隨著上層業務邏輯和應用的複雜化以及應用規模的成倍增長,資料庫例項數不斷增加,系統引數不斷增長,資料庫系統的運維管控和監控越來越需要智慧化和自動化。機器學習技術的迅猛發展為解決這兩類問題提供了有力的武器,結合DBA的領域知識和經驗,以及資料庫系統的執行資料,機器學習/機器智慧技術可以有效進行有監督或無監督的學習和建模,從而實現智慧化的資料庫核心以及智慧化的自治資料庫運維平臺。


Q:每次見到飛飛老師,都能感受到滿滿的陽光和熱情。我非常好奇,在工作研究之餘,您有哪些興趣愛好,讓您一直這樣充滿活力和激情?


在美國的時候,我在鹽湖城,地處高原,四面環山,周圍有許多美國的國家公園例如黃石公園,拱門公園等。我平常非常喜歡爬山,跑步,和野外徒步,特別是在那種原生的沒有人為營造或修建的自然環境裡面探險。


我也喜歡讀歷史書和時政,歷史和政治永遠是一對孿生雙胞胎。


Q:感謝飛飛老師接受採訪,再次恭喜您,也祝老師和團隊再攀資料庫技術新顛峰!


非常感謝,也希望以後和大家多交流、探討,一起推動中國資料庫技術進步。



640?wx_fmt=gif

你可能還喜歡

點選下方圖片即可閱讀


640?wx_fmt=jpeg

阿里基礎架構如何扛住全球最猛的流量洪峰?


640?wx_fmt=jpeg

阿里資料庫十年變遷

那些你不知道的二三事


640?wx_fmt=jpeg

雙11大隊長霜波:

從手忙腳亂到胸有成竹,我們如何走過這十年?


640?wx_fmt=jpeg

關注「阿里技術」

把握前沿技術脈搏

相關文章