重磅轉會:知名學者、前京東副總裁裴健將加入杜克大學
机器之心發表於2022-05-21
裴健教授是 ACM、IEEE Fellow,也曾任京東集團副總裁。
剛剛,杜克大學官宣了一條訊息:自 2022 年 7 月 1 日起,資料科學領域國際知名學者、加拿大皇家科學學院院士、ACM Fellow、IEEE Fellow 裴健將加入杜克大學任教。據杜克大學報導,裴健將在電腦科學系和生物統計學與生物資訊學系共同任職。在西蒙弗雷澤大學(Simon Fraser University)任教期間,裴健同時加入了大學的電腦科學系、統計與精算系,自 2004 年以來,他一直擔任該校的計算科學教授。裴健專注的研究方向包括資料科學、大資料、資料探勘和資料庫系統等,他的專長是為新型資料密集型應用開發高效資料分析技術,並將其落地到產品和業務實踐中。此前,裴健於 1991 年和 1993 年在上海交通大學電腦科學與工程系獲得學士與碩士學位,並於 2002 年在西蒙弗雷澤大學獲得了計算科學博士學位。裴健是資料探勘、資料庫系統和資訊檢索領域被引用次數最多的作者之一。2000 年,裴健與韓家煒、Yiwen Yin 發表了《Mining frequent patterns without candidate generation》,這篇文章如今已被引用上萬次,也正是這一研究使得裴健成為國際資料探勘界的學術之星。裴健最有影響力的著作的是他在 2011 年與韓家煒編寫的經典教材《Data Mining: Concepts and Techniques》,這也是全世界學習資料探勘的學生的首選教材。裴健領導的研究產生的影響遠遠超出了學術界。例如,他的演算法已被工業生產和流行的開源軟體工具所採用。作為學術領軍人物,裴健也活躍於很多學術組織和活動中。他在 2013-2016 年擔任 IEEE Transactions of Knowledge and Data Engineering(TKDE)主編,2017-2021 年擔任美國計算機協會(ACM)資料知識發現小組 SIGKDD 主席。「資料科學家必須能夠構建具備動態學習能力的程式,並將來自眾多不同應用程式的複雜結果傳遞給相關的人,」裴健表示,「對於資料科學家來說,用人們可以理解的方式將人與資料聯絡起來,為社會做出貢獻、造福社會,這一點很重要。」資料科學領域在過去幾十年中實現了爆炸式增長,與已經受其影響的領域相比,定義它沒有影響的領域變得更加困難。隨著資料探勘和應用人工智慧等先進概念逐漸成為社會各領域的組成部分,確保以公平和公正的方式使用它們變得越來越重要。過去的二十年來,裴健教授一直在各個領域都推進這件事。他的工作涉及空間資料、醫療資料、教育資料、電子商務、生物資訊學、資料市場和社交網路。無論當前的領域現狀和問題是什麼,裴健教授總能看到定義現有技術的機會和發明收集和解析資料的新方法,潛在的合作者可以挖掘新應用的工具和技術是否可以用來解決自身研究領域的問題。他對北卡三角區未來豐富的行業合作資源感到興奮,尤其是蘋果和谷歌等公司即將在該地區開設辦公室。「我在大會和活動中遇到了各種各樣的人,我一直在尋找機會將自己的研究應用於新的挑戰,」裴健表示。「我也經常與專業的研究生一起工作,他們從企業界帶來了新的挑戰,這也提供了與他們的公司合作的機會。」裴健教授的學生並不侷限於專業的研究生,而是涵蓋各年齡段和各類經歷的群體。他經常教授有關資料科學、資料探勘和資料庫基礎知識的本科課程,並擁有眾多博士生,其中 50% 是女性。「我大力提倡教育和培訓的多樣性和公平性,尤其是面對女性以及其他在科學與工程領域代表性不足的群體,」裴健表示,「我們需要更多的平衡,保證整個領域的健康和高效。」除了北卡三角區提供慢跑和山地腳踏車的機會之外,裴健表示,自己被杜克大學吸引是因為杜克大學在資料科學方面的強大研究團隊和跨學科合作的機會。他很高興能與多位頂尖學者一同工作,包括建立可解釋機器學習演算法的領先研究者 Cynthia Rudin,透過杜克 Rhodes Information Initiative 執行眾多資料科學驅動專案的 Robert Calderbank,以及最近成立了 Athena 中心、專注於利用人工智慧和邊緣計算技術以及下一代網路系統以重新構想未來移動裝置的陳怡然教授。「我認為在未來的十年到二十年,變化會比現在發生得更快,動態多功能性將會非常重要。」裴健表示。「資料科學是感知變化、理解動態和增強多功能性的關鍵。杜克大學將在引領研究、教育和社會服務方面發揮越來越重要的作用,我很高興能成為其中的一員。」在訊息官宣之後,裴健教授第一時間回答了人們關心的幾個問題,他表示:「我將專注於資料科學的基礎理論、技術與方法及在醫療、環境和社會科學等重點領域的應用,透過和相關同事的合作,發揮自己的作用。」以下是裴健教授關於加入杜克大學後的生活及未來研究的展望:機器之心:在 Simon Fraser 大學工作多年後,您為何選擇在這個時間點加入杜克大學?裴健:自從跟隨韓老師讀博士開始我就在 SFU,非常感謝二十年來母校的培養,感謝 SFU 和加拿大很多老師的教導、幫助和支援。杜克提供了非常優秀的研究教學環境,特別是把資料科學與醫學、生物和工程結合方面,有獨到的機會和優勢。我也很希望能發揮自己的所長,在科研教學上更進一步。機器之心:在選擇杜克時,陳怡然老師說他提供了一些幫助?能否介紹下其中的故事?裴健:杜克大學有一大批傑出教授,如大家熟知的陳怡然教授和楊俊教授等。包括陳老師、楊老師等在內的很多杜克老師非常熱情誠懇,不論是華人還是非華人教授們都跟我做了很多全面細緻的交流,幫助我認識了杜克大學的優勢和機會。非常感謝他們。我十分期待能和這些世界一流學者一起工作,向他們學習。例如,陳怡然教授是國際雲端智慧研究的領軍人物,他建立的研究中心代表了國際最前沿的水平。我希望能和他的團隊合作,在資料方面添磚加瓦。機器之心:昨天, KDD 2022 的論文接收結果已經公佈,在您看來,最近資料探勘領域有哪些值得關注的研究趨勢?裴健:資料探勘和資料科學發展迅猛,已經成為各方面研發的基本工具之一。今年來,資料科學和資料探勘在端到端資料科學平臺、工具與方法、可信資料科學、以人為本的資料科學、資料科學的協同、端雲結合的資料科學、合作與共贏等方面取得了一系列重要進展,值得緊密關注。機器之心:加入杜克大學後,您將擔任什麼職位,專注於哪些領域的研究?
裴健:非常感謝杜克大學給我提供了一個獨特的三個系的聯合教授的機會。我會同時在計算機系、生物統計與生物資訊學系和電子與計算機工程系任教,橫跨了文理學院、醫學院和工學院。能有機會在這些系招收學生,更有利於我的跨學科綜合研究。我將專注於資料科學的基礎理論、技術與方法及在醫療、環境和社會科學等重點領域的應用,透過和相關同事的合作,發揮自己的作用。機器之心:對於您在杜克的第一批學生,您會有什麼樣的要求?裴健:非常歡迎感興趣的學生隨時與我聯絡,探討考研的機會。我希望學生能有紮實的數理基礎、良好的思維習慣、勤奮好學、對世界萬物、科學原理和多學科研究持有開放的心態和濃郁的好奇心。參考內容:https://ece.duke.edu/about/news/jian-pei-developing-fair-and-transparent-applications-advances-data-science