深勢科技張林峰:平臺化科研入口雛形初現,玻爾賦能未來教育科研

ScienceAI發表於2025-02-19

圖片

近日,機器之心旗下ScienceAI以瞭解深勢科技旗下AI加持的先進工具玻爾空間站(Bohrium)為契機,對深勢科技創始人兼首席科學家、北京科學智慧研究院院長張林峰進行了專訪。

作為AI for Science領域的先行探索者,張林峰在採訪中與我們深入探討了AI for Science的內涵與發展趨勢,玻爾空間站在教育、科研與產業融合中的角色,以及如何透過技術創新解決傳統科研中的痛點。他還分享了玻爾空間站在未來科研生態中的願景,以及如何透過平臺化的方式推動科研正規化的變革。

張林峰表示,AI for Science不僅僅是將AI作為工具應用於一個個具體科研問題,更是透過AI技術推動科研正規化的根本性變革。玻爾空間站作為這一變革的載體,正在逐步成為科研人員平臺化研發的入口,幫助科學家們更高效地進行跨學科研究,縮短從創新演算法到應用落地的週期。

Q:如何定義和看待「AI for Science」?玻爾平臺在教育科研和產業融合中的角色是什麼?

張林峰:

AI for Science中文直接翻譯過來是人工智慧賦能或人工智慧驅動的科學研究,因為英文表述更簡便,所以AI for Science這個詞在中文世界也已被廣泛採用。

關於AI for Science這個領域,我認為它的內涵和外延都還在不斷擴充,人們對它的理解也不斷加深。首先,最直觀的是把AI作為一個工具,運用AI技術去解決科學研究或者更廣義的研發類問題。

早在2018年的時候,AI for Science這一概念就由中科院院士鄂維南首次提出,當時ChatGPT還沒有誕生,距離谷歌提出Transformer也才僅僅一年。到現在,AI for Science已經應用到越來越多的科研和工業場景,而人們對AI的理解也已經和之前非常不一樣了;某種程度上,現階段AI的發展正在迎來新一輪爆發期,而AI for Science則處在一個深水區、蓄勢待發。

玻爾(指Bohrium®)是怎麼來的?這跟我們自己的發展歷史有關。2017、2018年我們的團隊完成了一系列演算法上的突破,接著2020年我們獲得戈登貝爾獎等榮譽。在這樣的背景下,我們決心創辦一家源自中國引領世界的科技公司。但是,從普林斯頓大學回國直接選擇創業的我和早期團隊遇到的第一個問題便是,AI for Science的人才和算力等基礎設施都非常不ready------人需要「原生交叉」、問題導向,遇山開山、遇水劈水;算力等基礎設施需要「原生融合」,但實際情況不容樂觀。

玻爾是在解決這個問題的過程中誕生的。從早年帶著一大幫實習生幹、到逐漸系統化,整個過程裡培養人學中乾乾中學、定義問題解決問題,以及從演算法研發到工程化產品化,從而解決更多問題的同時,結合場景新需求與技術新進展定義新問題。這個迴圈過程中遇到的瓶頸點我們都應對了一輪又一輪,進而沉澱了頗為紮實的支撐平臺。同時我們發現,這也正是整個教育科研體系的需求。這樣逐漸地就形成我們現在的玻爾Bohrium平臺產品。

當下,玻爾平臺在教育方面形成了「學-練-考-賽」的人才培養模式,即不僅需要傳統的學習(學),還需要大量的動手實戰(練),基於實踐的考試(考)和基於學界和業界真問題的比賽(賽),在中學AI教育、大學數智人才培養方面都快速地取得了一系列成果;在科研方面,玻爾平臺以學術搜尋推薦為入口,打通了文獻-計算-實驗三者,以及從研發到APP應用落地的鏈條。玻爾在推動科研要素走向雲平臺化,我們也希望它能逐漸成為未來「雲研發的入口」。

我們期待玻爾平臺上產生出一系列交叉碰撞的研發成果,培養出一系列「AI原生」的交叉人才。某種程度上,我已經很難定義自己的背景是數學、物理、計算機,還是化學、材料了,也很難說一個演算法是「有創新點的」還是隻是數學上的偷換概念或者工程上的奇技淫巧,這在一些「人才認定」或者文章投稿的時候容易被拒絕。但我很清楚,接下來整個科研和工業版圖上有著巨大的機會空間和巨多的問題等著我們這代人解決。解決這些問題的過程中,學科的邊界會被打破,過去的產學研體系也將被重構。

Q:「雲研發入口」的構想具體是什麼樣的?如何服務於科學研究和工業應用的全流程?

張林峰:

鄂院士提出「AI for Science」的時候便指出,其最大的機遇在於推動科研正規化的變革。這種變革可以理解為從「小作坊模式」向「安卓模式」轉變。在「安卓模式」下,許多基礎設施問題可以被作業系統更好地統籌,從而更好地服務於各類應用。

面向未來的科研基礎設施要素是什麼?盤算下來主要包含:創新的模型演算法軟體,自動化智慧化的實驗儀器裝置,替代文獻的知識庫和資料庫,以及高度整合的算力。2023年鄂院士提出了「四梁N柱」的架構,把這四者的融合作為平臺化的基礎,而面向各個垂直應用場景定義了「N柱」。

整個系統串起來的時候,你可以直觀想象這樣的畫面:我們有一個AI基礎大模型,在模型的驅動下,科學家用它讀文獻產生想法,做一系列設計(模擬設計、生成式設計等),然後輔助進行相關的實驗合成、驗證、測試,並且基於實驗結果進行反饋,進一步迭代式、閉環式地進行科學研究。未來科學家們很大的比例會採用這樣的模式做科研,因為只有這樣才能真正打通理論、計算、與實驗;打通產學研;也打破學科領域之間的壁壘。

當有越來越多科研這樣進行的時候,「四梁」涉及到的公共科研生產力要素便自然需要走向「平臺化」。計算機、網際網路和AI的技術發展驗證了這點,而這樣的正規化正在輻射到絕大多數的學科領域。從文獻和更廣義的學術內容,到每個基礎設施模組的接入、排程、適配、最佳化以及研發形成的各類工作流、解決方案、資料資產和實體IP,再到沉澱成新的paper、APP工具等等,一個平臺化的體系會提升從創新到落地各個環節的效能。

現在的玻爾平臺上,有像單斌這樣的老師上架他的《計算材料學》課程,上面有對相關理論演算法和應用案例的細緻講解,更有豐富的notebook實訓案例,數千學生學習、廣受歡迎;有多個系列的比賽,包括我們主打的AI4S Cup,將各領域真實場景的問題轉化為可以即時給出評估反饋的賽題、直接發榜,這不光逐漸吸引了很多企業參與直接命題,更是成為了中學生AI奧林匹克競賽的承辦平臺;有將演算法快速轉化為最小可用產品的APP開發平臺,吸引很多課題組入駐開發,也吸引像深度原理這樣的AI for Science初創企業快速打磨迭代自己的產品,而我們自己面向工業場景的產品解決方案,例如針對電池設計自動化(Battery Design Automation,BDA)需求打造的產品Piloteye,就是這樣的APP經持續最佳化組合而來的。

最近,由玻爾空間站託管的北京科學智慧研究院和深勢科技共同打造的全新AI搜尋、管理、閱讀一站式產品Science Navigator也將迎來重大升級,歡迎大家關注。此外,我們的自動化智慧化實驗室產品Uni-Lab也開始上線迭代。很快,玻爾空間站上便會實現一系列的AI agents,從學術內容搜尋推薦管理的paper agents,到實驗乾溼閉環迭代的research agents,「雲上研發入口」的雛形到此也將基本完備。

回到最開始的問題,「如何服務於科學研究和工業應用的全流程」?以前我們常說科研體系的一大痛點在於「(問題)從paper中來、(解決方案)到paper中去」。而在玻爾空間站,我們將以平臺化的方式實現「問題(以AI4S Cup等形式)從真實場景需求中來,解決方案(以APP等形式)到實際應用中去」。當越來越多玻爾使用者不因他們的文章引用次數,而因他們解決問題的個數、APP被別人使用的次數、課程培養的學生人數得到更多認可時,新正規化便實現了。

Q:玻爾如何解決傳統科研中的痛點,體現在哪些方面?

張林峰:

我認為主要存在三個主要方面。

第一,是解決「小作坊模式」的痛點

「小作坊模式」是什麼呢?本質是科研團隊在缺乏基礎設施支援時,被迫全流程自主完成所有環節的「啥都自己幹」模式。以很多化學、材料場景的科研人員為例,在實驗室建設初期,往往需要親自參與計算叢集採購、實驗裝置選型乃至機房環境搭建等基礎工作。這個過程不僅涉及諸多技術和非技術的細節,更伴隨著漫長的籌備週期和顯著的資源利用率波動。此外,各「小作坊」之間越來越難以進行有效的通訊,在科研成果大爆炸的當下,科研人員很難真正瞭解所有的前沿進展、「站在巨人的肩膀上」。很多時候,「沒引用」不是因為不小心,而是因為不知道。

隨著研究深入,快速變化的領域進展等進一步放大了這種模式的弊端。例如對於AI、生物資訊學等很多領域,研究人員需要持續跟進快速迭代的開源方法。例如某個基於R語言開發的新型演算法工具、某個只能跑在特定版本機器學習框架上的AI模型等,其部署往往需要特定版本的程式設計環境、依賴庫支援,甚至涉及與計算中心進行資源協調。這種技術適配過程既耗時又存在相容性風險。

更深層次的挑戰在於科研動態發展中的資源管理困境。例如,當課題推進到關鍵階段時,常會發現現有平臺缺失必要的分析工具或算力儲備,迫使團隊重新進入採購論證或系統重建流程。這種反覆不僅導致科研人員要將大量精力投入技術運維,更使得研究生不得不轉型為「全棧型」人才------他們既要掌握領域專業知識,又要具備伺服器維護、程式碼除錯等跨領域技能。少數同學因此成為了「科研多面手」,但更多情況是陷在不專業帶來的泥潭的同時,嚴重分散了科研專注力。

第二,是科研效能的問題。

這個問題最顯著的體現是在學科交叉需求大的時候。有很多技術的組合碰撞完全是「四兩撥千斤」的。真正制約科研效能提升的是學科間的語言體系的不通暢和基礎設施的不健全,而非是問題本身有多難。

舉個例子,影像處理領域中的SAM (Segment Anything Model)的影像分割模型,其實很適合材料領域顆粒物識別與表徵分析。看到它的時候我立馬轉給了北大的一位材料學院的合作老師,興奮地說:「我們想做的事情門檻變得低很多了!」但是,模型的很多技術細節並非一下就能對另一個領域的專家講清楚的,好在有玻爾平臺。

我讓一位正好學習AI技術的同學在玻爾平臺上部署了SAM,寫了一個簡要介紹原理的Bohrium Notebook。但與SAM原來案例不同的是,我們換上了這位老師的圖片、介觀顆粒物的圖片、和原子級表徵的電鏡圖片,做了三個例子。我們明顯可以看到,模型效果在這三個例子中分別是「非常好」、「還湊合」、「不太行」,我把這個notebook發給材料方向的老師,他一下就get到了這個模型能做什麼,在介觀影像上該如何改進,在原子級表徵上我們如何從頭設計演算法。

我想強調的是,人們對新技術往往會有兩種極端反應,「啥都能幹」和「啥都幹不了」------不同領域之間對互相的進展也容易有這樣的態度。我們真正需要一個平臺做的,可能並不是把所有技術細節都呈現出來,而是讓人先獲得「手感」,從而對新技術解決自己關心的問題的深淺和程度有一個粗略的判斷。基於這個判斷,才能針對自己的問題逐層深入。在此基礎上,一個好的平臺還可以在這個逐層深入的過程中提供相應的工具和教材。

第三,到最後,「生產力」的發展會推動「生產關係」的變革。

AI for Science不止是關於AI怎麼應用到一個個具體科研問題中,更是關於科研本身該怎麼做,即科研共同體的協作介面是怎樣的;以及科研怎麼評價,即激勵反饋體系的設計。不誇張地說,可能90%以上的學術發表都已經不再起到過去科學共同體希望起到的作用了。強繫結於「文章發表」以及國內強繫結於「帽子」的科研評價體系,已經逐漸成為傳統科研最大的痛點。正如前面說到的,我們希望玻爾平臺能為此提供新的思路,讓科研不再只是「從paper中來到paper中去」。

我們還可以從另外一個角度看這個問題。回顧歷史,從創新到應用的週期可能需要二三十年,而在當下,這一週期可能縮短至三五年,甚至在不遠的未來會進一步縮短。

在二三十年的週期中,我們無法立即判斷所有創新成果的實際效用,直接追問其是否有用並不公平,這也是同行評審驅動的學術發表體系很大程度發揮作用的地方;然而,三五年的週期則截然不同。這意味著對於一個博士生而言其入學時的研究選題在畢業時很可能已經過時;這意味著一個畫餅的方向可能更快地就會被打臉;這意味著一個文章從投稿完到被接收如果過個一年半載可能就徹底過時了;這可能還意味著我們需要提出一個更本質的問題:如何評價和評估創新成果?隨著時間尺度的顯著縮短,評價機制也需要相應調整。

我認為在接下來的三到五年內,科學共同體將面臨深刻的反思與挑戰。這是評價體系的核心問題。其次,創新的想法如何從概念到應用落地,甚至整合到一系列解決方案中,即整個落地的流程,將成為關鍵。這些變化將深刻影響科學研究的未來發展方向。我期待到時候的玻爾能符合新時代的需求。

Q:平臺是怎樣盈利的?

張林峰:

未來的平臺將分為兩大類:一類是雲上開放平臺,另一類則是私有化平臺。

雲上開放平臺具有「To C」的屬性,內容和工具的訂閱將成為主流模式。這種模式可以類比於當前的SaaS模式,但更側重於科研領域——不止算力在雲上,實驗儀器裝置也在雲上。目前,已有數百個課題組入駐我們的平臺,並在上面開展科研工作。就私有化平臺而言,越來越多的院系從教學到科研的各個環節也都在採用我們的整體解決方案。例如,最近與武漢大學的合作中,我們的平臺支撐了其數智教育的全流程,包括教學、考核等各個環節。這種平臺化的支撐正在成為未來教育與科研的重要趨勢。從去年到今年,我們雲上很快就會超過百萬科研使用者,同時這樣的模式正在迅速推廣至各個高校院系和研究機構。

我們可以看到,一個連線科研生產要素與人的網路正在逐步形成。這種網路的發展是自下而上(bottom-up)和自上而下(top-down)共同推動的結果。自下而上,各個課題組以及喜愛我們產品的學生不斷反饋和最佳化使用體驗;自上而下,整個大環境對這一方向的重視以及各個領域、學科對AI技術實踐的需求,為我們的產品提供了強大的發展動力。

我相信,今年會是AI推動高校院系平臺化教育科研變革的關鍵時期,希望玻爾能夠充分助力。與此同時,我們針對物質科學和生命科學的工業研發平臺,也脫胎於玻爾的框架,相應的業務也正逐漸實現正向迴圈。打造新一代工業研發平臺、系統全面地助力實體經濟的發展,是我們希望做到的事情。

Q:玻爾這個專案接下來具體會往哪些領域發展?

張林峰:

未來一年,我們希望從學生、老師、個人到課題組,再到高校院系,實現玻爾空間站的廣泛覆蓋,並有效連線圖書館、計算中心和實驗中心等資源。透過這些努力,我們期待能夠獲得更廣泛的認可,使玻爾空間站成為受歡迎的平臺化研發入口。

與此同時,教育部辦公廳印發《教育部辦公廳關於加強中小學人工智慧教育的通知》,明確提出探索中小學人工智慧教育實施途徑,加強中小學人工智慧教育。玻爾空間站已經為此實現了良好的基礎。近期,我們就與北京第十一中學展開了圍繞中學AI教育的合作。未來,深勢科技將和眾多中學圍繞人工智慧課程開發、人工智慧師資建設、人工智慧實訓平臺等三大板塊展開深度探索與合作。深勢科技也會積極響應國家政策,為中學人工智慧教育提供全方位、系統化的解決方案,助力中學高質量開展人工智慧相關課程教育教學工作。

Q. 玻爾這個名字有什麼更深的淵源嗎?

張林峰:

「玻爾」指的是尼爾斯·玻爾(Niels Bohr),他是一位偉大的科學家,1921年獲得諾貝爾物理學獎,是原子物理和量子力學領域的開拓者。此外,玻爾還有兩個特別值得關注的身份:第一,他的名字被用於命名第107號元素「𨨏(Bohrium)」,這是元素週期表上的一種人工合成元素;第二,他在丹麥建立了哥本哈根理論物理研究所,這一機構對量子力學的發展起到了至關重要的推動作用。

哥本哈根理論物理研究所的蓬勃發展,以及它所創造的組織形式和環境,推動了量子力學的誕生與發展。當時,許多推動科學歷史的年輕人,如維爾納·海森堡、沃爾夫岡·泡利、保羅·狄拉克等,都在這一環境中嶄露頭角。他們不僅是一代科學巨匠,更是科學精神的象徵。這種組織形式和學術氛圍,不僅定義了科學家這一角色,也重新引領了對科學家的理解。

玻爾本人不僅是一位傑出的科學家,更是一位能夠定義和引領科學家精神的領袖。這種迴歸初心、追求真理的精神,正是我們在從事科學研究或技術研發時最為珍貴和值得銘記的核心價值。

透過介紹玻爾這個名字及其背後的思考,我想強調的是,無論是科研的生產方式、科研正規化的轉變,還是科學共同體的協作,最終都需要回歸到一個更本質的精神層面追求。這種追求將指引我們走向何方,是我們需要不斷探討的問題。正如玻爾所代表的科學家精神,到2026年,我們有望推動並見證整個科研正規化逐步演變,併成為這一變革中的重要參與者和推動者。

Q:如何吸引志同道合的夥伴加入?

張林峰:

對於一家希望在國內實現從原始創新到落地應用的企業來說,這是一個充滿挑戰的問題。

我們有幸吸引了很多志同道合的夥伴一路走到現在,但一路上也體會到了諸多不易。我們的事業需要吸引非常多不同領域的同學,但每個領域方向的每個階段都有它原來設定下的路徑。我深刻地感受到,我們周圍有著蓬勃的生產力,束縛生產力釋放的不是生產力不足,而是組織形式和協同機制。在此背景下,一路選擇堅持初心是不容易的。最近DeepSeek的進展給了我們很大的鼓舞。

玻爾平臺是我創業前從未預期我們會做的一個產品。某種程度上,因為缺乏真正的國外對標,我們也很難解釋清楚它最後成長為的樣子。但轉念想想,這就是我們在國內推動原創到落地的過程中思考和實踐的沉澱。以AI原生、平臺化的方式打通文獻、計算、實驗,加速科學發現、定義產業未來,這豈不是件很酷的事情?

有時候我在想,我們剛才提到的教育與科研,尤其是高等教育和科研,每年的投入通常佔國家GDP的接近4%。因此,投入的效能問題顯得尤為重要:我們培養什麼樣的人才?解決什麼樣的問題?以及如何服務於重要的需求和產業發展?玻爾可能會為這些問題提供一個方案。我們希望打造好這個平臺,服務教育科研體系,同時自己也在這個平臺的賦能下不斷做出持續創新、落地行業的事情。

於是,如何吸引志同道合的夥伴?一個有趣的判斷標準不是單純的吸引,而是識別------透過雙向的奔赴形成共振。這種共振的標準在於我們內部常用一個口號來界定------「如果你的反應不是退縮,而是激動。」

有這種反應的夥伴,便是我們希望吸引的夥伴。

關於玻爾科研空間站(Bohrium)

玻爾科研空間站(Bohrium)是深勢科技專為科研人員量身打造的「AI for Science」科學研究平臺,致力於為科研人提供一體化、即開即用的線上工作站。

在這裡,科研人員可以使用AI輔助論文搜尋與閱讀,學習AI與材料、化學、生命科學等學科結合的交叉課程,並透過雲端工具進行高效的科學計算與實驗設計。

玻爾空間站不僅是一個技術平臺,更是推動科研正規化變革的重要載體,旨在透過AI技術賦能科學研究,加速從基礎研究到產業應用的轉化。

相關文章