2022 年底,ChatGPT 席捲全球,讓人們再一次領略到了 AI 的強大與驚豔。

如今,AI 已然成為當今科技界最熱門的話題之一,它不但改變了人們的生活,同時也為科學研究帶來了更多可能,AI for Science(人工智慧驅動的科學研究,亦稱 AI4S)應運而生。

作為一種將“AI”“科研”深度融合的新興科技形態,AI for Science 利用 AI 技術學習、模擬、預測和最佳化自然界和人類社會的各種現象和規律以解決各種科研問題,從而推動科學發現和創新,被稱為“科學研究第五正規化”

國內層面,今年 3 月,科技部聯合自然科學基金委啟動“人工智慧驅動的科學研究”(AI for Science)專項部署工作,佈局“AI for Science”前沿科技研發體系。國際層面,特斯拉執行長 Elon Musk 宣佈成立人工智慧公司 xAI,旨在建立理解自然規律的人工智慧系統;谷歌前執行長 Eric Schmidt 宣佈成立 AI for Science 博後獎學金,目前已佈局 9 所高校;微軟成立科學智慧中心 AI4Science;NVIDIA 聯合 IIT 釋出 AI for Science 公開課程……從國內到全球,從學界到業界,AI for Science 儼然已成燎原之勢。

面對這場已經到來的科技革命,2022 年,北京科學智慧研究院(AISI)深勢科技高瓴創投聯合釋出了第一版《AI4S 全球發展觀察與展望》,詳細闡述了 AI for Science 的發展歷史和技術現狀,並深入剖析了其在多個行業領域的原理與實踐,釋出後便獲得了來自全球各行各業的廣泛認可和支援。

作為新一代科創資源樞紐與智慧服務平臺,絡繹科學十分期待人工智慧與科學研究的結合,依託絡繹科學開放社群,我們聯合了新型研發機構、高校院所、OA 期刊等,以科研工作者需求為核心、以推動資料和相關學術資源公開共享為使命,為廣大科研工作者提供創新智慧科研服務解決方案。目前,憑藉對 AI for Science 的價值認可,絡繹科學也已打造出一系列 AI 驅動的科研生產力工具,助力科研成果價值放大,以促進“產學研用”的交流融合。

為了推動 AI for Science 持續助力和擴充更多領域的科研邊界,同時讓國內乃至全球更多從業者看到和看懂 AI for Science 中所蘊藏的科研與商業機遇,今天,北京科學智慧研究院深勢科技攜手絡繹科學聯合釋出 2023 版《AI4S 全球發展觀察與展望》

此次釋出的 2023 版《AI4S 全球發展觀察與展望》(簡稱《展望》)在上一版的基礎上對已有內容進行大幅更新,並新增近一倍全新內容,對過去一年的發展進行追蹤並闡述其如何影響 AI for Science 的發展路徑,整理彙總數十家領先企業和科研機構的經驗方法,深入解析相關技術、產品、產業、政策的演化,並以全新的框架重新梳理 AI for Science 的要素、沿革、展望,詳盡描述其在各行各業的實踐。

在 AI for Science 迎來飛速發展的 2023 年,新版《展望》透過內容方面的重構全面呈現 AI for Science 在科學多領域的應用與發展,助力從業者更好地瞭解 AI for Science 的應用現狀與未來趨勢,共同推動 AI for Science 領域的融合創新,蝶變前行。

創新提出 AI4S“四梁 N 柱”發展框架與新基建思路

科學技術是第一生產力。在過去的數百年裡,科學技術的發展歷經了多次系統性危機,危機的解決讓科學技術實現質的飛躍,科學藉助新工具的應用和普及帶來生產力的提升;如今 AI 時代已經到來,AI 在計算機視覺、自然語言處理,自動駕駛等領域大放異彩,但是 AI 要想從一套“資料處理”工具走向更加通用的“智慧”,科學技術是必經之路。

顯然,AI for Science 將會是 AI 的下一個主戰場,它將極大地擴充 AI 和 Science 的邊界,賦能技術和工業的各個方面,助力加快走完科學研究和技術創新之間的“最後一公里”,也將助力研究人員從紛亂的自然和社會特徵之中抽絲剝繭,發現事物背後的關鍵規律。

圖|AI for Science 的“四梁 N 柱”架構(來源: 北京科學智慧研究院)

此次 2023 版《展望》首先概述了 AI for Science 原理與發展框架,並提出了“四梁 N 柱”觀點。

《展望》指出,在原有的科學基礎設施上,AI for Science 時代下的基礎設施將有四個方面的全面突破。其一,基本原理與資料驅動的演算法模型和軟體系統;其二,高效率、高精度的實驗表徵系統;其三,替代文獻的資料庫與知識庫系統;其四,高度整合的算力平臺系統,此四個方面概括為 AI for Science 的“四梁”。

而將 AI for Science 落地於廣泛場景中的具體實踐,這些垂直領域的應用和技術則稱為“N 柱”,比如生命科學、材料科學、能源、氣象等眾多領域。

完成“四梁 N 柱”的系統建設,一方面,要面臨著高度抽象化的領域知識門檻;另一方面,還要擺脫“作坊模式”推動科研向“平臺模式”轉變,這其中科學問題與工程問題互相交織和影響,因此,推動科學家與工程師的充分協作是高效實現 AI for Science 時代科研基礎設施建設的關鍵因素。

發展階段層面,《展望》指出,按照行業整體需要解決的問題,可以把 AI for Science 的歷史和未來十年可預見的發展大致分為三個時期:以科學家為主導的“概念匯入期”(2016-2021)、以科學家和工程師協作為標誌的“大規模基礎設施建設期”(2021-2026),和以工程師為主導的“成熟應用期”(2026 年及以後),三個時期的演進也是人們對 AI for Science 開發程度不斷加深、使用範圍不斷擴大的過程。

AI for Science 的發展不僅取決於 AI 演算法的應用,還取決於大量經典演算法的改進和提升。演算法迭代層面會經歷從“簡單模擬”到“智慧化搜尋”3 個階段:1.0 階段的關鍵詞是“模仿”,即基於實驗的思路,在實驗基礎上進行簡單的外推和擴大;2.0 階段的關鍵詞是“預測”,即有邊界地預測,有明確、可驗證的置信區間;3.0 階段的關鍵詞是“搜尋”,即演算法可以非常準確的對真實場景進行建模,並在此基礎上根據特定需求設計並返回所需結果。

《展望》指出,目前正處於 2.0 階段,未來幾年內 AI for Science 的相關領域都將會完成 2.0 階段的演算法升級,而後將逐漸進入到智慧化設計的 3.0 階段,最終實現 AI for Science 廣泛普及。

AI for Science 的發展既包含 AI 行業的要素,也包含科學領域的要素,更需要來自產業和公共管理側的發展要素,所有這些要素相互交織影響,共同促成 AI for Science 發展的正反饋。

近十年來,AI 的強大之處大家有目共睹,但其“黑箱”屬性也向來被學界詬病,即能知其然卻不能知其所以然。《展望》指出,由於 Science 本身的客觀存在性,將 Science 與 AI 融合為 AI 提供了絕佳的“驗證”步驟,讓 AI 在特定領域內能產出“可解釋”的成果,而這不亞於為人類發現新的科學原理

而在科學領域,從“資料”中可以提煉出經驗性“原理”,亦可以使用“原理”來模擬模擬出“資料”,因此“資料”和“原理”在一定程度上能夠接近無損轉化。

AI for Science 在模型驅動和資料驅動深度融合的過程更像是一個系統化的工程,不僅需要原理層面的創新,也需要從基礎設施、產品、場景互動的全方面變革,各個場景可能都需要龐大的團隊來支撐和完成,同時這也意味著巨大的空間和機會。

AI4S 在多個領域的產研實踐

新版《展望》著重介紹了 AI for Science 在生命科學、材料科學、能源、半導體、地球與環境等眾多領域及細分領域的產研實踐。整體而言,在具體的實踐中,如何更好地構建 AI-Science 之間的紐帶是核心的創新點,而這在不同的科學場景中其思路也不盡相同。

生命科學領域,在過去的十餘年間,大量基於機器學習和深度學習的理解基因調控的方法被開發出來,AI 在驅動藥物研發和個性化醫療中取得新突破。如今,AI 正在藥物研發、疾病篩查、生物學機制研究等方面發揮著越來越重要的作用,未來,隨著 AI 的滲透,很多疾病的通路和影響因素將不再神秘,最終有望介導人類健康乃至整個生命科學領域的系統進步和重大突破。

以藥物研發為例,新藥開發過程是個多環節、漫長且昂貴的流程,每個環節的效率提高都有巨大的商業價值。如今,將 AI 與底層生物機制結合的新正規化(AI for Life Science),正在從底層技術的突破為整個行業注入嶄新活力,帶來更多機會。

在 AI for Life Science 正規化下,藥物研發過程中的大部分實驗可以像汽車、飛機等工業領域實現模擬模擬,透過計算手段進行測試和篩選,再透過真實實驗進一步的驗證和篩選,能夠大幅減少真實實驗帶來的時間和經濟成本的消耗。

AI for Life Science 的其他應用,比如,當今比較熱門的 CAR-T 細胞療法,CAR 分子的胞外結構域中識別抗原的單鏈抗體片段十分重要 ,AI 技術可被應用於學習抗體片段規律,對抗體親和力或人源化性質進行預測和推薦;再比如,Cas9 是 CRISPR-Cas9 基因編輯技術的重要組成部分,AI 演算法可用於尋找毒性更弱的 Cas9 酶,同時還可以藉助 AI 在酶設計中的應用,嘗試對已知的 Cas9 酶進行最佳化和改造。

合成生物學領域,AI for Science 的設計與合成生物學的工程模式相輔相成,共同打造“假設、構建、測試、學習”的閉環(DBTL),並且還有可能基於自動化實驗室利用 AI 對於實驗的定量設計來反向補充資料庫,以及探索更多的規律,突破理性設計的瓶頸。

今後,AI for Science 有望實現全基因組水平定製化工廠的設想,完成實驗室的小規模理性化設計到大規模製備工藝的生產,甚至有可能實現從底層對於微生物系統的模擬搭建到宏觀的海洋系統甚至生態系統的模擬,真正推演出類似“蝴蝶效應”的過程。

圖|AI for Science 推動材料研發正規化不斷演進(來源:2023 版《AI4S 全球發展觀察與展望》)

材料科學領域,從原子和分子出發,根據需求最佳化和設計創新材料,這是一個綜合了物理、化學、工程學等的跨學科領域,然而,現階段新材料研發主要依靠大量的實驗試錯,費時費力。AI for Science 可以從第一性原理出發,預測材料成分分佈和微觀結構的多尺度特徵,並整合現有材料的資料庫、專家知識和人工智慧方法,將計算和實驗結合可以縮小材料創新的搜尋空間,加速材料創新程式,目前研究人員已成功利用 AI for Science 方法進行了關鍵問題的攻堅。

半導體領域,半導體技術是資訊時代的基礎,未來發展已形成了兩條不同的路線:一條是為了解決隨著器件尺度不斷減小、新制程的開發愈發困難的現狀;另一條是開發除矽基半導體之外的新材料體系和工藝路線。在這裡,AI for Science 一方面可透過對微尺度的高效高精度建模,助力相關新材料和器件體系的開發和應用,並透過工藝模擬、預測、搜尋最佳化流程為工藝的改進提供助力;另一方面,可藉助高效能運算、物理建模和機器學習相結合的方式透過模擬模擬等手段對半導體材料的工藝進行模擬,加速工藝的商業化應用,此外,在化學拋光等方面也可以結合高通量實驗發掘最有效的拋光液材料。

除此之外,《展望》還列舉了 AI for Science 一系列應用案例以及產業方觀點。比如,寧德時代利用 AI 來研究鋰金屬負極和鈣鈦礦相變等問題,使用了深度勢能與先進表徵結合來研究這些材料的分子細節,從而能夠在分子層面理解材料效能的變化,為材料設計和最佳化提供了理論指導,同時這種研究方法也大幅提高了研究效率。

再比如,英矽智慧基於生成對抗網路、深度強化學習、預訓練模型及其他機器學習技術,構建高效的 AI 藥物研發平臺 Pharma.AI,併成功開發出臨床前候選化合物 ISM001-055,這是全球首個由 AI 發現具有全新靶點和全新分子結構的候選藥物,也是該靶點目前唯一一個臨床階段的在研管線,是真正意義上的“first in class”藥物。

產業方觀點,在清流資本看來,投資像 AI for Science 這樣的前沿科學領域是一種“雙贏”策略。就社會角度而言,這些投資為人類解決重大科學問題、推動科技進步,提供了強大的動力;就經濟角度而言,新技術和新科學往往帶來正規化的轉變,創新了產品和服務,顛覆了既有的市場,為投資者帶來了巨大的商業價值和金融回報。

從生命的基本組成(蛋白質),到世界工業的基本要素(材料),再到各個科學技術領域,AI for Science 不僅是解決具體問題的有力工具,更是重新定義科學問題的系統性思路。

《展望》指出,AI for Science 的巨大想象空間存在於如何更好地利用 AI 演算法將科學計算和物理模型相連線,進而指導科學和產業創新,AI 的力量在於其具有解決複雜問題,從而推動科學研究和技術發展的巨大潛力,此時,科研的瓶頸就不僅是“如何解決問題”,也是“如何定義問題,如何選擇工具” 。

因此,對問題的深刻認識是解決問題的第一步。AI for Science 演算法的原始創新,不僅來自日新月異的 AI 模型,更來自科學家們對具體科學挑戰的剖析、拆解、分診,如此才能最大化 AI 在科學領域的效能。

在 AI 時代,成功往往是毅力、探索以及投入資源實現長期目標的結果,AI 在科學中取得有意義突破的路徑通常是間接和不可預測的,這需要塑造其未來的人理解並接受這一長期旅程的本質。

例如,作為 AI 基礎設施領域的先驅,NVIDIA 的圖形處理器(GPU)已成為全球機器學習和深度學習框架的重要組成部分,然而 NVIDIA 在 AI 領域的旅程卻始於電子遊戲這一完全不同的領域,透過不斷推動圖形處理的極限以滿足日益增長的遊戲行業需求,NVIDIA 無意中為如今的 GPU 加速 AI 打下了基礎;此外,AI for Science 領域的先驅者 DeepMind 和 OpenAI 也並非是在一夜之間取得了令人矚目的成就。

這些例子凸顯了 AI 發展和實施科學進步的一個重要方面,即政策制定者和資本配置者都需要長期視角,只有兩者的長期承諾才能實現 AI 在推動科學突破方面的變革潛力,正如諺語“羅馬不是一天建成的”,見證的這場 AI for Science 驅動的科學技術革命亦是如此。

結語

誠然,AI for Science 的發展之路也必將充滿荊棘,它的成長需要各行各業的從業者打破壁壘、凝聚共識,撥雲見日的路上,真理與泡沫、洞見與偏見的差別均在毫釐之間,2023 版《展望》希望陪伴每一位關心和關注 AI for Science 的從業者見證這場發生在眼下的科技革命,從花開花落走向碩果累累。

道阻且長,行則將至!

PDF版本將分享到199IT知識星球,掃描下面二維碼即可下載!