眾所周知,影像、音樂能用 AI 生成,但出乎意料的是,氣味也行。
最近,一個名叫 Osmo 的初創公司宣佈,他們成功地將氣味數字化了。第一個成功的案例是「新鮮的夏季李子」,而且復現出的味道「聞起來」很不錯。整個過程依靠 AI 技術來完成,不需要人工干預。有了這項技術,你就可以像下載音樂一樣下載香水了。
這個發帖的 Alex Wiltschko 是 Osmo 的 CEO 和聯合創始人。「將氣味數字化」進而「生成氣味」最初只是他在谷歌工作期間的一個研究專案。但在 2022 年,他在 Lux Capital 和谷歌風投的支援下,將其作為一家獨立的初創公司推出。「我一直熱衷於瞭解氣味。它是一種非常強大的情緒感官,但我們對它卻知之甚少」Wiltschko 在接受 CNBC 採訪時說。在復刻出李子的香味後,Wiltschko 非常激動,「帶著這個香味去了很多地方」。至於這項研究的用途,Osmo 的官方說法是「改善人類的健康和幸福」,因為嗅覺數字化對幫助醫療人員檢測、治療疾病至關重要。比如,醫生可以用氣味來觸發患者記憶或減輕焦慮。此外,它還有可能在 VR 遊戲、電影中發揮作用,增加 VR 裝置的沉浸感。或者,你還可以用這項技術來留住親人的氣味,但「按月付費」就有點諷刺了。當然,這些都是長期願景。在近期,Wiltschko 希望 Osmo 能製造出更安全、更可持續的香味分子,用於香水、洗髮水、驅蟲劑和洗衣粉等日常用品中的香料。0. 在 Osmo 建立之前,Alex Wiltschko 在谷歌研究院領導著這個團隊,他們使用先進的機器學習技術構建了 Osmo 氣味對映圖的基礎。1. 取得了一項重大突破,可使用圖神經網路根據分子結構預測其氣味。2. 創造了以前從未聞過的新分子並以超越人類的準確度進行了預測。3. 設計出了蚊子覺得難聞的氣味分子(例如驅蟲劑),並且在人體試驗中比避蚊胺(DEET)更有效。而要更具體地瞭解 Osmo 的研發歷程,我們還要從 Wiltschko 的早期經歷說起。Wiltschko 2009 年在密歇根大學獲得了神經科學學士學位,並在哈佛大學學習嗅覺神經科學,於 2016 年獲得博士學位。第二年,他成為谷歌研究院的一名研究科學家,在那裡,他花了五年時間領導一個團隊,利用機器學習幫助計算機根據分子結構預測不同分子的氣味,並使用機器學習軟體開發了 「主要氣味對映圖(principal odor map/POM)」。這項研究發表在 2023 年 9 月的《科學》雜誌上。據介紹,POM 座標可以用於預測氣味強度和感知相似性,即使這些感知特徵並非模型訓練的顯式組成部分。這些結果已被用於構建多種嗅覺預測模型 —— 即使沒有微調,其表現也優於以前的特徵集。為了構建這個氣味地圖,他的團隊在一個包含 5000 個芳香分子的資料集上訓練他們的 AI 模型,這些芳香分子涵蓋了各種氣味類別,如花香、果香或薄荷味。Wiltschko 發現,由於分子結構複雜,計算機在分析分子時可能會比較棘手 —— 只要移動一個分子鍵,分子的氣味就可能從玫瑰變成臭雞蛋。但得益於人工智慧技術的進步,該模型能夠捕捉到分子不同結構中的模式,並利用這些知識準確預測其他分子的氣味。Wiltschko 說,大型語言模型可以透過「整個網際網路」的資料進行訓練,但當他們開始構建人工智慧模型時,還沒有類似的氣味資訊數字圖書館。所以,他們花了大約一年的時間與香水行業的公司合作。起初,他們以為這些公司會有很棒的資料集,但事實並非如此。這促使 Wiltschko 和他的團隊建立了「一種新的資料」。為此,他們收集了數千種分子以及調香大師對其氣味的描述。然後,他們將這些資料輸入圖神經網路(GNN),該網路屬於機器學習的範疇,使用強大的演算法來檢測和分析資料點之間的關係。Wiltschko 說,他的團隊可以使用 GNN 來幫助 AI 模型理解原子、連線它們的鍵以及分子結構如何決定其氣味。氣味數字化可以開拓出前所未有的應用場景,最基礎的就是氣味的遠端傳輸。Wiltschko 表示,Osmo 希望最終能夠利用自己的技術,將一個地方的氣味數字化,然後在另一個地方再造一個完全相同的副本,從而實現氣味的遠端傳送。事實上,該公司最新更新的部落格表示,他們已經成功了。具體來說,選擇一種要傳輸的氣味,並將其放入一臺 GCMS(氣相色譜 - 質譜)機。如果該氣味的來源是液體,就直接注入;如果是固體樣品(比如李子),就使用頂空分析,也就是將氣味困在物體周圍的空氣中,並透過管子吸收。GCMS 會識別原始資料(可以視為分子),並將其上傳到雲。在那裡,它會成為主要氣味對映圖上的座標 —— 這是一種新穎、先進的人工智慧驅動工具,可以預測特定分子組合的氣味。然後,這個配方會被髮送到一臺配方機器人,它會基於該配方來混合不同的氣味,從而復現樣品的氣味。在另一項成果展示中,Osmo 表示他們使用 AI 發現了前所未「嗅」的配方,並且他們一口氣向歐美市場釋出了三種前有未有的香水氣味分子。他們將之分別命名為 Glossine、Fractaline、Quasarine。他們還為這三種香水氣味編寫了美妙的描述。舉個例子,對於 Glossine,他們寫到:「一種充滿活力的花香,讓人聯想到茉莉花,後調和中調散發出耀眼的亮澤。這種迷人的分子可為之前的任何香水增添耀眼的拉斯維加斯式光彩。」此外,Osmo 也在研究多模態 AI,具體來說,他們研究的是基於影像生成對應的氣味,當然影像又可以進一步基於文字而生成。下面演示了一個案例:可以看到,使用者只需輸入文字提示詞,AI 就會幫助你生成影像(使用者也可直接上傳影像),然後再進一步為你生成分子配方。當然,如果你還想親身聞到這些氣味,還需要相應的裝置。事實上,他們已經線上釋出了這款工具 Inspire,目前支援文字和影像輸入,但他們也表示未來還會支援音樂、PDF、幻燈片和影片輸入。感興趣的讀者可以註冊嘗試一下:https://inspire.osmo.ai/landing這項技術背後彰顯著無限的可能性。舉個最明顯的例子,也許未來我們還能觀看帶有氣味的電影,實現視覺、聽覺和嗅覺的全方位體驗 —— 這或許能給那些風景如花的電影變得更加好看以及好聞。最後,Wiltschko 表示 Osmo 還有一項長期目標,即利用這項技術幫助更早地識別疾病。也許未來,我們在體檢時會有一個 AI 透過它的機器鼻子來判斷我們的健康狀況。https://www.cnbc.com/2024/08/18/former-google-researchers-startup-uses-ai-to-digitize-smell.htmlhttps://www.science.org/doi/10.1126/science.ade4401