微軟:用計算機技術治癒癌症,這不是在開腦洞

微軟研究院AI頭條發表於2016-08-31

在微軟遍佈全球的研究實驗室裡,電腦科學家、程式設計師、工程師和其它專家們正試圖解決計算機行業的各種前沿問題:從系統設計和安全到量子計算和資料視覺化,不一而數。

但其中一部分科學家、工程師和程式設計師擁有一個不同的目標。他們正試圖攻克的,正是人類面臨的最複雜、最致命的挑戰之一:癌症。在大多數情況下,他們使用的是演算法和計算機,而不是試管和燒杯。正如生物學家,微軟英國劍橋研究院高階研究員Jasmin Fisher所言:“我們正試圖改變生物學日常的科研方式。”

來看看這些電腦科學與醫學的跨界狂人們是如何有理有據地腦洞大開的:

透過直觀地梳理所有可用於資料研究的方式,來自微軟的一支研究團隊選擇使用機器學習和自然語言處理技術,來幫助全球知名腫瘤學家為患者找到最有效的個性化癌症治療方案。而另外一項工作是結合機器學習和計算機視覺,讓放射科醫生更詳細地瞭解患者的腫瘤進展情況。還有一組研究人員開發出了強大的演算法,來幫助科學家瞭解癌症發展情況以及最適合的治療方案。另外還有一個團隊則付出了巨大的努力,讓科學家有一天能夠對細胞進行程式設計來治療各種疾病,包括癌症。

計算驅動與資料驅動

微軟全球資深副總裁周以真表示,雖然各個專案之間差異看似巨大,但微軟應對癌症的總體原則離不開兩種基本方法。

第一種方法立足於癌症以及生理變化過程是一種資訊處理系統。這意味著用於建模和推理計算流程的工具——例如程式語言、編譯器和模型檢測器——也可用於建模和推理生物的變化流程。另外一種方法更偏重於資料驅動。它基於這樣一種想法:研究人員可以對可用的大量生物資料應用機器學習等技術,並利用這些複雜的分析工具更好地瞭解和治療癌症。兩種方法有著某些共同的基礎,包括核心理念,那就是成功取決於生物學家和電腦科學家都為解決問題貢獻自己的專業知識。周以真博士表示:“生物學家與電腦科學家之間的合作對於解決問題至關重要。微軟有著充分的理由進行大膽的廣泛投資,利用電腦科學抗擊癌症。對微軟而言,這也符合我們的核心使命:予力眾生,成就不凡。這隻第一步。”

除此之外,微軟對雲端計算的龐大投資很自然地適合需要大量計算能力來解決重大問題的領域。長期來看,微軟這麼做也是合理的:以為客戶提供工具進行投資,不管他們選擇哪個計算平臺,即使有一天這臺電腦已不再基於矽晶片,而是基於DNA或其他生命物質,比如一個活著的細胞。在這種情況下,我們應該確保我們瞭解在這些未來的計算機上程式設計意味著什麼。”

微軟:用計算機技術治癒癌症,這不是在開腦洞

選擇最佳的治療方案

你身體裡的基因隱藏著重要的健康密碼。在研究基因對罹患和治療癌症所起到的作用上,人們已經取得了重大進展。這反過來讓人們更注重以個性化方式治療每個癌症患者。這就是所謂“精準醫療”。知名科學家、微軟基因部門高階總監David Heckerman表示:“癌症治療領域正在發生一場革命。十年前,人們還認為癌症是治療器官:腦癌就治療大腦,肺癌就治療肺。現在我們知道,治療癌症的基因同樣重要。”

隨著技術的發展,人們能夠以更低的成本更輕鬆地繪製人類基因組和其它基因材料。這使得有關癌症的精準治療更加便捷。這也為科學家提供了更多資訊來針對癌症制定更加個性化的治療方案。你可能還記得,幾年前好萊塢影星安吉麗娜·朱莉在《紐約時報》發表“我的醫療選擇”一文,她表示,由於攜帶“缺陷”基因——BRCA1,醫生預估她得乳腺癌的機率為87%,為此,她選擇了預防性地切除雙側乳腺。其實,突變的BRCA1不僅會增加罹患乳腺癌的機率,還會大大增加罹患卵巢癌的機率。在那之後,安吉麗娜·朱莉還預防性地切除了卵巢,以避免發生在她母親身上的卵巢癌發生在她身上。

如今,龐大的資料量同樣也帶來了很多挑戰。生物學家Fisher表示: “我們已經達到了會被資訊淹沒的臨界點。我們可以測量太多的資訊,但如何利用這些資訊並它們轉化為有用的知識?這是另外一回事。資訊和資料,獲取知識和理解知識之間存在巨大差異。”研究人員表示,電腦科學家可以在這個領域給予生物學最好的幫助。例如某些最有前景的方法涉及利用人工智慧的分支機器學習,自動進行精準醫療所需的繁重工作。在更基礎的領域,機器學習系統可以根據之前看到的貓的影像來識出其他影像中的貓。對於治療癌症而言,這些技術可以排序和整理數百萬個研究和醫療資料片段。

微軟雷蒙德研究院研究員Hoifung Poon利用機器閱讀技術幫助腫瘤醫生找到有關治療每個癌症患者的最有效方法的最新資訊。他認為,人工智慧與機器學習正是這一技術中最關鍵的兩大因素。新治療方式的另外一個重大優勢是雲端計算。Azure雲端計算平臺等工具可以在雲中託管這些工具,讓研究人員能夠為生物學家提供此類方法,即使醫療專家本身沒有強大的計算機 。

微軟研究人員表示,微軟在引領計算癌症工作方面擁有得天獨厚的優勢,因為微軟作為一家軟體公司長久以來一直提供讓人們可以在上面開發和擴充套件的平臺。微軟英國劍橋研究院的生物計算研究小組的主管Andrew Phillips表示:“如果瞭解一下微軟真正在做的各種事情,你會發現微軟參與這個行業非常合理。”特別是在他的研究領域,Phillips認為,研究人員受益於微軟作為軟體創新者的歷史。他說:“我們可以把之前用於程式設計計算機的方法用於程式設計生物學,然後獲取更多應用和更好的治療方案。”

當然,除非這些工具能保證生物學家、腫瘤學家和其它癌症研究人員能夠使用和理解這些工具,否則它們就無法幫助抗擊癌症。微軟研究人員表示,他們竭盡全力讓系統易於使用,甚至是沒有任何計算機等技術背景的使用者。這包括從學習到說醫生和生物學家的語言到設計模擬人們在實驗室中使用的系統的計算機工具。

一種治療癌症的方法:除錯系統

微軟:用計算機技術治癒癌症,這不是在開腦洞

Jasmin Fisher不寄望於徹底治癒癌症,而是希望能控制它。她相信,在她有生之年可以做到這一點。作為微軟英國劍橋研究院的程式設計原則與工具組的高階研究員、劍橋大學生物系副教授,她認為,並不是說癌症會永遠消失。而是一旦你能夠管理它並知道如何控制它,它就不再是個問題。

為此,Fisher和她的團隊認為你需要利用技術理解癌症——或者更具體說是讓正常細胞變成癌細胞的生物過程。一旦瞭解在問題所在,你需要知道如何修復它。Fisher把計算方法引入癌症研究。她就像電腦科學家看待計算機程式一樣看待癌症研究。她的目標是瞭解讓細胞執行命令或以特定方式行動的程式或指令集。一旦開發了一個描述細胞不正常行為的計算機程式並與癌細胞的行為對比,你就可以找出改正不正常行為的方法。她說:“如果知道了如何開發這些程式,你可以除錯它們,它就不再是個問題了。”

生物模型分析器(Bio Model Analyzer,BMA)

當然,這雖然聽上去很簡單,實際卻很複雜。Fisher和她的團隊正在研究的一種方法叫生物模型分析器(Bio Model Analyzer,BMA)。這個基於雲的工具讓生物學家可以對細胞之間的互動和通訊以及它們的連線進行建模。 該系統建立一個計算機化的模型,對比健康細胞的生物流程與生病後的異常流程。這反過來讓科學家可以看到導致癌症的人體中數百萬基因和蛋白質之間的互動,並快速制定最好、危害最小的方式為患者提供個性化治療。

微軟:用計算機技術治癒癌症,這不是在開腦洞

Fisher專案團隊的成員、英國劍橋皇家社會大學研究員Ben Hall說: “我使用BMA研究癌症,瞭解癌症的形成過程,以及正在進行的通訊。”Hall說,BMA有很多用途,包括如何及早檢測癌症並瞭解如何更好地治療癌症,透過建模找出哪些藥品最有效以及癌症在什麼時候會產生抗藥性。

下面是BMA可能發揮作用的一種方式:假設一名患者得了一種罕見並且致命的腦癌。使用BMA,醫生可以把有關該患者的所有生物資訊輸入該系統。然後,他們可以使用該系統進行各種實驗,例如對比癌症患者與健康人的資訊,或模擬患者的身體對各種治療方法的反應。使用筆和紙,甚至簡單的計算機程式進行這種計算是不可能的,因為人體中互相配合的數百萬分子、蛋白質和基因存在太多的變數。為了開發Fisher預想的這種解決方案,研究人員需要開發強大的計算模型,能夠建立這些極為複雜的模型,並執行所有可能的解決方案以尋找異常情況。

由於能夠使用計算機而不是紙和筆或試管和燒杯進行這些實驗,研究人員可以快速地測試多得多的可能性。這反過來更好地瞭解癌症如何發展、演進以及與身體其它部分互動。Jonathan Dry是製藥公司AstraZeneca的首席科學家,他的團隊與Fisher的團隊合作。他表示: “我認為這會加快研究,因為我們能夠檢驗比在實驗室中多得多的可能性。”Dry說,由於過去檢驗任何假設都極為困難,研究人員不得不專注於自己偏好的假設,猜測什麼可能最有潛力。BMA等系統讓他們可以嘗試所有想法,使得他們更有可能找到正確的方法——並且更有可能找到“黑馬式”的方法。Dry認為,如果每一個假設都來被檢驗,放在過去這是不可能的。而有了這些模型使得研究人員可以檢驗所有可能性,從而能找出更為科學的治療方案。

改進和個性化癌症治療

微軟和AstraZeneca一直在使用BMA來更好地瞭解藥品在白血病患者體內的相互作用和抗藥性。藉助BMA,兩個研究團隊能夠更好地瞭解不同的患者為什麼對特定治療方法有著不同的反應。Dry說,BMA對於更加個性化的癌症治療或精準醫療來說有著巨大的潛力。研究人員希望BMA這樣的系統最終可以讓研究人員和腫瘤醫生詳細瞭解具體的癌症病情,在檢驗時納入可能影響治療的其他因素,例如患者是否有其它疾病以及患者吃的其它藥是否會與治療癌症的藥產生反應。“這真正正視了每個患者都是不同的,可能存在很大的不同這一現實”,Dry表示。

微軟:用計算機技術治癒癌症,這不是在開腦洞

對於生物學家來說有用的計算機系統

Fisher認為,BMA這樣的系統有望革命性地改變人們對癌症的看法,但只有生物學家願意使用它們才能取得成功。經常使用BMA工作的設計師David Benque說,該系統在開發時就考慮到儘可能讓生物學家感到熟悉並且可以理解。Benque多年來一直在使用生物學家可以理解的語言來開發工具,在視覺上模擬科學家在實驗室中可能用到的東西。在Fisher看來,這樣的系統迫切需要方便生物學家的使用。否則,就不會在治療癌症方面實現突破。她說:“每個人都意識到癌症研究中需要計算能力。瞭解到這一點是一件事,說服醫生實際使用這些工具又是另外一件事。”

 

登月計劃:像計算機程式設計一樣對細胞進行程式設計

微軟:用計算機技術治癒癌症,這不是在開腦洞

如果你是開發新軟體的開發者,你很可能會按照電腦科學家所說的原則性方法編寫程式碼:使用一種程式語言和其它正式流程,開發一個遵循計算規則的系統。微軟英國劍橋研究院生物計算研究組的科學家Neil Dalchau希望在生物學領域做同樣的事情。他所在的團隊正試圖在細胞內而非晶片上進行計算。他說:“如果你能使用生物系統進行計算,你就可以把傳統計算中學到的知識運用於醫療或生物技術應用。”這種計算方法的終極目標是:像計算機程式設計一樣進行生物程式設計。這種突破有望帶來各種可能性,從治療疾病到為世界供應更充足的農作物。

領導生物計算研究組的Andrew Phillips說:“我們日常生活的方方面面都會受到影響。新的方法正努力開發某種分子計算機,可以放到細胞內監測疾病。如果感測器檢測到疾病,會啟動應對措施治療它。“很多目前的癌症治療方法會在消滅癌細胞時破壞健康的細胞。與之相比,這一方法無疑是一個重大進步。

早期但大有前途的措施

Phillips同時也提醒到,他們仍處於這項研究的極早期階段,距離長期目標還有很長的路要走。他說:“這項研究的成果將是一個殺手級應用。”但一個很明顯的重大挑戰是生物系統(包括我們的身體)比執行軟體的硬體(計算機)要神秘的多。Phillips說:“我們製造了計算機,知道它的工作原理。但我們沒有製造過細胞,細胞的很多複雜內部執行機制對於我們來說仍舊是是個謎。因此,我們需要了解細胞如何計算才能對其進行程式設計。我們需要找到方法並開發軟體來分析和程式設計細胞。”

以癌症為例。同樣在生物計算小組工作的科學家Sara-Jane Dunn說,你可以把癌症看作出錯的生物程式——有缺陷的健康細胞造成小差錯。你還可以把免疫系統看作修復某些缺陷的機制,但它並不能修復所有缺陷。科學家已經瞭解到有關什麼造成癌症以及什麼會啟用免疫系統的知識,但Dunn認為我們仍處於早期階段,還有很多工作要做。如果她的團隊能夠像瞭解微軟Word如何在PC上執行那樣瞭解這些系統,他們就可能讓免疫系統自行應對癌症。她說:“如果我們希望能夠進行生物程式設計,我們實際上首先需要了解生物如何進行計算。我認為,我們可以在這方面發揮重大作用。”像計算機程式設計一樣進行生物程式設計是否就像登月一樣?Phillips認為,這是一個雄心勃勃的長期目標,但他看到了通向成功之路。他說:“就像登月,我們知道這在技術上是可行的。現在的問題是把它變成現實。”

資料如何幫助醫生以個性化的方式治療癌症 

微軟:用計算機技術治癒癌症,這不是在開腦洞

今年,全球有數百萬人被診斷得了癌症。對於少數被選中的癌症案例,來自領先的癌症研究機構的專家加入了分子腫瘤委員會,審查患者的病史並根據他們的癌症診斷和基因構成來制定最佳的個性化治療方案。Hoifung Poon希望使得分子腫瘤委員會更大眾化,使得更多研究人員能參與其中。並正與一組研究人員一起為此開發一款工具。

它被稱為漢諾威專案(Project Hanover)。這是一種資料驅動型方法,使用機器學習(人工智慧的一個分支)來自動處理讓癌症專家難以評估每個患者的繁重工作。Poon說:“我們知道,癌症通常不是有一個基因突變造成的。相反,它是很多不同的突變經過複雜的相互作用而引起的,這意味著你需要仔細審視有關基因組的一切。”

這需要梳理數百萬條碎片化資訊,以發現適用於特定人和特定癌症案例的共同基礎。對於忙於治療很多患者的腫瘤醫生來說,這是不可能的事情。這就是微軟研究人員為什麼開發系統,幫助醫生完成工作。該系統可以自動梳理所有碎片化資訊,以發現最相關的資料,這讓腫瘤專家有更多時間利用自己的專業知識為患者制定最佳的治療方案。

這一專案的最終目標是幫助醫生做所有這些研究工作,然後提供一個基於Azure雲的工具,讓醫生根據自己收集的資訊模擬哪些治療方案的效果最好。微軟漢諾威專案的首席軟體架構師Ravi Pandya說:“如果我們可以利用這個知識庫展示與每個具體患者最相關的研究結果,普通的腫瘤學家也可以做出最好的決策。”

用Literome海底撈針

漢諾威專案開始於一個被稱為Literome的工具,這個基於雲的系統梳理數百萬篇研究論文,尋找可能適用於每個疾病診斷的基因研究。腫瘤學家很難獨自完成這項龐大的工作,而研究人員在描述自己的工作時出現的不一致現象也讓這項工作變得更加複雜。這意味著涉及相同基因資訊的研究論文可能在語言上並沒有很多重疊的地方。Poon說:“問題是,人們在利用不同的方式表述相同的東西方面充滿創意。”

為了開發Literome,Poon和他的同事使用了機器學習來開發自然語言處理工具,只需要少量可用的知識就可以建立複雜的模型,用於發現相同知識的不同表述。現在,該工具正在擴充套件,還可以納入可能有用的實驗和其它資訊源。Poon的團隊還與俄勒岡健康與科學大學的Knight癌症研究院合作,幫助他們的研究人員尋找更好的方式來治療急性髓細胞白血病,一種複雜而致命的癌症。

Knight癌症研究院的院長Brian Druker表示,這種癌症的患者實際上是患有3或4種白血病。這使得很難找到合適的藥物,以及患者是否會產生抗藥性。Druker的研究曾大幅延長了慢性髓細胞白血病患者的預期壽命。他說:“很明顯,我們需要極為複雜的計算才能消化並利用所有這些資料。”

Druker把這種合作看作雙向對話:他的專家團隊可以提供假設,幫助電腦科學家瞭解在資料中尋找什麼。反過來,電腦科學家可以進行分析,幫助他們證明或證偽這些假設。然後,這可以幫助他們更快地制定所需的治療方案。他說:“我一直相信這些資料在告訴我們答案,但我們需要知道如何聽到這些答案。這就是計算可以發揮作用的地方。”

Druker認為,我們才剛剛開始瞭解資料如何幫助癌症研究。除了基因資料,研究人員還應當開始關注其它“組學”,包括蛋白質組學,或蛋白質研究,以及代謝組學,或代謝物化學作用過程研究。他說:“我們會超越基因組。基因組告訴我們很多資訊,但不會告訴我們所有資訊。”Poon說,他們仍處於早期研究階段,但已經看到它如何改變和拯救生命。他說:“我們正處於一個關鍵時刻,已經看到光明的未來,但還有很多工作要做。”

計算機視覺如何幫助放射科醫生更好地跟蹤疾病發展情況

微軟:用計算機技術治癒癌症,這不是在開腦洞

放射科醫生希望獲得有關患者身體內部最精確的影像,經常需要價值數百萬美元的最先進裝置並會產生極為詳細的影像。得到這些影像之後呢?在很多情況下,閱讀這些影像的最高科技產品是人眼。

Antonio Criminisi是一名機器學習和計算機視覺專家,領導微軟英國劍橋研究院的放射學研究工作。他說:“人眼非常擅長診斷。專家級放射科醫生看到影像——比如人腦的影像——時,在兩秒內就會知道有沒有腫瘤。”Criminisi說,但放射科醫生很難判斷某個療法是否有效。這是因為人眼不擅長根據放射科掃描結果來判斷腫瘤會增長、縮小還是改變形狀。

 

更好的技術意味著更多資料

幾年前,放射學家、英國皇家放射醫師學會會長Giles Maskell說,一次典型的CT掃描可能會產生200張圖片。現在,同樣的掃描會產生2000張圖片——產生大量人眼甚至無法感知的資料。Maskell說:“精細的細節遠遠超出了我們的理解能力,也無法被處理成有意義的東西。”簡單地說,放射科醫生需要技術來幫助他們跟上技術發展的步伐。Maskell表示,醫生們需要幫助來以某種新形式來展示資料,而這種新形式應使得他們能輕鬆地分析大量圖片。

這就是Criminisi的團隊所做的事情。該團隊的資料驅動型方法專注於一個研究專案,該專案利用計算機視覺和機器學習(人工智慧的一個分支),為放射科醫生提供更加詳細且一致的測量,從而強化他們的專業知識。該系統有望最終能夠評估3D掃描的每一個畫素,精確地告訴放射科醫生腫瘤自從上一次掃描以來增長、縮小或形狀改變了多少。它還可以提供有關器官密度等資訊,讓放射科醫生更好地瞭解病灶是囊腫還是腫瘤。它還可以更精細地分析腫瘤周圍的細胞健康狀況。

微軟:用計算機技術治癒癌症,這不是在開腦洞

Criminisi說:“人眼基本上不可能做到這一切。”而這一計劃的目標不是讓放射科醫生失業,而是讓他們更好地工作。對此,Maskell這樣說道:“癌症診斷中總是會需要由人進行解釋。計算機和電腦科學會讓我們做出更好的決策。”

原文連結:http://mp.weixin.qq.com/s/F61ekPZ3OBVExBvRzRwyRw

相關文章