2021年6月16日,陝西科技大學創造性地利用亞馬遜雲科技的算力、機器學習平臺,以及雲上開源資料集進行人類腦部活動的研究,將專案研發實踐時間從使用本地算力、自建機器學習環境所需的一年減少至105天,縮短三分之二,加快科研進度,通過皮膚聽聲致力於為全球數億聽障人士帶來福音。

人類腦部活動研究是陝西科技大學著名的皮膚聽聲研究專案的一個延伸課題。皮膚聽聲是通過聲電轉化,將聲音訊號轉化為電流,刺激人體皮膚,資訊反饋到相關的大腦功能區,實現聽聲效果。通過反覆訓練,能夠讓聽障人士獲得語言能力。此技術不依賴於人體的任何殘餘聽力,讓全聾人士也可以感受到聲音訊號,比助聽器及電子耳蝸有更大的優越性。

當今,全球有4.6億人受到聽障問題的困擾,其中,在中國有2600萬聽障殘疾人士,零聽力人士超過500萬。對尚具微弱聽力的聽障人士,目前可以利用人工耳蝸進行補救,但是數十萬的裝置費用、手術費用、專業教師訓練費,阻礙了大多數患者的求醫之路。與此同時,人工耳蝸仍不能治癒零聽力。該研究團隊的專案如果能讓皮膚聽聲技術得到推廣,將是全球數億聽障人士的福音。

要更好地實現皮膚聽聲,就要更準確地知道聲音和皮膚刺激是如何作用於腦部拓撲功能區的具體區域,以保證刺激訊號的一致性。《功能磁共振影像 (fMRI) 解碼的無引數注意力》研究,是利用開源的功能磁共振影像資料集,對大量的腦部磁共振影像進行視覺化分析。分析過程中,需要分批獲取原始資料集,對原始資料集進行資料預處理,匯入標準資料集,將標準資料集輸入卷積神經網路,輸出視覺化的結果。

研究團隊使用的高質量開源資料集全部儲存於Amazon Simple Storage Service (Amazon S3) 上,資料量高達12TB。如果將資料下載到學校實驗室的本地計算機進行處理,需要數週時間才能完成下載。同時,如果利用學校實驗室的算力來處理這些資料,在開始處理資料之前,需要花費很多時間搭建和配置機器學習環境;在開始處理資料之後,面對高達12TB的資料,實驗室的本地工作站猶如小馬拉大車,速度往往以周計算。

最終,研究團隊決定採用上雲方式,使用亞馬遜雲科技的雲上算力進行資料處理,不僅節省了長達數週的資料下載時間,而且通過使用Amazon SageMaker機器學習平臺,不需要自己搭建機器學習環境,既省時也省力。研究團隊使用Amazon SageMaker處理Amazon S3上的資料,資料存取速度比使用本地實驗室算力提高了10倍,並僅用3個多月時間,就處理完成了包括1200份受試者資料的開源資料集,獲得瞭解碼精度達88.7%腦功能區視覺化資料,讓整個研究專案的實驗時間縮短了三分之二,研究總週期減少了一半。

研究團隊負責人齊勇博士表示,“使用亞馬遜雲科技最大的好處就是方便快捷。不僅能快速準備好海量資料,而且由於使用Amazon SageMaker開展機器學習,不用自己搭建機器學習環境,資料的處理均可以在雲上進行,從而解放了團隊大量的精力。在2020年疫情期間,研究團隊不用集中到實驗室,通過遠端即可實現協作,真正做到讓團隊專注於研究專案上,節省了大量的寶貴時間。”

研究團隊在此專案中形成的腦功能解碼視覺化分析平臺,有望為腦科學研究提供腦部功能拓撲狀態探測儀器,藉助功能核磁共振影像(fMRI)探究皮膚觸覺與大腦認知區域中血紅蛋白變化速率的定量分析方法。同時,運用基於注意力模型的深度學習計算機視覺分析技術,與現有的醫療影像分析框架相結合,將大腦影像資訊快速解耦,分離得到腦部的拓撲功能分配機制,分析大腦皮層功能區域的變化特點,有助於識別各類腦疾病,判斷病灶部位,並對進一步瞭解腦部功能機制提供非主觀可重複實驗的資料樣本。

亞馬遜雲科技大中華區商業事業部總經理李曉芒表示,“亞馬遜雲科技在雲端計算以及人工智慧領域的願景,簡單總結就是普惠。我們非常高興看到亞馬遜雲科技的產品和服務能夠幫助陝西科技大學科研團隊在人類腦部活動這樣領先的科研專案中,做出有望讓眾多患者受益的研究成果,造福大眾,讓普惠的內涵得到進一步延伸。”