昨日(5 月 21 日),清華大學「智慧人機互動研究中心」成立儀式在清華大學李兆基科技大樓舉行。這是繼「知識智慧研究中心」、「基礎理論研究中心」後,清華大學 AI 研究院第三個研究中心。
清華大學副校長、清華大學 AI 研究院管委會主任尤政院士和清華大學 AI 研究院院長張鈸院士出席成立儀式,共同為中心揭牌。
尤政院士在致辭中表示,成立智慧互動研究中心是清華大學推進人工智慧發展的重要舉措,也是清華大學 AI 研究院的里程碑事件。
圖說:智慧互動中心成立儀式合影
「人工智慧的重要需求來自人機互動。」張鈸院士在致辭中表示,⼈機互動核⼼問題是⾃然⾏為的意圖理解,而解決這一核心問題必須要經過跨學科的研究。
為了更好匯聚清華大學在智慧人機互動方面多學科的優勢研究力量,清華大學 AI 研究院決定成立智慧人機互動研究中心(英文:Intelligent Human Computer Interaction Research Center,簡稱 THUII,以下簡稱「智慧互動中心」)。
史元春教授(清華大學計算機系「長江學者」特聘教授、清華大學全球創新學院 GIX 院長)被聘請為智慧互動中心主任,高文教授(中國工程院院士、北京大學博雅講席教授、資訊科學技術學院院長)和戴國忠研究員(中科院軟體所人機互動技術與智慧資訊處理實驗室首席研究員)被聘請為智慧互動中心學術顧問。
圖說:尤政院士(左)、張鈸院士(右)為史元春教授(中)頒發聘任證書
研究團隊聚集了計算機系、心理學系、生物醫學工程系、美術學院、工業工程系、社會科學學院等 6 個院系的專家學者。
三大使命
計算裝置、感測器、資料和演算法日益增多增強,馬克•維瑟憧憬的普適計算時代已經到來。人們可能訪問的計算裝置和資料增多了,人機關係也變得更加豐富了。互動技術已經成為終端和應用創新的核心競爭力。
但普適計算時代下的自然互動存在諸多挑戰,比如,使用者心智模型的不可見性,感測器資料噪聲,以及需要適應個體、環境的差異性等。
智慧人機互動需要解決使用者認知機理建模、使用者行為的計算表徵、互動意圖的理解演算法、自然介面生成方法以及情景感知等問題,為使用者與計算設別間自然高效的資訊交換提供理論基礎和優化方法。
因此,智慧互動中心的成立,有了三大使命:
一、開展基礎理論。在人機互動、智慧互動方面,探索自然互動的科學問題,建立通過智慧技術實現自然互動的理論基礎;
二、構建開放平臺。建設典型自然互動應用中的使用者心理和行為資料庫,提供腦機互動實驗系統,建成清華大學智慧互動開放平臺;
三、促進交流合作。舉辦開放的、國際化的與智慧人機互動相關的學術活動,增進學術交流;普及智慧人機互動技術,促進產學合作。
尤政院士表示,智慧人機互動研究中心將以促進清華和國家人機互動研究與發展為宗旨,打造具有廣泛影響力的學術研究、交流中心、智慧互動平臺與原創技術推廣中心,更好地服務於國家和清華的人工智慧發展戰略。
八個研究內容
史元春教授對智慧互動研究中心的八個研究內容做了介紹:
(一)自然互動行為的意圖理解:在自然互動介面上,使用者不再是嚴格地通過離散明確的互動操作完成互動,而是通過連續、非確定的多模態資料表達互動意圖。
在解釋使用者的互動意圖時,既可以使用「黑盒子」的機器學習方法,也可以利用「白盒子」的基於使用者行為建模的方法。後者中的使用者建模,其本質是通過計算的方法來刻畫使用者的行為能力,對於理解使用者意圖和探索自然互動的計算原理具有重要的科學意義。
在意圖推理任務中,貝葉斯方法具有優勢。
(二)多模態互動感知:多模態互動行為的智慧感知是自然互動的基礎。該研究內容的核心是識別具有高可用性的自然輸入動作,創新成本可控、易於部署的感知技術。
(三)認知心理:認知心理學是對人類感知覺資訊加工處理過程及其機制的探索,是人機互動設計與優化的基礎和關鍵支撐。對積極心理的深入研究,有望為提升人機互動自然性提供重要的指導建議。
(四)情感計算與情感互動技術:是和諧人機互動的核心技術之一。
清華大學團隊針對海量網路資料,在情感認知特性的可計算性、跨模態異構資料的情感建模、美學認知的建模、面向網路使用者的情感互動等方面開展了深入研究。
(五)腦-機介面:基於大腦神經解碼提供了新的智慧互動方式,在殘疾人康復、健康人群增強等方面具有重要的科學意義和應用前景。
(六)人因與工效學:具體包含生理人因學、認知人因學和組織人因學。
(七)人機融合的智慧增強:研究人與機器兩類智慧體的雙向耦合機制,突破阻礙人與機器智慧雙向溝通的技術瓶頸,構建可互相適應、協同工作的異構智慧持續反饋迴路,實現人與機器自然、生動、自適應的智慧融合。
(八)互動設計:立足於藝術設計和人工智慧技術的有機結合,從使用者體驗的角度出發,探索新技術所帶來的可能性。
四個開放平臺
智慧人機互動研究中心成立儀式後,史元春教授還發布了四個智慧互動開放平臺:智慧文字輸入開發套件 ITIS、人機互啟發式英文寫作系統 ESODA、情感互動資料庫 ACP、視覺腦機互動實驗系統 VBCI。
易鑫博士、陶品副研究員、賈珈副教授、王毅軍研究員分別對四個開放平臺做了介紹。
(一)智慧文字輸入開發套件 ITIS:
ITIS 針對文字輸入任務中對使用者輸入意圖的準確推理問題,從使用者輸入行為建模、輸入意圖推理演算法、人機互動設計和技術評測四個方面提供資料和方法的支撐,推進文字輸入這一基礎而重要的人機互動任務在新一代互動場景下的體驗顯著提升。
其包含真實使用者在多互動平臺上的文字輸入原始資料、智慧文字輸入意圖推理演算法、多互動介面上可直接使用的文字輸入技術方案和文字輸入技術評測任務集。
(二)人機互啟發式英文寫作系統 ESODA:
「人工智慧 AI『陪』您一起寫作!讓天下沒有難寫的論文!」
該產品專注於研究人機智慧互啟發式的 AI+Writing 全新寫作互動技術,為學者從事英文學術論文寫作提供智慧化的新平臺。
擁有 3300 萬條優質英文學術論文例句,涵蓋計算機、工程學、物理學、天文學、生物學、生態學、神經科學、地球科學、能源科學、醫療衛生、動物學等眾多學科領域,更可根據使用者自定義論文集作建立個性化學術領域,向作者提供英文寫作句法、詞彙搭配及替換的智慧化專業建議。
通過智慧化感知與互動技術,由使用者向機器自然的傳達英文寫作意圖,同時讓計算機的智慧計算結果優雅地為使用者提供協助,實現人機智慧互啟發式的高效語言組織,幫助到廣大學者進行更準確、更專業地完成論文寫作。
(三)情感互動資料庫 ACP:
包含多模態情感計算資料庫、心理健康資料庫、美學計算資料庫。
其中,多模態情感計算資料庫包含語音、文字、影像情感互動資料。
語音情感互動資料庫:包含 753 萬句基於人機語音互動系統採集的語音情感資料,具有類別和維度的情感標籤,特徵包括語音、文字、使用者屬性和地理位置。
文字情感互動資料庫:包含 178 萬使用者的 10 億條文字,以情感類別為標籤,特徵包括文字、影像、表情符、使用者屬性、使用者網路角色和社交關係。
影像情感互動資料庫:包含約 35 萬帶情感的圖片,特徵包括圖片的釋出時間、標題、標籤、描述等。
心理健康資料庫中不僅有中文使用者的資料、還有英文使用者的資料。
中文使用者心理健康資料庫:包含 2 萬使用者的 50 萬條文字,標註了抑鬱傾向、壓力源和壓力水平,包括文字、影像、表情符、使用者屬性、社交關係等特徵。
英文使用者心理健康資料庫:包含 2800 使用者的 60 萬條文字,標註了抑鬱傾向,包括文字、影像、表情符、使用者屬性、社交關係等特徵。
美學計算資料庫中則涉及服裝美學和影像美學。
服裝美學資料庫:包含男女裝各分類圖片 13 萬張,以美學維度座標值和美學類別為標註,資料包含顏色、材質、版型、場合、季節等特徵。
影像美學資料庫:包含約 12 萬帶有美學評價的圖片,以美學評價詞作為標籤,特徵包括圖片特徵和美學相關的文字描述。
(四)視覺腦機互動實驗系統 VBCI:
通過視覺誘發電位腦機介面技術將大腦意圖轉化為控制指令,為使用者提供視覺神經編解碼的通用軟硬體系統框架,幫助使用者快速實現個性化視覺腦機互動應用的方案設計、引數優化、以及效能測試驗證。
VBCI 整合了視覺刺激呈現、腦電採集、腦電分析、控制反饋四大功能模組,相容 NeuroScan、Neuracle、Wearable Sensing 等多種腦電採集裝置,可根據使用者需求構建個性化腦電控制指令集,提供多種視覺誘發腦電檢測演算法,實現腦開關、數字撥號、文字輸入、機械臂控制等應用。
「除了促進我們研究院自己的分析研究、同行的交流,我們希望通過開放平臺能夠擴大合作的可能和成果影響的面,我們也希望能夠帶動產業進步。」史元春教授這樣闡釋釋出開放平臺的出發點。
她還表示,「開放平臺今天是第一次,未來會有更多。」
智慧互動中心官網:http://ai.tsinghua.edu.cn/thuii/