按摩、下棋、端茶倒水,上過四次春晚的那家機器人公司又整出了新活兒
機器之心發表於2021-07-08
提到優必選科技,對機器人感興趣的讀者想必都不陌生。自 2012 年建立以來,他們的機器人曾先後四次登上春晚,2018 年釋出的智慧教育機器人「悟空」還拿到了美國消費電子展創新獎等獎項。登上春晚的優必選機器人。
最近,這家公司又整出了新活兒。在 7 月 8 日開幕的 WAIC 2021 世界人工智慧大會上,優必選科技釋出了他們的全新一代大型仿人服務機器人——Walker X。這也是它連續第二次在 WAIC 獲得「鎮館之寶」的榮譽。Walker X 身高 1.30 米、體重 63 千克,不僅擁有出色的運動能力和穩定性,還能精準、安全地完成一系列日常工作。在 WAIC 活動現場,它為我們展示了上樓梯、下斜坡、下象棋、柔順力控按摩、視覺定位導航、快速行走、單腿平衡、不平整地面行走等多項技能。除此之外,Walker X 還原生內建了超過 28 種情緒體系,支援喜怒哀樂等情緒表達及機器人狀態展示。對於健全的人類來說,上述活動幾乎都像呼吸一樣自然、簡單,但要想把這些技能複製到機器人身上,難度是普通人難以想象的。目前,Walker X 已獲得數百項授權專利,覆蓋伺服關節、靈巧手、關鍵結構等硬體系統,以及步態規劃、平衡控制、三維感知、定位導航、視覺檢測等控制感知演算法。為了進一步瞭解 Walker 背後的技術,機器之心採訪了優必選科技 CTO 熊友軍博士。在採訪中,他不僅介紹了 Walker X 的技術難點、落地情況,還聊了聊他們做仿人機器人的初衷以及相應的科研合作思路。要打造一款仿人機器人,良好的運動控制能力是最基本的。如果這方面做不好,機器人很容易在運動過程中摔倒。與上一代 Walker 機器人相比,新一代 Walker X 可以走得更快、更穩,最大行走速度提升到 3 公里 / 小時,能適應斜坡、樓梯等結構化地形和地磚、厚地毯、草坪、碎石等不平整地面,還能背上 10 千克的重物或雙手負載 3 千克重物行走。如果在行走或單腿站立時承受外部衝擊,Walker X 也能保持平衡。這背後離不開步態規劃與控制等能力的升級。熊博士介紹說,為了實現 Walker X 的快速行走,他們透過虛擬本體激勵軌跡、足腰協調類人步態、擺動腿運動軌跡最佳化等演算法提高了它的平衡能力,伺服硬體的效能也得以充分發揮。在不平整地面上行走則涉及全新的腳掌姿態控制演算法。該演算法可以讓機器人的腳掌像人一樣,在接觸障礙物的瞬間具備柔性自適應能力,又能在腳掌完全接觸地面後提供足夠的支撐來保證機器人穩定。此外,由於 Walker X 的定位是一款家用服務機器人,與人類相處時受到外部衝擊也是在所難免。為了抵抗衝擊,研究人員採用了全身動量控制方案來提高 Walker X 單腿站立時的穩定性,還採用了落足點調整、柔順控制與姿態控制等多種策略和方法來確保其行走過程中的抗衝擊能力。要想在現實世界中不摔跤,光會走肯定是不夠的,還得學會「看路」,即導航和避障。為了讓 Walker X 具備這項能力,研發人員採用了 Coarse-to-fine 的多層規劃演算法和基於多目視覺感測器的三維立體視覺定位,前者可以幫助機器人自動選擇全域性最優路徑,後者則支援 2.5D 避障,能以二維避障的算力獲得三維避障的效果。在躲避障礙之餘,作為一款家用機器人,Walker 還得學會與人互動,比如在使用者回家時確認使用者身份,根據手勢完成一些指令等。身份確認有賴於人臉識別。熊博士介紹說,優必選科技的人臉識別結合了自研的跨風格人臉資料生成技術,還在訓練過程中加入了類實際場景的模糊增強,使得提取的人臉特徵更具表徵性,其識別效果在 FLW、MegaFace 等公開資料集上處於領先地位。在此基礎上,優必選科技還自研了基於深度學習的人臉質量評估、人臉姿態估計、人臉逆光檢測等演算法,提高了逆光、暗光等環境下的人臉識別可靠性。手勢的識別分為 1.5 米和 5 米兩種距離範圍,前者針對邊緣端低算力裝置,採用了模型壓縮減裁、量化處理等技術,所需算力小;後者針對伺服器端或有獨顯、集顯的裝置,識別距離遠,小目標識別能力強,識別精度高。目前,Walker X 已經支援 18 類手勢識別,包括 12 類單手手勢和 6 類雙手手勢。比如說,Walker X 可以識別停止的手勢,並能做出決策和反饋,中止正在進行中的動作。讓機器人幫人幹活兒一直是該領域研究者努力的方向和動力。在採訪中,熊博士舉了個幫人倒水的例子來解釋其中的技術和難點。在接到「倒水」的指令後,機器人首先需要「想」一下如何完成任務,比如先走到冰箱前開啟冰箱門,然後拿出瓶裝水、擰開瓶蓋、把水倒入杯子。其中,這個「想」的過程就涉及任務規劃,即對執行動作進行排序;走向冰箱的過程則涉及路徑規劃、導航、避障和運動控制。由此可見,上面提到的一系列技術其實都在為「幹活」做鋪墊。但除此之外,拿出瓶裝水、擰開瓶蓋等操作還涉及物體識別與檢測、手眼協調等技術。在物體識別與檢測方面,演算法不僅需要知道目標物體(此處是瓶裝水)的類別,還需要知道其位置座標,然後讓機器人依據這些資訊進行抓取等操作。通常來講,服務機器人的物體識別演算法需要識別數百類物體,而且類別之間的數量是極度不均衡的。因此,研究人員透過計算每一類物體的有效樣本數量來解決類別之間的數量不均衡問題。此外,該演算法還用了共存歸一化指數函式來解決一個物體具有多個標籤的難題。目前,Walker X 已經實現了百餘種未建模日常物體在多種環境下的穩定識別。在得到目標物體(瓶裝水)的類別、座標等資訊後,機器人就要執行下一步的抓取、開瓶蓋、倒水等操作了,這些動作都考驗著它的手眼協調能力。以抓取為例,為了做好這個簡單的工作,機器人需要知道最佳抓握點在哪裡、每個關節要扭轉多少度、所需的抓握力有多大、抓取過程中如何避開障礙物等。為了保證抓取的可靠性,研究人員採用了基於資料驅動的抓取規劃正規化,透過物理模擬環境生成未建模物體的抓取資料並訓練抓取預測深度神經網路。目前,Walker X 已經實現了指定物體抓取、足腿移動抓取、全身協調抓取規劃等針對仿人機器人特點開發的抓取功能。如果說讓機器人幹活專注的是「機器」二字,那麼情感方面的研究則更加關注機器人「人」的屬性,用熊博士的話來說就是「希望機器人有更多的智慧和親和力,希望它跟人的互動更加親切自然。」這就需要賦予機器人一定的情感互動能力。Walker X 有一套全新升級的多模態互動系統,可以實現視、聽、觸、環境多通道感知。它還內建了原生 28 + 機器人情緒體系和四維燈語體系,可以主動與人互動,與使用者建立共情。從 Walker X 的技術體系可以看出,機器人是一個技術的集大成者,仿人機器人更是機器人皇冠上的明珠中最亮的一顆。要想把每個方面都做好,單靠一個公司的力量可能是遠遠不夠的。因此,優必選科技建立了一個全開放的軟硬一體的科研合作平臺。「像 Walker 這種大型服務機器人研究內容非常廣,技術難度也非常深。要想建立起一個生態,靠優必選科技一家進行封閉式的開發,我覺得可能不是一個最好的方式。所以現在我們用一種開放的方式,把我們公司在這個領域取得的一些成果放在平臺上,面向全球的高校和科研人員開放,讓大家共同去推動機器人的研發和進步。」熊博士在談到開放平臺建設的初衷時說道。具體來說,這個平臺的開放可以分為底層、中層和上層三個層面。底層主要涉及硬體的通訊協議,允許外部研究者在上面做一些開發。中層主要涉及控制演算法,如運動控制、手眼協調、語音、視覺、作業系統等,需要各方一起豐富。上層主要涉及一些應用,提供各種 API 的介面,幫助使用者在不改變底層的情況下開發各種細分場景下的機器人 APP。基於這一平臺,優必選科技已經與卡內基梅隆、清華、華中科技、華南理工等全球多所知名高校展開了合作,在運動控制、感知、雙臂協作、情感互動等領域取得了一些研究成果。在熊友軍看來,這是一個雙贏的結果,「現在國家也開始推廣人工智慧和機器人專業,但實際上很多學校和單位是缺乏科研平臺的。而 Walker 本身就是一個很好的科研合作平臺,能夠推動整個行業的快速發展。」剛剛提到,仿人機器人是機器人皇冠上的明珠中最亮的一顆。那既然難度如此之高,優必選科技為何還執著於這一賽道呢?對此,熊友軍給出了三個維度的考量。第一個維度是機器人在各種應用場景中的環境適應能力。優必選科技打造 Walker 的願景是讓機器人走進千家萬戶,因此,它必須儘可能適應為人打造的各種環境,比如樓梯、門把手、桌椅板凳、家用電器等,而不是反過來讓人改造環境去適應機器人。與其他形態的機器人相比,仿人機器人在面對這一環境時要方便得多,能投放到健康養老、醫療衛生、科普教育、公共服務等各種需要跟人打交道的場景。此外,仿人機器人的外形和互動方式也更具親和力,能夠滿足人類的情感互動需求。第二個維度是公司戰略需求。對於優必選來說,研發前沿技術支撐公司其他產品的應用落地也是 Walker 研發的意義之一。從這個角度來講,Walker 是優必選產品之樹的「樹幹」,為公司其他產品(樹枝)提供養分,現有的智慧教育機器人悟空、Yanshee、Ebot、AMR 智慧物流機器人、紫外線消毒機器人 ADIBOT 淨巡士以及 2021 年登上春晚舞臺的拓荒牛等產品都用到了 Walker 的相關研發成果。反過來,這些產品形成了市場和應用,也可以繼續支撐 Walker 的進一步研發迭代。「優必選科技希望是用兩條腿走路,一方面是技術的研發,一方面是商業化落地。技術的提升提高了這些產品的體驗感、技術門檻和核心競爭力;反過來,這些產品又能在應用場景中給 Walker 提供反饋從而可以最佳化產品。這兩方面是相輔相成的。」第三個維度是國家戰略需求。「從國家層面來說,仿人機器人是代表一個國家工業和科技水平的綜合性科技產品,也是衡量國家科技創新能力、製造業實力以及智慧服務水平的重要標誌。」熊友軍解釋說。為了實現這些願景,Walker 機器人在五年之內經歷了四次迭代,團隊的科研、演算法、工程、應用等能力都有了顯著提升。未來,Walker 的迭代思路將集中在減重、提速以及提高認知能力等方面。在亮相 WAIC 之後,Walker X 還將遠赴杜拜,在今年 10 月份開幕的杜拜世博會上擔任中國館「智慧導覽講解員」,為來訪者介紹中國在航天等領域的頂尖科技成果。如果你也預定了世博會的門票,不妨去中國館跟 Walker X 打個招呼。