從人機共生體的視角,重新理解機器人產業方法論

naojiti發表於2020-03-29

提到機器人,大家腦海中第一時間會浮現出怎樣的事物?

大機率情況下,要麼是工業級/服務級機器人,以機械臂、簡單驅動型為主角,不講究外形美觀,動作也往往不怎麼連貫,常常被冠以“人工智障”的美稱;

要麼則是仿人機器人,它們總是出沒在伯克利或波士頓動力等高大上的實驗室裡,能夠以七十二般武藝讓人類忍不住發出“滅絕警告”,但必需的程式設計和持續作業能力,以及技能的泛化程度,卻都達不到大規模應用的可能。

人與智慧機器之間,有沒有第三種可能呢?

其實早在1960年,約瑟夫·利克萊德(J. C. R. Licklider)就曾提出了一個觀點——人機共生(Man-computer symbiosis)。

簡單來說,就是人類和電子裝置以親密合作的方式生活在一起,甚至結成緊密的聯盟。兩者的結合,可以創造一種高產且生機勃勃的合作關係。

“人類機器命運共同體”,聽起來是不是很心動?可惜的是,目前目前還很少見到人機共生體(man-computer symbioses)的出現。所以,最近中國機器人產業中出現的“發球機器人”,就引起了我們的注意。

原因無他,這或許是人機共生“星星之火”燎原的起點。

點燃人機共生的星火:發球機器人的初蹄

首先有必要解釋一下,為什麼說發球機器人,體現出了“人機共生”的現實趨勢。

這款發球機器人,起源於新松機器人與乒乓球學院一次偶然的談話。

當前的乒乓球運動存在一些亟待解決的問題:

一是效率。助教為專業運動員喂球時,往往在速度、旋轉、落點控制、頻率等方面,難以達到高水平選手的訓練需求;

二是統一。一旦助教出現疲憊、狀態不佳等情況,就會直接影響速度、旋轉等引數,影響訓練特定技動作的一致性,運動員很難形成最佳的肌肉記憶;

三是反饋。乒乓球是一項實時性非常高的運動,往往一秒之間幾個來回,過快的球速與落點的不確定性,也導致教練往往只能憑藉經驗來反饋,很難透過量化來最佳化教學,一些特定動作也就無法有效分析和復現。

四是普及。乒乓球的另一個身份是“國球”,中國有眾多的愛好者和青少年參與到這項運動中來,但不同地域、不同水平的教練卻參差不齊,自然也就無法滿足更多人群享受乒乓球這項運動的願望。

能不能透過智慧技術的引入,來解決上述問題呢?

深耕深度學習演算法的龐伯特,就以新松的機器人研發技術和中國乒乓球學院的海量專業資料和課程,研發出了可以自主決策的人工智慧發球機器人。

而讓龐伯特機器人得以勝任發球工作的幾大核心:

首先是感知。透過高速雙目立體視覺系統,機器人能夠捕捉高速運動下的乒乓球位置,並形成球的軌跡,透過軌跡分析,在毫秒內判斷球速以及球的旋轉方向,讓乒乓球技術轉化為可視的資料,實時調整,精準化訓練。

其次是決策:在軌跡分析的基礎上,龐伯特同時對人體動作進行捕捉,透過與預設的動作角度進行比對,分析運動員動作是否到位。結合軌跡和動作兩個因素,判斷運動員的水平,推薦課程。對於個人愛好者來說,相當於擁有了一個專業教練+陪練。

再次是運動。龐伯特機器人具有類人化結構,不同於市面上以擠壓方式進行發球的裝置,龐伯特能夠高度模擬類人化的發球方式,模擬人類發球時對球方向和旋轉,實現兩跳發球。而利用不同的球拍膠面,還能打出不一樣的球,這些都能更好地輔助人類運動員進行訓練。

顯然,龐伯特機器人正在將技術思維(technical thinking)與人類智慧相結合,為人機共生開啟了新的視窗。

逃離恐怖谷:發球機器人昭示三重改變

從龐伯特機器人的實踐中不難看出,如果在人和機器之間建立共生關係,那麼二者的合作互動顯然會大大改善很多現有問題。

由此也可以總結出,共生型機器人與大眾常見的傳統機器人有何不同之處:

首先,儘管所有人造系統都是為了幫助人類,但傳統的自動化機器人更多的是為了實現“人類增強”,而共生型機器人則是為了“與人類更好地生活在一起”。

還是以發球機器人為例,傳統的發球裝置只是機械地擴充套件某項技能,比如取代人的手臂來進行發球,往往需要人類助教來完成那些需要主動決策、調整、制定標準等工作,在效率和功能上並沒有帶來質的改變。

而龐伯特機器人的特殊之處,就在於透過深度學習演算法的引入,在智慧程度上賦予了機器人新的高度。比如實時高通量的資料收集與處理;高效精準專業的預判決策;個性定製化的訓練反饋與指導;乒乓球運動的隨機性又要求演算法具備一定的泛化能力和高魯棒性……這些都是龐伯特機器人能夠成為乒乓球運動夥伴的關鍵。

第二,共生型機器人必須具備可“實時”(real time)進行的思考過程。

傳統的機器人可以根據預先設定的程式處理資料。比如餐廳服務機器人,輸入店內地圖、設定好傳送菜程式之後只能按部就班地工作,有的甚至連避讓行人都做不到,因為提前設定會導致一旦出現不可預見的情況,整個過程就會停止。

但球類運動可不一樣,乒乓球的高速運動需要發球者做出毫秒級的判斷,像人一樣快速思考、分析、決策、反應。對於人類來說都可能要靠直覺來完成的事情,對機器與人之間的耦合要求要緊密的多。

讓機器能夠做出決策和控制複雜的情況,而不依賴於預先確定的程式,就是龐伯特機器人向我們展示的現實圖景。

最後,共生型機器人有機會重構機器人行業的商業方法論。

長期以來,傳統機器人市場的商業邏輯,要麼是“人工+智慧”,用真人來操控機器人模型,以達到模擬強人工智慧的效果;要麼是長期砸錢在天頂技術上,比如波士頓動力的機器人雖然炫酷,卻因商業化困難而賣身給軟銀。

但龐伯特機器人所代表的共生型機器人卻開啟了另一種模式,透過“真AI演算法”+聚焦實用場景來切入市場。

我們注意到,除了發球機器人之外,龐伯特還打造了對打機器人。

將深度學習神經網路與強化學習相結合,讓對打機器人和發球機器人能夠透過大量複雜環境的互動,運用各自的人工智慧演算法平臺,不斷得到反饋,互相學習到新的技能與策略,機器人之間的對戰也能不斷提升演算法模型的複雜度與智慧度。

同時,一旦高效能演算法模組被拼圖一樣使用,就能夠以低成本、小型化、高效率的方式快速開啟市場,未來不止於乒乓球這一項運動,更多場景都可以透過軌跡分析、動作分析、終端顯示等整合模組帶來改變。

從這個角度看,龐伯特機器人正在重新確立人與機器、甚至是機器與機器的關係,即一種共生夥伴關係(symbiotic partnership)。在這一美好的畫面中,機器會為人類提供見解和決策,而人類則能更有效地進行智力活動與創造。

開啟產業智慧的價值圖景:挖掘人機共生的富礦

正如國際人工智慧聯合大會前主席Francesca Rossi所說,人機共生是未來人類使用AI的最好方式。

那麼,作為人類和機器的預期前景,其中是否也埋藏著商業價值的富礦呢?

答案是肯定的。

以龐伯特機器人為例,未來就有可能締造出不少新的產業機遇。

比如說,透過與海量運動員對戰,發球機器人可以積累專業領域的資料,不斷最佳化演算法,快速提升自身的擊打能力和策略,衍生出個性化的對戰方式,來幫助運動員更好地進行訓練。並將其輸出為可量化、視覺化的訓練標準,讓乒乓球的專業教育門檻下沉到普通人生活當中。

再比如,分析決策演算法的持續迭代,有望推廣到新的運動和行業中去,以基礎化的能力支撐起千行萬業的智慧化需求,成為“新基建”中不可或缺的一員。舉個例子,當機器人與城市智慧健康系統結合,是否能夠作為市民健康的關鍵終端,來提供行而有效、可連可控的運動網路呢?

從這個角度延展開來,龐伯特機器人不僅能夠輸出演算法模組,還能夠向其他行業輸出軟硬體合一的整體智慧解決方案。透過演算法、硬體、人的互動,完成一次人機共謀的大變革。

站在萬物智慧、人機共生的起點,不難預見人類和機器之間密切耦合的未來。與智慧生命夥伴共舞,是人類必然的未來。而目睹了龐伯特機器人的我們,也正在經歷種植AI的進行時。

過去的數年間,讓深度學習擺脫需要大量輸入和人工的有監督學習,一直是人類研究者努力的方向,為此推動了許多新的技術進展,比如:

藉助meta learning元學習演算法,機器獲得了“泛化”,能夠舉一反三,學習協同性地處理多種任務;

藉助Reinforcement Learning強化學習,機器懂得了“決策”,透過不斷地自我學習與回饋來抵達高階智慧。

而這些能“擬人”的機器學習方法,也讓AI獲得了前所未有的能力,打敗柯潔李世石的DeepMind阿爾法狗、在DOTA2中團滅人類電競選手的OpenAI Five、自動駕駛,乃至通用人工智慧AGI,都是透過讓機器模仿人類對世界的認知方式,以不斷探索、試錯、改進的方式,與環境進行實時互動,進而提高自己的能力。

天地有正氣,雜然賦流形。今天,龐伯特也試圖讓機器人“自行進化”,啟動了一場發球機器人教對打機器人打乒乓的“先鋒實驗”。

透過兩臺機器人之間的相互“較量”,讓機器人身處在一個不可預期的環境中,依靠人工智慧演算法平臺主動生成一些標記和標籤來做決策判斷,獨立解決多個非線性的邏輯問題,透過“行動-評價”的強化學習機制來改進自身,適應新的環境,從而發展機器人間的校驗標準。這會為成為機器人社會意識的起點嗎?

4-6月,龐伯特會在B站(@龐伯特)定期釋出機器人課堂的實時動態,不妨和我們一起去圍觀吧。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2683231/,如需轉載,請註明出處,否則將追究法律責任。

相關文章