人體輔助,AI落地的另一種可能

AIBigbull2050發表於2019-12-20

想要實現殘障人士的“殘而不障”,人體輔助是一條被忽略的垂直賽道,這也是AI落地的一種可行方式。

(說明:本文並非創業報導,而是對具體場景的需求分析。為避免產生相關誤解,已將相關公司、產業和業務名全部去除)

近期,《時代週刊》公佈了2019年的100大最佳發明。

最引人注目的一欄是“Accessibility”、人體輔助功能。這一專案裡,由會說話的AI助聽器、眼控技術、智慧手杖、智慧假肢、視聽轉換等。

當人工智慧還是很多上市公司哄抬的概念、vc口中的風口、專家手中的炫技、自媒體們筆下渲染的惶恐未來時,有一些人已經開始做出實際的行動,瞄準的是一個痛得不能再痛的垂直痛點。

在大洋的另一端的中國,同樣的專案和故事開始上演,先來看兩個案例。

小雨(化名,以下同)是一個配音演員,患有視力障礙,平日裡卻在運營微信公眾號,這是如何做到的?

曾幾何時,小雨是一個風華正茂、前途一片光明的大學生,彈了十多年鋼琴,正在考駕照,愛好戲劇和表演,喜歡畫水彩,對未來充滿想象。

但是命運卻在剎那急轉,起因是瞳孔出血,接著是一次小手術的失敗引發了不可逆轉的後果,作為一個彈慣了肖邦莫扎特、心靈手巧的女孩子,忽然間鋼琴上的按鍵她一個都看不清了,那一年她才19歲。

她撕光了所有畫不下去的水彩畫,把看見看不見的東西踢得粉碎,帶著對這個世界滿滿的恨意。

小雨是不幸的,但是她很倔強。在混沌迷茫的世界裡,她依然保持著蒐羅各種劇本的愛好,開始給其中的人物配音,但是劇本上密密麻麻的小字,如何看得清?

好在一些螢幕閱讀軟體可以把文字轉化成聲音,諸如訊飛輸入法這樣的APP,可以精準地把語音轉化成文字,這樣她每一個新奇的點子都不會忘掉了。

就這樣,在視覺墮入混沌之後,“聲音文字的互轉”成了她和世界互動的關鍵紐帶。

她給動漫配音的事業很快走上軌道,一邊運營起了視障主題的公眾號,她還是那個激情洋溢的女孩,她很堅強。

這是一個溫暖的案例。

在中國,大約有6000萬肢體障礙、視力障礙和聽力障礙者,更廣義的殘障人群則達到了總人口的6%。人工智慧技術正在幾個方向上迅速突破,致力於解決他們面臨的核心問題:

一是如何讓他們看見?

透過文字識別技術,看不清的文字都可以轉為語音。透過影像識別技術,看不清的人或事也可以轉化為語音的描述。

二是如何讓他們書寫?

透過語音語義的識別,他們的聲音可以轉換成文字。

三是如何讓他們更方便地生活?

這裡有很多細節。比如常見的網站登入影像驗證,需要滑動拼圖驗證碼,他們怎麼辦?常見的人臉識別需要眨眼睛,他們怎麼辦?

當然,這些技術在發展中依然面臨諸多困境,文字識別往往需要視障人士拍照聚焦、可他們怎麼聚焦?很多不規範的手寫字能不能識別出來?語音語義的識別能否絕對準確,方言能不能聽得懂?

在廣東,殘障人士有一個練習溝通表達的表達社,表達社裡出了一個“最佳辯手”。這個男生擔綱三辯,可以和正常人唇槍舌戰,儘管他是一個聾子,聽不見任何聲音。

聽不見任何聲音,包括自己的說話聲,如何與常人辯論呢?

換一個角度說,在中國約有2.1億人患有聽力障礙,其中7200萬人患有中等以上聽力障礙,透過助聽器、人工耳蝸獲得有效助聽服務的只有2.5%。

好在AI迅猛發展,人們有了很多辦法,比如開發專業的聽力障礙APP,可以有這樣的功能:

  • 字幕聊天,別人說的話(線下、影片)可以即時轉化為文字,這樣一來就交流無障礙了。
  • 語言康復訓練,透過語音識別、合成和評測,幫助聽障人士重新開口,練習普通話,透過拼音、詞語、句子、文章循序漸進。

比如廣州的這位最佳辯手,就是透過專門的APP實現了與正常人的話語交鋒,對方辯友的聲音都第一時間轉化為文字,而長期語言康復訓練的他已經可以直接“回懟”了。即便張開口來,聲音還不夠標準、自然,但這已經是非常了不起的一步了。

圍繞這個人群,還有另一個困境:聾啞人士常常透過手語交流,但是對普通大眾來說,手語有如天書。在美國,手語翻譯的比例是1:120,但是在中國,這個比例遠遠小於1:10000。

這樣一個痛點該怎麼解決?

國內的公司已經進行了很多探索,一個解決方案是智慧手環,聾啞人士戴上後,手環可以自動識別跟蹤人手的肌肉訊號,把手勢轉化為文字和動圖。

但是面前有兩大疑難:

  1. 一是需要龐大的手語資料庫,這不是一朝一夕可以完成的;
  2. 二是如何適應聾人手語與眾不同的語序,如何區分同一動作在不同語境和表情下的不同含義,是否引入自然語言處理的演算法?

在《時代週刊》的榜單中,可以看到這樣一些案例:

orcam myeye2這樣的輔助攝像頭,可以直接夾在使用者的眼鏡上,只要用手指指向想看的東西,裝置就可以讀取上面的內容,不僅有文字,還可以識別人臉和物體顏色。

wewlk智慧手杖內建感測器、揚聲器、語音助手和導航,還能用超聲波檢測胸部上方的障礙物並震動警告。

智慧假肢更是將腦機介面推向落地,使用者可以直接像手一樣控制,且假手具備感知能力和自主智慧。樹洞行動發起人黃智生說:“人工智慧技術的進步所取得的經濟效益要充分導流到弱勢群體那邊,讓他們充分受益。”

殘障人士是不幸的,命運無情剝奪了他們與常人共處的一些能力。但萬幸在這個時代,人工智慧技術的突進正在打破藩籬、填平溝壑,於是一些歷史上不可想象的事情發生了。

  1. 其一,文字轉語音,影像識別轉語音,視覺障礙人士可以“聽到”更多了。
  2. 其二,語音轉文字,手勢轉語音,聾啞人士可以與正常人交流了。
  3. 其三,對於肢體殘障人士,智慧聲控輪椅正在成為一種新的可能。

圍繞“無障礙”的目標,人工智慧領域的大公司在行動。

騰訊發起“資訊無障礙”行動,視障使用者可以用聲紋加好友,圖片語音描述功能可以幫助他們“看見”圖片,並且圍繞語言障礙人士身份認證需求最佳化粵事省小程式。

阿里釋出助殘報告,17萬殘疾人在淘寶天貓開店,三年銷售額近300億,阿里巴巴達摩院與清華大學人機互動實驗室推出了為盲人研發的智慧手機膜。

17年以來,科大訊飛釋出了“三聲有幸”公益計劃,從資金到技術,對涉及殘障人士的專案進行扶持,對很多語音文字互動的專案無保留地開放底層技術。在1024開發者節上,相關的技術和案例展示感動了很多人。

在國外,亞馬遜、谷歌和蘋果的智慧音響成為殘障人士的福音,自動駕駛的技術推進也為殘疾人的出行帶來新的助力。

“雖殘不障”正在成為現實,但是這一程式的演進仍然緩慢,人體輔助是一條被忽略的垂直賽道,產品和商業模式卻非常清晰,討論這一公益領域的商業構成本身並不違和。

從市場前景看,基於AI的人體輔助是康復醫療行業的未來。根據前瞻產業預測,2022年康復醫療行業的市場規模將達到1033億元。

從需求和產品模式看,人體輔助的解決方案正在迅速成熟,針對的就是殘障人士日常生活溝通的需求和痛點,更像是盲杖、助聽器和義肢的智慧升級,其使用效果伴隨著資料積累和演算法迭代不斷升級。

從行業前景看,殘障人士的“殘而不障”將與更多的新技術結合,與物聯網技術結合帶來更多的智慧硬體和可穿戴裝置,與機器人技術結合帶來更多的陪伴和康復機器人,與VR結合實現更多的情境模擬訓練。

當然,基於AI的人體輔助也面臨著比較顯著的問題:涉及的演算法和資料要求較高,不是一般創業公司可以hold住的。

或許一個比較好的模式是:由政府牽頭、大公司參與,去完成一些底層基礎設施和資料庫的構建,比如語音影像手勢的底層資料、語義分析的演算法,並對外開源,比如訊飛、百度的開放平臺;由更加垂直的創業公司去深挖,研發出更多兼具針對性和價格低廉的解決方案。







來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946223/viewspace-2669712/,如需轉載,請註明出處,否則將追究法律責任。

相關文章