Google盲人程式設計師講述軟體設計之路

發表於2012-01-16

來源:新京報

拉蒙的網路主頁上,第一句話是這麼寫的:“在網際網路上,沒有人知道你不是一條狗!”在接下來的頁面中,出現了很多他和導盲犬艾斯卡的照片。

從康奈爾到矽谷,從IBM、Adobe一直到Google公司,十幾年間,導盲犬艾斯卡一直陪伴著這位來自印度的程式設計師。“可惜,他現在已經13歲。老 了,我沒法帶著他長途旅行了。”帶著墨鏡的拉蒙遺憾地說。前段時間,他參加了北京舉行的Google創新論壇,成為了全場的焦點,很多人也是第一次想到這 麼一個問題:網際網路讓世界發生了翻天覆地的變化,那麼,它給盲人帶來了什麼?

天賦 復原盲人魔方世界第一人

“普通人的網際網路,和盲人的網際網路,是同一個網際網路。”拉蒙似乎很高興被問到這個問題。“這也是為什麼網際網路對於盲人來說是多麼重要,這個工具賜予了人們平等。”

“發電子郵件的時候,我們不會去關心對方用的什麼電腦,什麼鍵盤,螢幕是彩色的還是黑白的,只關心我們溝通了什麼內容。你編輯了一篇文章放在網上,你不會去關心閱讀你文章的人用的是PC還是移動裝置。在全球資訊網面前,沒有限制,沒有邊界。所有人都是平等的。”

坐在Google大樓的會議廳裡,一桌人將他團團圍住。拉蒙顯然是個重要人物,而他顯然也是所有人中最快樂的人物,從頭到尾,都在用笑話點綴著對話,永遠都有話說。

他的手也似乎一直閒不下來。扳手指的動作讓他看起來有些緊張。坐在旁邊的美籍華人查爾斯給他遞去一張紙。拉蒙放鬆了下來,邊聊天邊開始摺紙。查爾斯是和他最接近的同事,兩人共同設計著各種為盲人服務的軟體。在Google,人們往往把他們喊成“拉蒙和查爾斯”。

拉蒙出生在印度普納一個有六個孩子的中產階級家庭。哥哥也做軟體工程的。“在印度,你不是軟體工程師就是醫生。”他口音濃重,笑聲爽朗,似乎自己進入這個行業是一件理所應當的事。

Google盲人程式設計師講述軟體設計之路

從小,拉蒙就顯示出一些不同。如果在Youtube網站上輸入拉蒙的名字,可以看到他的一些視訊。拉蒙能在23秒內復原了盲文魔方,他是世界紀錄的保持 者。這是拉蒙年輕時最喜歡做的事情。再小一些的時候,比如15歲時,他剛因青光眼失去視力,幾乎每天都要玩一個解謎遊戲:通過日期,算出那天是星期幾。 “我從小就喜歡數學,喜歡解謎,可能是受哥哥影響。”他淡淡地笑道,“數學的興趣是天生的。老實說,不管怎樣我都會成為數學家。”

多年 後,有人向他提了這麼一個問題:看不見東西,那做數學題是什麼感覺?“我還真從來沒想過這個問題,一想才覺得真是有趣。”於是,他為此寫了一篇論文《數學 思考》,講述自己對數學的理解。他的核心想法是,數學遠比人們想象的要大得多,玩數學的習慣並不需要閱讀,而完全可以通過大腦心算來取得。

讀屏 語音是常人語速的3倍

在還沒有電腦的時代,學習對於盲人來說非常困難。儘管如此,拉蒙還是考入了印度最好的理工學校——印度理工學院,在這裡開始數學和電腦科學的碩士研究, 成為該校歷史上第一個盲人學生。他如何與那麼多優秀的青年學子一起求學?因為很多學生都被要求參與社會服務,所以他說服校長讓同學通過閱讀螢幕來幫助他學 習。有一個學期,多達13個同學志願幫助他朗讀螢幕,再由他用盲文進行記錄。

1989年,拉蒙來到美國康奈爾大學做電腦科學博士研究。情況發生了變化。那時候,盲人用計算機剛剛出現。拉蒙也得到了自己第一臺語音合成器和當時最先進的讀屏軟體。

不過,哪怕是世界上領先的讀屏器,面對文字只有一行,每行只有40個字的老式螢幕也沒有更多招數。拉蒙只能一個字一個字慢慢地聽。

好在過去幾十年裡,計算機技術發生了翻天覆地的變化。現在的顯示器可以漂亮地擺置60行字。而視覺障礙者使用電腦也已經不是什麼新鮮事了。今天,他們可以 很方便地藉助讀屏器閱讀電腦螢幕,瀏覽網際網路。因為聽覺特別,他現在使用的讀屏器,語音速度是正常語速的三倍。這個語速常常會讓普通人“不知所云”。

如果只是進行文字瀏覽,盲人在電腦上幾乎沒有障礙。他們幾乎可以像其他人一樣輕鬆地瀏覽網際網路資訊。上網檢視新聞是拉蒙每天的愛好之一。不過,與大部分人 漫無目的地通過超連結在網上閒逛的習慣不同,拉蒙更多地採用搜尋的方式,通過谷歌新聞組連結到有興趣的報紙文章,或者通過微博來找到有趣的東西。用他自己 的話說,就是讓朋友來做你的“編輯”,“過濾”出有趣的新聞給你讀。

數學 公式也可以閱讀

但在網路上,還有很多資訊,其結構是為視覺而設計的。一些我們每天都離不開的計算機操作,對於無法讀圖的人卻構成了巨大的障礙。如何將這些資訊轉化為主要依賴於聽覺的盲人能夠接受的訊號,這成為了拉蒙一直以來的主要工作。

就拿簡單的電子郵件來說,“我們習慣於看到發信人欄,收信人欄,回覆、轉發、正文等欄。我們讀的時候只會讀‘這是拉蒙給查爾斯的一封信’,你眼睛一掃很快 就看出是誰給誰的信。”拉蒙說,“這所有的結構設計都是為了讓眼睛更方便。但是如果你用這個格式拿來讀的話就變成‘發信人欄拉蒙,收信人欄查爾斯,標題如 何如何,正文如何如何’這就非常沒效率了。”

還在康奈爾做博士時,拉蒙就設計出一些專為盲人辨別電子郵件各資訊,甚至報紙報導標題的系統。

閱讀文字解決了,但閱讀數學公式卻成為另一個難題。“再偉大的數學家,也需要閱讀其他數學家的東西。”他笑說。數學滿是符號和公式,用的是一種名為 LaTeX的排版系統。在上世紀90年代初的時候,讀屏器在這個系統中讀出來的數學公式簡直讓人抓狂。你能聽到一堆這樣的聲音:“E反斜槓反斜槓X插入符 號某某……”這樣的讀法是荒唐的,於是拉蒙決定重寫LaTeX,讓自己以及其他視障者都可以順利閱讀數學公式。這個研究成了他在康奈爾大學的博士畢業論 文,也讓他一直使用至今。

說來有趣,當決定博士論文題目的時候,拉蒙最先想做的是製造出具有導航效能的機器人導盲犬。他花了9個月的時間 投身其中。因為非常瞭解自己的導盲犬,他一開始很有自信能夠做出來。但很快,一個不可逾越的困難卻出現了。難題並不在導航上,而是出現在如何製造一個能應 付人行道、臺階、雪地、冰地等各種地面的機器人。20年之後,人類已經有了可以走在火星上的機器人,可是這樣的“萬能型機器人”還是沒有出現。

影像 手機“看”世界

不過,拉蒙還是讓盲人也享受到了導航的便利。他拿出自己的手機,向記者展示智慧的北京地圖,隨著他的手指的移動,語音快速地提示出走在哪條街,走了多少 路,前方是什麼路,還有多少距離到達目的地等資訊。現在的拉蒙,只要一部手機給自己導航,一隻愛狗給自己掃除路障,哪怕身在北京這樣的陌生城市,也不會迷 路。

現在,拉蒙的工作焦點放到了圖片識別上。這是“盲閱讀”最難的一部分。“所有的格式都是資訊。資訊越多,結構也越多;結構越多,你就 越能從中組織,處理這些資訊。”拉蒙說,“閱讀圖片是最難的,給你一幅《蒙娜麗莎的微笑》,說‘這是一個女人微笑的畫’。這並不能告訴你這是蒙娜麗莎,它 的資訊複雜得多。”地圖其實就是圖片,不過它是有結構的圖片,各種道路、街道、大樓等資訊組成了可以處理的資料。拉蒙和查爾斯開發的手機地圖軟體已經造福 於很多人。當然,它現在還沒到完美的程度,還有一些問題需要解決,比如,目的地大樓的入口在哪兒,進了大樓裡面怎麼辦,這都需要更多的資料讓工程師來設 計。

拉蒙說,現在另一個小組正在做一個通過手機“看”地貌的軟體。通過手機攝像機拍下路上遇到的一些事物比如路牌,行人等,手機可以對照片進行分析,然後告訴使用者“看”到了什麼東西。

今天,網際網路進入了雲時代。他認為,這是視障者的福音。以前的視障人士,走出門外和鄰居打招呼都很難。但現在他們可以坐在家裡,和地球另一邊的人直接溝 通。“對於其他人來說,技術只是帶來了更快捷便利的生活,但對於殘疾人來說,他們本來做不了這些事情,但技術卻讓他們可以做這些事了,他們對技術的掌握反 而比普通人更快。”相比以前動輒上百美元的讀屏軟體,今天出現了很多開源軟體,人們都可以免費下載使用。對於殘疾人來說,雲時代的網際網路就像給他們聽、 讀、寫能力的延伸。而對於拉蒙來說,更重要的是,科學的發展是建立在別人研究基礎上,軟體技術也是一樣,只有通過開源,才能站在巨人的肩膀上,讓技術的發 展煥發活力。

相關文章