自然語言處理領域熱點:博士論文致謝引熱議,達摩院語言模型重新整理紀錄

xmfgxm發表於2021-04-21

這兩天有兩個熱點事件,“讀到淚目的博士論文致謝”與“阿里達摩院釋出中文領域最大規模語言模型”,看似不相關的兩個新聞,其實有著千絲萬縷的關係,他們的紐帶就是自然語言處理技術。

讀到淚目的博士論文致謝

近日,一篇中科院博士論文致謝文章打動許多人,並在社交媒體上引發熱議。

全文如下:

我走了很遠的路,吃了很多的苦,才將這份博士學位論文送到你的面前。二十二載求學路,一路風雨泥濘,許多不容易。如夢一場,彷彿昨天一家人才團聚過。

出生在一個小山坳裡,母親在我十二歲時離家。父親在家的日子不多,即便在我病得不能自己去醫院的時候,也僅是留下勉強夠治病的錢後又走了。我十七歲時,他因交通事故離世後,我哭得稀裡糊塗,因為再得重病時沒有誰來管我了。同年,和我住在一起的婆婆病故,真的無能為力。她照顧我十七年,下葬時卻僅是一副薄薄的棺材。另一個家庭成員是老狗小花,為父親和婆婆守過墳,後因我進城上高中而命不知何時何處所終。如兄長般的計算機啟蒙老師邱浩沒能看到我的大學錄取通知書,對我照顧有加的師母也在不惑之前匆匆離開人世。每次回去看他們,這一座座墳瑩都提示著生命的每一分鐘都彌足珍貴。

人情冷暖,生離死別,固然讓人痛苦與無奈,而貧窮則可能讓人失去希望。家徒四壁,在煤油燈下寫作業或者讀書都是晚上最開心的事。如果下雨,保留節目就是用竹筍殼塞瓦縫防漏雨。高中之前的主要經濟來源是夜裡抓黃鱔、週末釣魚、養小豬崽和出租水牛。那些年裡,方圓十公里的水田和小河都被我用腳測量過無數次。被狗和蛇追,半夜落水,因蓄電瓶進水而摸黑逃回家中;學費沒交,黃鱔卻被父親偷賣了,然後買了肉和酒,都是難以避免的事。

人後的苦尚且還能克服,人前的尊嚴卻無比脆弱。上課的時候,因拖欠學費而經常被老師叫出教室約談。雨天溼漉著上課,屁股後面說不定還是泥。夏天光著腳走在滾燙的路上。冬天穿著破舊衣服打著寒顫穿過那條長長的過道領作業本。這些都可能成為壓垮駱駝的最後一根稻草。如果不是考試後常能從主席臺領獎金,順便能貼一牆獎狀滿足最後的虛榮心,我可能早已放棄。

身處命運的漩渦,耗盡心力去爭取那些可能本就是稀鬆平常的東西,每次轉折都顯得那麼身不由己。“幸運的是,命運到底還有一絲憐惜。進入高中後,學校免了全部學雜費,胡叔叔一家幫助解決了生活費。進入大學後,計算機終於成了我一生的事業與希望,胃潰瘍和胃出血也終與我作別。

從家出發坐大巴需要兩個半小時才能到縣城,一直盼著走出大山。他從炬光鄉小學、大寅鎮中學、儀隴縣中學、綿陽市南山中學到重慶的西南大學,再到中科院自動化所,我也記不清有多少次因為現實的壓力而覺得自己快扛不下去了。這一路,信念很簡單,把書念下去,然後走出去,不枉活一世。世事難料,未來註定還會面對更為複雜的局面。但因為有了這些點點滴滴,我已經有勇氣和耐心面對任何困難和挑戰。理想不偉大,只願年過半百,歸來仍是少年,希望還有機會重新認識這個世界,不辜負這一生吃過的苦。最後如果還能做出點讓別人生活更美好的事,那這輩子就賺了。

全文波瀾不驚,卻能直擊人心。有網友評論說,“他活成了這個世界的一束光”,是無數“寒門學子”的希望。也有人說“計算機專業才是寒門學子改變命運的機會”。

這篇致謝文章的論文是《人機互動式機器翻譯方法研究與實現》,作者黃國平,2017年畢業於中國科學院大學自動化研究所模式識別國家重點實驗室的工學博士,目前就職於騰訊人工智慧實驗室(騰訊AI Lab),研究方向為機器翻譯和輔助翻譯,且一直致力於機器翻譯與人工翻譯的深度融合,以期提高人工翻譯的效率,推動機器翻譯等人工智慧技術的產業落地。

機器翻譯是自然語言處理(NLP)的應用之一,自然語言處理(NLP)作為根植於語言學、電腦科學和數學等多種學科沃土而成長起來的多邊緣學科,成為人工智慧中亟需解決的任務之一,同時也是該領域的一個重要研究方向。自然語言處理的飛速發展,為機器翻譯研究提供了強有力的支援。

阿里達摩院釋出中文領域最大規模語言模型

就在博士論文致謝引發熱議的第二天,阿里達摩院釋出了中文領域最大規模的預訓練語言模型PLUG。PLUG全名為Pre-training for Language Understanding and Generation,PLUG集語言理解與生成能力於一身,在小說創作、詩歌生成、智慧問答等長文字生成領域表現突出。該模型引數規模達270億,是目前全球規模最大的中文純文字預訓練語言模型。並且在釋出後,PLUG重新整理了中文語言理解評測基準CLUE分類榜單歷史紀錄。

阿里達摩院語言技術實驗室負責人司羅稱:“達摩院NLP團隊將進一步攻克自然語言處理領域科研難題,完善中文及跨語言人工智慧基礎設施,讓AI沒有難懂的語言,並探索通用人工智慧之路。”

是的,PLUG也是自然語言處理(NLP)領域的研究。

PLUG 技術細節

自然語言處理(NLP)

自然語言處理(NLP)是當最熱門的研究領域之一,推動著語言智慧的持續發展和突破,並越來越多地應用於各個行業。正如國際知名學者周海中先生曾經所言:“自然語言處理是極有吸引力的研究領域,它具有重大的理論意義和實用價值。”

自然語言處理(NLP)也是人工智慧中最為困難的問題之一。美國微軟公司創始人比爾·蓋茨先生曾經表示,“語言理解是人工智慧領域上的明珠”。

自然語言處理還有哪些應用方向?

自然語言處理主要應用於機器翻譯、輿情監測、自動摘要、觀點提取、文字分類、問題回答、文字語義對比、語音識別、中文OCR等等方面。

自然語言處理(NLP)的十大應用

不得不提的是,51雲監測的錯別字和敏感詞監測系統,也是自然語言處理應用之一。幫助網站檢測本文中的錯別字詞和敏感詞,給出正確詞語,尤其特定語境下的表述問題,比如政務領域中對領導人的特定稱謂表述錯誤等等,51雲監測就會給出正確的表述,這裡需要強大的自然語言處理技術和豐富的漢語詞庫。

無論是中科院博士研究的機器翻譯,阿里達摩院釋出的預訓練語言模型,還是51雲監測的錯別字和敏感詞監測系統,都是自然語言處理(NLP)技術應用在不同場景中的研究,這些技術的最終目的是在改善人們的生活,提升中國的科技力量。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/30194373/viewspace-2769075/,如需轉載,請註明出處,否則將追究法律責任。

相關文章