自然語言處理領域的進展(六、七)講者狀態的分析與生成、結論與展望

哈工大SCIR發表於2017-04-17

本文譯自:Julia Hirschberg, Christopher D. Manning. Advances in Natural Language Processing. Science Magazine 2015. vol. 349 no. 6245 (261-266). 譯者:李盛秋、袁建華(哈工大SCIR碩士生)

講者狀態(Speaker State)的分析與生成

講者狀態[54],也叫作“私人狀態”[55],包含了說話的人或寫作的人的意見、思考、信仰、情緒以及其他的個人觀點。在NLP領域,很多工作都在關注基於詞法和語法的情感分析(即判斷文字的正負傾向性)和確信程度判別(包括確信、不確信、中性。譯註:即講者對所表述事件的確定程度)。情感和確信程度構成了對待事件或命題的態度,其中情感的物件還可以是人、機構或是抽象概念。對文字中的情感和情緒的檢測需要利用詞法和句子級別的資訊。情感可以由帶有正面或負面傾向的詞語來表達,例如“傷心”、“著急”、“困難”、“無助”都表達了負面傾向,而“舒服”、“重要”、“成功”、“有趣”等詞則表達出了正面的情感。線上情感詞典(例如Whissel’s Dictionary of Affect[56])、以及通過人工主觀排序?(subject-ranked)得到的詞典系統(例如Tausczik and Pennebaker’s LIWC(Linguistic Inquiry and Word Count)[57])可以用來評估文字中正面、負面情感。更復雜的情感分析方法還會尋找文字中情感的持有者(來源)與物件,例如是誰對某人、某個活動或某個概念持有正面情感[55]。

 

語音領域同樣對語音中的正負面傾向有所研究,一般更關注積極和消極情緒的識別,主要利用聲學及韻律資訊。不過,如今更多的工作集中在判斷出具體的情緒,例如Ekman的經典六類基本情緒(憤怒、反感、恐懼、高興、悲傷和驚奇),這些情緒都可能是人們對事件、命題、或其他物件的反應。還有大量的研究使用一些已被證明在識別經典情緒任務上很重要的特徵來判斷講者狀態(例如是否存在欺詐)、健康狀況(例如是否患有孤獨症、帕金森綜合徵)、講者特徵(例如年齡、性別、魅力、病理、個性等)、講者狀態(例如認知負荷、是否醉酒、是否有睏意、興趣、確信程度等)。從2009年開始舉辦的Interspeech Paralinguistic Chanllenges提供了用於這些研究的語料庫。情緒生成已經被證明了是要比語音合成更加困難的挑戰。雖然已經有一些系統(例如MARY)嘗試生成情緒語音,例如沮喪、敵對、高興等[58],但是目前最好的合成情緒語音仍然是由那些聲音模仿方面的高手模仿出來的。

 

情感分類在各個語言和領域中被廣泛應用於觀點識別任務(對於人物、機構或思想等的褒貶觀點)。這樣的應用很多,比如識別電影或產品評論的褒貶[59],[60]、利用國會記錄預測投票情況[61]、從法庭記錄來預測最高法院的判決等。圖5描繪了一段比較典型的飯店評論,標註為正面、負面和中性情感,以及一些基本的情緒。

自然語言處理領域的進展(六、七)講者狀態的分析與生成、結論與展望

圖5.人工標註的飯店評論分析樣例

社交媒體中挖掘情感或經典情緒是目前比較火熱的話題,例如利用Twitter估計“大眾情緒”、預測股票市場趨勢,或是簡單估算一個社群的精神狀態[62]。諸如Twitter、部落格、論壇等形式的社交媒體同樣給研究人員帶來了大量的資料,用於研究情感和情緒在識別語言學、社會學現象(例如諷刺[63]、權利關係、社會影響[64])以及精神健康問題(例如抑鬱症[65])任務上所起的作用。

結論與展望

過去五十年間,熱情的研究人員曾多次過高地期望像科幻電影中機器人那般的語言理解能力很快會實現。但是事實上,那時的語音和語言理解效果不夠好,不足以驅動主流的應用程式。不過在過去的五年中,形勢發生了巨大的變化。語音識別效果的巨大提升使得對手機說話變得很常見,尤其對年輕人而言。Web搜尋引擎在理解複雜查詢任務上越來越成功,機器翻譯儘管目前還不能產生人工質量的翻譯結果,但是至少能給出另一個語言材料的大意。計算機系統基於對公司報導中的情感資訊自動地進行股票和期貨交易。結果就是,如今在對人類語言技術的有效利用上存在巨大的商業價值,尤其因為在與手機互動時自然語言提供了非常自然的互動介面。短期而言,我們有信心:更多的資料和計算,加上近來在機器學習和深度學習領域的技術進步,會促成自然語言處理長遠、持續的發展。但是,解決真正困難的語義、上下文和知識的問題或許還需要在語言學和推理學科的新發現。從這個角度值得注意的是,語言的概率方法的開發不僅僅是去解決工程問題:語言的概率模型同樣會反映回(been reflected back into)語言科學來。在那裡,科研人員正不斷髮現重要的新應用來描述音韻學[66]、理解人類語言處理過程[67]和建模語言的語義及語用[68]。語言學的許多領域自身在方法上正變得更加具有實證性、也更加量化。

REFERENCES AND NOTES 

[54]. J.Liscombe, thesis, Columbia University (2007).

[55]. J. Wiebe, T. Wilson, C. Cardie, Lang. Resour. Eval. 39, 165–210 (2005).

[56]. C.Whissell, “The dictionary of affect in language,” in Emotion:

Theory,Research and Experience, R. Plutchik, H. Kellerman,

Eds.(Academic Press, London, 1989).

[57]. Y.R.Tausczik, J.W.Pennebaker, J.Lang.Soc.Psychol.29,24–54(2010).

[58]. O. Türk,M. Schröder, IEEE Trans. Audio Speech Lang. Proc. 18,

965–973(2010).

[59]. B. Pang, L. Lee, S. Vaithyanathan, “Thumbs up? Sentiment

classificationusing machine learning techniques,” in Proceedings of the 2002 Conference onEmpirical Methods in Natural Language Processing, Philadelphia, PA, July 2002(Association for Computational Linguistics, Stroudsburg, PA, 2002), vol. 10,pp. 79–86.

[60]. H. Wang, M. Ester, “A sentiment-aligned topic model for product aspect ratingprediction,” in Proceedings of the 2014 Conference on Empirical Methods inNatural Language Processing, Doha, Qatar, 25 to 29 October 2014 (Associationfor Computational Linguistics, Stroudsburg, PA, 2014), pp. 1192–1202.

[61]. M.Thomas, Bo Pang, L. Lee, “Get out the vote: Determining support or oppositionfrom Congressional floor-debate transcripts,” in Proceedings of the 2006Conference on Emprical Methods in Natural Language Processing, Sydney,Australia, 22 to 23 July 2006 (Association for Computational Linguistics,Stroudsburg, PA, 2006), pp. 327–335.

[62]. J. Bollen, H. Mao, A. Pepe, “Modeling public mood and emotion: Twitter sentiment andsocio-economic phenomena,” Proceedings of the Fifth International AAAIConference on Weblogs and Social Media, Barcelona, Spain, 17 to 21 July 2011(AAAI Press, Menlo Park, 2011), pp. 450–453.

[63]. R.Gonzalez-Ibanez, S. Muresan, N. Wacholder, “Identifying sarcasm in Twitter: Acloser look,” in Proceedings of the49th Annual Meeting of the Association forComputational Linguistics, Portland, Oregon, 19 to 24 June 2011 (Associationfor Computational Linguistics, Stroudsburg, PA, 2011), pp. 581–586.

[64]. O. Biran, S. Rosenthal, J. Andreas, K. McKeown, O. Rambow, “Detecting influencers inwritten online conversations,” in Proceedings of the 2012 Workshop on Languagein Social Media, Montreal, Canada, 7 June 2012 (Association for ComputationalLinguistics, Stroudsburg, PA, 2012), pp. 37–45.

[65]. L.-C. Yu, C.-Y. Ho, “Identifying emotion labelsfrom psychiatric social texts using independent component analysis,” inProceedings of COLING 2014 (Technical Papers, Association for ComputationalLinguistics, Stroudsburg, PA, 2014), pp. 837–847.

[66]. B. Hayes,Z. Londe, Phonology 23, 59–104 (2006).

[67]. R. Levy,Cognition 106, 1126–1177 (2008).

[68]. N. D.Goodman, D. Lassiter, “Probabilistic semantics and pragmatics:

Uncertainty in language and thought,” in Handbook ofContemporary Semantics, C. Fox, S. Lappin, Eds. (Blackwell, Hoboken, NJ, ed. 2,2015).

本文來源於哈工大SCIR

原文連結點選即可跳轉

自然語言處理領域的進展(六、七)講者狀態的分析與生成、結論與展望

相關文章