NLP自然語言理解-中科院(宗成慶) P1~P4

u010070587發表於2018-09-22

自然語言:人類語言,人類歷史發展過程中所產生的;
機器翻譯、網路安全文字挖掘;
俠義:自然語言到機器內部的一種對映;
在這裡插入圖片描述
在這裡插入圖片描述
被動統計語言存在的規律,主動讓計算機完成某樣功能,為人類提供服務。機器翻譯、資訊檢索、自動形成Summary;
應用:機器翻譯、資訊檢索、自動文摘、問答系統、資訊過濾、資訊抽取(屬於關聯、關係)、文件分類(情感文字的分類)、文字編輯和自動校對、語言教學和文字識別、語音識別(語音->文字)、語音合成(文字->語音)、說話人識別;
在這裡插入圖片描述
完美的理論體系以及實用的技術;
NLP發展中的基本問題:
(1)形態學(詞、詞素)
分詞,詞的邊界;詞的構成規律和詞的識別方法;西方語言詞尾變化如何還原到原型;
(2)語法學問題;
句子為什麼這樣寫,語法規律,建立快速有效的句子結構的分析方法;
(3)語義問題(根本問題)
語義的理解;由詞的意義推演到句子的意義;
(4)語用學問題;
一句話在不同的上下文中,不同語言環境,不同的含義;特定環境的含義;
(5)語音學問題
發聲的規律,發聲的特點,聲音和文字的對應關係;
NLP發展中的主要困難:
(1)大量歧義現象。
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
(2)大量未知語言現象;
記錄語言習得的過程,分析語言學習的過程;
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述

在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
中間需要大量的知識庫、語料庫做支撐;
在這裡插入圖片描述
基於關鍵詞的搜尋引擎;
在這裡插入圖片描述
資訊理論、數學中的工具、方法處理自然語言;
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述在這裡插入圖片描述
在這裡插入圖片描述
統計方法需要大量資料的支撐;

相關文章