自然語言處理 NLP 基本概念大全,讓非技術也能看懂 NLP

AIBigbull2050發表於2019-09-20

easyai.tech 發現入門人工智慧是一件很難的事情,尤其是對於非技術人員。

於是我們將國內外優秀的科普內容用最通俗易懂的方式整合到一起,專門針對非技術人員,讓大家都能理解人工智慧領域裡的基本概念。

自然語言處理 NLP 基本概念大全,讓非技術也能看懂 NLP

讓非技術也能理解 NLP

本篇內容則是 NLP 的專題,我們彙總了一些關於 NLP 的基礎內容,相信大家看完本篇內容後可以理解下面幾個問題:

  1. NLP 是什麼,為什麼大家要研究 NLP ?
  2. 研究和應用 NLP 的目的是什麼?
  3. NLP 在實際應用中會用到哪些方法,大概有哪些步驟?

由於是針對非技術人群的,所以內容裡不會涉及到程式碼或者大量的技術概念,不需要有技術基礎同樣可以看明白。

NLP 裡的一些重要概念

自然語言處理 NLP 基本概念大全,讓非技術也能看懂 NLP

自然語言處理 – NLP

NLP 就是人類和機器之間溝通的橋樑!這個部分會講解 NLP 的重要性,研究 NLP 的目的,NLP 的應用方向,NLP 的大致方法和流程等內容,讓大家對 NLP 有一個宏觀的認識。

瞭解詳情:《 一文看懂自然語言處理-NLP(4個典型應用+5個難點+6個實現步驟)

自然語言理解 – NLU

自然語言理解就是希望機器像人一樣,具備正常人的語言理解能力,由於自然語言在理解上有很多難點(下面詳細說明),所以 NLU 是至今還遠不如人類的表現。

瞭解詳情:《 一文看懂自然語言理解-NLU(基本概念+實際應用+3種實現方式)

自然語言生成 – NLG

NLG 是為了跨越人類和機器之間的溝通鴻溝,將非語言格式的資料轉換成人類可以理解的語言格式,如文章、報告等。

瞭解詳情:《 一文看懂自然語言生成 - NLG(6個實現步驟+3個典型應用)

分詞 – Tokenization

分詞是自然語言理解 – NLP 的重要步驟。分詞就是將句子、段落、文章這種長文字,分解為以字詞為單位的資料結構,方便後續的處理分析工作。

瞭解詳情:《 一文看懂NLP裡的分詞(中英文區別+3 大難點+3 種典型方法)

詞幹提取 – Stemming | 詞形還原 – Lemmatisation

詞幹提取和詞形還原是英文語料預處理中的重要環節。雖然他們的目的一致,但是兩者還是存在一些差異。本文將介紹他們的概念、異同、實現演算法等。

瞭解詳情:《 一文看懂詞幹提取和詞形還原(基本概念、異同、主流演算法)

詞性標註 – Part of speech

本文根據自己的學習過程以及查閱相關資料的理解,對自然語言基礎技術之詞性標註進行了相對全面的簡紹,包括定義、目前的難點以及常見方法,還推薦了一大波python實戰利器,並且包括工具的用法。

瞭解詳情:《 一文看懂詞性標註(基本概念+4種方法+7種工具)

命名實體識別 – Named-entity recognition | NER

命名實體識別(Named Entity Recognition,簡稱NER),又稱作“專名識別”,是指識別文字中具有特定意義的實體,主要包括人名、地名、機構名、專有名詞等。簡單的講,就是識別自然文字中的實體指稱的邊界和類別。

瞭解詳情:《 一文看懂NLP裡的命名實體識別 - NER(發展史+4類方式+工具推薦)



來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946223/viewspace-2657671/,如需轉載,請註明出處,否則將追究法律責任。

相關文章