面向機器智慧的TensorFlow實戰8:序列分類
序列分類的任務是為整個輸入序列預測一個類別標籤。在許多領域中,包括基因和金融領域,這樣的問題都極為常見。NLP中的一個突出例子是情緒分析。
使用國際電影資料庫的影評資料集,該資料集的目標值是二元的---正面的和負面的。將逐個單詞地檢視每條評論。依據最後的那個單詞的活性值,將訓練一個用於預測整條評論的情緒的分類器。由於是按照端到端的方式訓練模型,RNN將從單詞中收集那些對於最終分類最有價值的資訊,並進行編碼。
Imdb影評資料集:http://ai.stanford.edu/~amaas/data/sentiment/,它是一個經過壓縮的tar文件,其中正面的和負面的評論可從分列於兩個資料夾中的文字檔案中獲取。利用正規表示式提取純文字,並將其中的字母全部轉換為小寫。
使用詞向量嵌入:詞向量嵌入表示比one-hot具有更豐富的語義。因此,如果使RNN工作在影評的被嵌入的而非one-hot的單詞上,則有助於RNN獲取更好的效能。
import bz2
import numpy as np
class Embedding:
def __init__(self, vocabulary_path, embedding_path, length):
self._embedding = np.load(embedding_path)
with bz2.open(vocabulary_path, 'rt') as file_:
self.vocabulary = {k.strip(): i for i, k in enumerate(file_)}
self._length = length
def __call__(self, sequence):
data = np.zeros((self._length, self._embedding.shape[1]))
indices = [self._vocabulary.get(x, 0) for x in sequence]
embedded = self._embedding[indices]
data[:len(sequence)] = embedded
return data
def dimensions(self):
return self._embedding.shape[1]
序列標註模型:
相關文章
- 面向機器智慧的TensorFlow實戰5:目標識別與分類
- 面向機器智慧的TensorFlow實戰2:TensorFlow基礎
- 面向機器智慧的TensorFlow實戰1:安裝
- 面向機器智慧的TensorFlow實戰4:機器學習基礎機器學習
- 面向機器智慧的TensorFlow實戰7:詞向量嵌入
- 面向機器智慧的TensorFlow實戰6:迴圈神經網路與自然語言處理神經網路自然語言處理
- 基於sklearn的分類器實戰
- 「影像分類」 實戰影像分類網路的視覺化視覺化
- ModelSerializer序列化器實戰
- 人工智慧中的文字分類:技術突破與實戰指導人工智慧文字分類
- 五分鐘k8s實戰-Istio 閘道器K8S
- 【TensorFlow】 TensorFlow-Slim影像分類模型庫模型
- 【NLP】TensorFlow實現CNN用於文字分類(譯)CNN文字分類
- 智慧對話機器人實戰視訊教程機器人
- 使用 TensorFlow Hub 和估算器構建文字分類模型文字分類模型
- 圖卷積實戰——文字分類卷積文字分類
- 《機器學習實戰》基於樸素貝葉斯分類演算法構建文字分類器的Python實現機器學習演算法文字分類Python
- Pytext實戰-構建一個文字分類器有多快文字分類
- Spark機器學習實戰 (十一) - 文字情感分類專案實戰Spark機器學習
- TensorFlow2.0教程-文字分類文字分類
- Tensorflow實現一個簡單的二分類問題
- 基於Tensorflow + Opencv 實現CNN自定義影像分類OpenCVCNN
- 【NLP】TensorFlow實現CNN用於中文文字分類CNN文字分類
- 計算機視覺—人臉識別(Hog特徵+SVM分類器)(8)計算機視覺HOG特徵
- Pytorch實現分類器PyTorch
- 基於Tensorflow影像分類模型的微服務模型微服務
- TensorFlow 實戰:Neural Style
- 破解垃圾分類難題,智慧分類如何實現最優解?
- 樸素貝葉斯分類-實戰篇-如何進行文字分類文字分類
- 倉庫智慧分揀機器人RFID,如何實現分揀工作機器人
- 計算機儲存器的分類及其特性計算機
- 62_索引管理_快速上機動手實戰修改分詞器以及定製自己的分詞器索引分詞
- 分類器
- 面向初學者的快速入門tensorflow
- TensorFlow釋出面向JavaScript開發者的機器學習框架TensorFlow.jsJavaScript機器學習框架JS
- 智慧機器人的快速實現機器人
- Java8虛擬機器(JVM)記憶體溢位實戰Java虛擬機JVM記憶體溢位
- TensorFlow2基礎:CNN影像分類CNN