面向機器智慧的TensorFlow實戰8:序列分類
序列分類的任務是為整個輸入序列預測一個類別標籤。在許多領域中,包括基因和金融領域,這樣的問題都極為常見。NLP中的一個突出例子是情緒分析。
使用國際電影資料庫的影評資料集,該資料集的目標值是二元的---正面的和負面的。將逐個單詞地檢視每條評論。依據最後的那個單詞的活性值,將訓練一個用於預測整條評論的情緒的分類器。由於是按照端到端的方式訓練模型,RNN將從單詞中收集那些對於最終分類最有價值的資訊,並進行編碼。
Imdb影評資料集:http://ai.stanford.edu/~amaas/data/sentiment/,它是一個經過壓縮的tar文件,其中正面的和負面的評論可從分列於兩個資料夾中的文字檔案中獲取。利用正規表示式提取純文字,並將其中的字母全部轉換為小寫。
使用詞向量嵌入:詞向量嵌入表示比one-hot具有更豐富的語義。因此,如果使RNN工作在影評的被嵌入的而非one-hot的單詞上,則有助於RNN獲取更好的效能。
import bz2
import numpy as np
class Embedding:
def __init__(self, vocabulary_path, embedding_path, length):
self._embedding = np.load(embedding_path)
with bz2.open(vocabulary_path, 'rt') as file_:
self.vocabulary = {k.strip(): i for i, k in enumerate(file_)}
self._length = length
def __call__(self, sequence):
data = np.zeros((self._length, self._embedding.shape[1]))
indices = [self._vocabulary.get(x, 0) for x in sequence]
embedded = self._embedding[indices]
data[:len(sequence)] = embedded
return data
def dimensions(self):
return self._embedding.shape[1]
序列標註模型:
相關文章
- 面向機器智慧的TensorFlow實戰5:目標識別與分類
- 面向機器智慧的TensorFlow實戰2:TensorFlow基礎
- 面向機器智慧的TensorFlow實戰1:安裝
- 面向機器智慧的TensorFlow實戰7:詞向量嵌入
- 面向機器智慧的TensorFlow實戰4:機器學習基礎機器學習
- 面向機器智慧的TensorFlow實戰6:迴圈神經網路與自然語言處理神經網路自然語言處理
- 基於sklearn的分類器實戰
- Spark機器學習實戰 (十一) - 文字情感分類專案實戰Spark機器學習
- TensorFlow釋出面向JavaScript開發者的機器學習框架TensorFlow.jsJavaScript機器學習框架JS
- 【機器學習No.1】Tensorflow智慧之別衣帽種類模型機器學習模型
- 【TensorFlow】 TensorFlow-Slim影像分類模型庫模型
- ModelSerializer序列化器實戰
- 「影像分類」 實戰影像分類網路的視覺化視覺化
- JavaScript玩轉機器學習-Tensorflow.js專案實戰JavaScript機器學習JS
- 使用 TensorFlow Hub 和估算器構建文字分類模型文字分類模型
- 人工智慧中的文字分類:技術突破與實戰指導人工智慧文字分類
- TensorFlow2.0教程-文字分類文字分類
- Tensorflow 1.x 影象分類
- Tensorflow 1.x 影像分類
- 機器學習框架ML.NET學習筆記【6】TensorFlow圖片分類機器學習框架筆記
- 五分鐘k8s實戰-Istio 閘道器K8S
- Pytext實戰-構建一個文字分類器有多快文字分類
- 基於Tensorflow + Opencv 實現CNN自定義影像分類OpenCVCNN
- 機器學習實戰(三)決策樹ID3:樹的構建和簡單分類機器學習
- Pytorch實現分類器PyTorch
- 機器學習常用的分類器比較機器學習
- 圖卷積實戰——文字分類卷積文字分類
- 智慧對話機器人實戰視訊教程機器人
- 【機器學習】支援向量機分類機器學習
- 機器學習(8)——其他聚類機器學習聚類
- Scikit-Learn 與 TensorFlow 機器學習實用指南學習筆記2 — 機器學習的主要挑戰機器學習筆記
- 計算機視覺—人臉識別(Hog特徵+SVM分類器)(8)計算機視覺HOG特徵
- 使用自己的資料集訓練MobileNet、ResNet實現影象分類(TensorFlow)
- 倉庫智慧分揀機器人RFID,如何實現分揀工作機器人
- 【機器學習】--xgboost初始之程式碼實現分類機器學習
- 使用PaddleFluid和TensorFlow實現影像分類網路SE_ResNeXtUI
- 使用PaddleFluid和TensorFlow實現影象分類網路SE_ResNeXtUI
- 破解垃圾分類難題,智慧分類如何實現最優解?