面向機器智慧的TensorFlow實戰8：序列分類

CopperDong發表於2018-05-26

原文網址 : https://blog.csdn.net/qfire/article/details/80464104

序列分類的任務是為整個輸入序列預測一個類別標籤。在許多領域中，包括基因和金融領域，這樣的問題都極為常見。NLP中的一個突出例子是情緒分析。

使用國際電影資料庫的影評資料集，該資料集的目標值是二元的---正面的和負面的。將逐個單詞地檢視每條評論。依據最後的那個單詞的活性值，將訓練一個用於預測整條評論的情緒的分類器。由於是按照端到端的方式訓練模型，RNN將從單詞中收集那些對於最終分類最有價值的資訊，並進行編碼。

Imdb影評資料集：http://ai.stanford.edu/~amaas/data/sentiment/，它是一個經過壓縮的tar文件，其中正面的和負面的評論可從分列於兩個資料夾中的文字檔案中獲取。利用正規表示式提取純文字，並將其中的字母全部轉換為小寫。

使用詞向量嵌入：詞向量嵌入表示比one-hot具有更豐富的語義。因此，如果使RNN工作在影評的被嵌入的而非one-hot的單詞上，則有助於RNN獲取更好的效能。

import bz2
import numpy as np

class Embedding:
    def __init__(self, vocabulary_path, embedding_path, length):
        self._embedding = np.load(embedding_path)
        with bz2.open(vocabulary_path, 'rt') as file_:
            self.vocabulary = {k.strip(): i for i, k in enumerate(file_)}
        self._length = length
        
    def __call__(self, sequence):
        data = np.zeros((self._length, self._embedding.shape[1]))
        indices = [self._vocabulary.get(x, 0) for x in sequence]
        embedded = self._embedding[indices]
        data[:len(sequence)] = embedded
        return data
    
    def dimensions(self):
        return self._embedding.shape[1]

序列標註模型：

面向機器智慧的TensorFlow實戰5：目標識別與分類
2018-05-26
面向機器智慧的TensorFlow實戰2：TensorFlow基礎
2018-05-24
面向機器智慧的TensorFlow實戰1：安裝
2018-05-24
面向機器智慧的TensorFlow實戰7：詞向量嵌入
2018-05-26
面向機器智慧的TensorFlow實戰4：機器學習基礎
2018-05-25
機器學習
面向機器智慧的TensorFlow實戰6：迴圈神經網路與自然語言處理
2018-05-26
神經網路自然語言處理
基於sklearn的分類器實戰
2019-05-25
Spark機器學習實戰 (十一) - 文字情感分類專案實戰
2019-04-19
Spark機器學習
TensorFlow釋出面向JavaScript開發者的機器學習框架TensorFlow.js
2019-03-03
JavaScript機器學習框架JS
【機器學習No.1】Tensorflow智慧之別衣帽種類模型
2019-03-26
機器學習模型
【TensorFlow】 TensorFlow-Slim影像分類模型庫
2021-09-09
模型
ModelSerializer序列化器實戰
2022-03-31
「影像分類」實戰影像分類網路的視覺化
2019-09-04
視覺化
JavaScript玩轉機器學習-Tensorflow.js專案實戰
2020-12-29
JavaScript機器學習JS
使用 TensorFlow Hub 和估算器構建文字分類模型
2018-09-05
文字分類模型
人工智慧中的文字分類：技術突破與實戰指導
2023-12-15
人工智慧文字分類
TensorFlow2.0教程-文字分類
2019-03-11
文字分類
Tensorflow 1.x 影象分類
2020-03-10
Tensorflow 1.x 影像分類
2020-03-10
機器學習框架ML.NET學習筆記【6】TensorFlow圖片分類
2019-05-31
機器學習框架筆記
五分鐘k8s實戰-Istio 閘道器
2023-11-15
K8S
Pytext實戰-構建一個文字分類器有多快
2019-03-02
文字分類
基於Tensorflow + Opencv 實現CNN自定義影像分類
2021-09-22
OpenCVCNN
機器學習實戰（三）決策樹ID3：樹的構建和簡單分類
2018-05-17
機器學習
Pytorch實現分類器
2023-04-17
PyTorch
機器學習常用的分類器比較
2018-04-02
機器學習
圖卷積實戰——文字分類
2019-05-22
卷積文字分類
智慧對話機器人實戰視訊教程
2018-11-16
機器人
【機器學習】支援向量機分類
2022-07-13
機器學習
機器學習（8）——其他聚類
2018-03-24
機器學習聚類
Scikit-Learn 與 TensorFlow 機器學習實用指南學習筆記2 — 機器學習的主要挑戰
2018-11-26
機器學習筆記
使用自己的資料集訓練MobileNet、ResNet實現影象分類（TensorFlow）
2019-03-09
計算機視覺—人臉識別（Hog特徵+SVM分類器）（8）
2019-03-02
計算機視覺HOG特徵
倉庫智慧分揀機器人RFID，如何實現分揀工作
2021-03-20
機器人
【機器學習】--xgboost初始之程式碼實現分類
2018-06-18
機器學習
使用PaddleFluid和TensorFlow實現影像分類網路SE_ResNeXt
2018-06-20
UI
使用PaddleFluid和TensorFlow實現影象分類網路SE_ResNeXt
2018-06-20
UI
破解垃圾分類難題，智慧分類如何實現最優解？
2020-06-01

面向機器智慧的TensorFlow實戰8：序列分類

相關文章