NLP任務中可參考的神經網路架構(Keras+TensorFlow)

TensorPro發表於2018-03-16

1.CNN架構

2.全連線網路模型

3.RNN架構

4.雙向RNN架構

5.序貫模型CNN+RNN
6.函式式模型CNN+RNN
7.函式式模型、序貫模型CNN+RNN(思路擴充套件)
    自己還嘗試了交叉混合的架構:一層CNN+一層RNN+一層CNN+一層RNN。在實驗資料上效果還不錯。

8.總結
    以上模型算是常見的幾個NLP端到端的模型,且最後都是一個分類的模型。(如果任務不是分類模型可以修改)model.compile(loss="binarycrossentropy",optimizer="adam",metrics=["accuracy",f1])” 改成“model.compile(loss='mse', optimizer=adam, metrics=['mse'])。總的來講就是要修改損失函式。

9.宣告

以上的模型均來自好未來AI Lab訓練營優秀學員以及我和我的隊友常永炷兄弟的作品,在此致謝好未來。。。
原始碼地址:https://gitee.com/TensorPro/codes/b321zmdh48lji5ptyfn7s55
                 https://github.com/cyzLoveDream/text_dnn_classifier

相關文章