總覽
- 學習如何使用PyTorch實現文字分類
- 理解文字分類中的關鍵點
- 學習使用壓縮填充方法
介紹
在我的程式設計歷程中,我總是求助於最先進的架構。現在得益於深度學習框架,比如說PyTorch,Keras和 TensorFlow,實現先進的架構已經變得更簡單了。這些深度學習框架提供了一種實現複雜模型架構和演算法的簡單方式,不需要你掌握大量的專業知識和程式設計技能。總結來說,這是資料科學的金礦。
在本文中,我們將使用PyTorch框架,它以其快速的計算能力而聞名。因此,在本文中,我們將介紹解決文字分類問題的關鍵點。然後我們將在PyTorch框架實現我們的第一個文字分類器!
提示:在繼續瀏覽前,我推薦先閱讀這篇文章:
A Beginner-Friendly Guide to PyTorch and How it Works from Scratch:
https://www.analyticsvidhya.com/blog/2019/09/introduction-to-pytorch-from-scratch/?utm_source=blog&utm_medium=building-image-classification-models-cnn-pytorch
大綱
- 為什麼用PyTorch來解決文字分類問題
- 解決Out of Vocabulary words
- 解決變長序列
- 包裝器和預訓練模型
- 瞭解問題的場景
- 實現文字分類
一、為什麼用PyTorch來解決文字分類問題?
在我們深入專業概念前,我們先快速熟悉一下PyTorch這個框架。PyTorch的基本資料單元是Tensor,類似於python中的numpy數列。使用PyTorch的最重要的兩個優點是:
- 動態的網路——訓練過程中網路結構可以變化
- 多GPU分散式訓練