【論文學習】FastText總結
《 Bag of Tricks for Efficient Text Classification》
Fasttext: 對於高效率文字分類的一攬子技巧
論文背景:
- 文字分類是自然語言處理的重要任務,可以用於資訊檢索、網頁搜尋、文件分類等。
- 基於深度學習的方法可以達到非常好的效果,但是速度很慢,限制了文字分類的應用。
- 基於機器學習的線性分類器效果也很好,有用於大規模分類任務的潛力。
- 從現在詞向量學習中得到的靈感,我們提出了一種新的文字分類方法Fasttext,這種方法能夠快
速的訓練和測試並且達到和最優結果相似的效果。
Fasttext歷史意義
• 提出了一種新的文字分類方法——Fasttext,能夠進行快速的文字分類,並且效果很好。
• 提出了一種新的使用子詞的詞向量訓練方法——Fasttext,能夠一定程度上解決OOV問題。
• 將Fasttext開源,使得工業界和學術界能夠快速使用Fasttext。
Fasttext模型優缺點
優點:
- 速度非常快,並且效果還可以。
- 有開源實現,可以快速上手使用。
缺點:
- 模型結構簡單,所以目前來說,不是最優的模型。
- 因為使用詞袋思想,所以語義資訊獲取有限。
論文總結
關鍵點
• 基於深度學習的文字分類方法效果好,但是速度比較慢
• 基於線性分類器的機器學習方法效果還行,速度也比較快,但是需要做煩瑣的特徵工程
• Fasttext模型
創新點
• 提出了一種新的文字分類模型—Fasttext模型
• 提出了一些加快文字分類和使得文字分類效果更好的技巧——層次softmax和n-gram特徵。
• 在文字分類和tag預測兩個任務上得到了又快又好的結果。
相關文章
- FastText總結,fastText 原始碼分析AST原始碼
- 並行多工學習論文閱讀(五):論文閱讀總結並行
- 數論學習總結
- 數論學習總結2
- 論文學習
- ZGC論文學習GC
- Photoshop學習方法論簡單總結(轉)
- 深度學習相關論文深度學習
- NLP知識總結和論文整理
- 學習總結
- 深度學習-最新論文解釋深度學習
- 圖學習相關論文快訊
- Google Illuminate革新學習論文Go
- 總結幾個查詢論文網址
- 【深度學習 論文篇 01-1 】AlexNet論文翻譯深度學習
- 系統學習NLP(十九)--文字分類之FastText文字分類AST
- 深度學習論文和開原始碼深度學習原始碼
- 聯邦學習綜述性論文聯邦學習
- 【深度學習 論文篇 02-1 】YOLOv1論文精讀深度學習YOLOv1
- 10K+,深度學習論文、程式碼最全彙總!一鍵收藏深度學習
- mysqlimport學習總結MySqlImport
- Maven學習總結Maven
- MyBatis 學習總結MyBatis
- awk 學習總結
- JNI 學習總結
- tkinter學習總結
- SVG學習總結SVG
- vue學習總結Vue
- WorkFlow學習總結
- HTML學習總結HTML
- Mybatis學習總結MyBatis
- Kafka 總結學習Kafka
- Typescript學習總結TypeScript
- 【TS】學習總結
- lua 學習總結
- vue 學習總結Vue
- HSF學習總結
- ElasticSearch 學習總結Elasticsearch