騰訊word2vec模型縮小版

sunghosts發表於2020-10-28

原文網址 : https://blog.csdn.net/sunghosts/article/details/109336033

模型

騰訊開源的word2vec模型。

原版15個G，一般愛好者很難玩出來。

所以做了一些小的。方便大家使用。

5000-small.txt 這個有5000詞，可以下下來玩玩

45000-small.txt 這個有4.5w的詞，已經能解決很多問題了

70000-small.txt 7w詞 133MB https://pan.baidu.com/s/1DprHD8HwEqkWRBG0ss2y1A

100000-small.txt 10w詞 190MB https://pan.baidu.com/s/1KqPOwfrw3KoLJqTsCUdriA

500000-small.txt 50w詞 953MB https://pan.baidu.com/s/1SGwxpGW8HjYw8HdKQUB8Gw

1000000-small.txt 100w詞 1.9GB https://pan.baidu.com/s/1ObstPl7R8o1L98Ag9owGiw

2000000-small.txt 200w詞 3.8GB https://pan.baidu.com/s/1hmCiMandgyedjmP520_Aog

再大就自己去下載吧

https://ai.tencent.com/ailab/nlp/data/Tencent_AILab_ChineseEmbedding.tar.gz

使用

讀模型

from gensim.models import KeyedVectors

model = KeyedVectors.load_word2vec_format("50-small.txt")

使用

model.most_similar(positive=['女', '國王'], negative=['男'], topn=1)

model.doesnt_match("上海 成都 廣州 北京".split(" "))

model.similarity('女人', '男人')

model.most_similar('川普',topn=10)

Word2Vec模型之CBOW
2024-08-11
模型
壓縮大型語言模型(LLMs):縮小10倍、效能保持不變
2024-09-01
模型
騰訊 AI Lab提出自動化模型壓縮框架PocketFlow：將深度學習裝進口袋
2018-09-17
AI模型框架深度學習
「騰訊地圖」小程式外掛
2018-11-13
地圖
深入淺出騰訊BERT推理模型--TurboTransformers
2020-06-27
模型ORM
模型壓縮-模型蒸餾、模型剪枝、模型量化
2024-08-07
模型
87 GB 模型種子，GPT-4 縮小版，超越ChatGPT3.5，多平臺線上體驗
2023-12-17
模型ChatGPT
#產品體驗#騰訊相簿小程式
2019-01-08
開源社群引數量最大的文生影片模型來了，騰訊版Sora免費使用
2024-12-03
模型Sora
動手實踐word2vec和doc2vec模型
2019-03-22
模型
朱展：騰訊雲小程式解決方案
2018-05-08
部署小說api服務到騰訊雲
2018-06-19
API
基於騰訊元器搭建前端小助手
2024-06-04
前端
BERT 模型壓縮方法
2020-03-02
模型
小視訊原始碼，java使用Thumbnails壓縮圖片
2021-11-09
原始碼JavaAI
重磅！騰訊將代理國行版 Nintendo Switch
2019-04-18
區間縮小
2024-10-20
NeurIPS 2018 | 騰訊AI Lab詳解3大熱點：模型壓縮、機器學習及最優化演算法
2018-12-12
AI模型機器學習優化演算法
uniapp小程式上傳圖片到騰訊雲
2024-05-14
APP
騰訊：2022年騰訊一級市場投資事件只有67起對外投資規模明顯縮減
2022-06-06
事件
Word2Vec
2024-11-24
2020·騰訊遊戲投資版圖全解析
2020-12-10
遊戲
酷瓜雲課堂（騰訊雲版）v1.4.0 釋出，免費商用，搞錢小能手
2021-08-03
使用騰訊雲配置小程式Python開發環境
2019-02-24
Python開發環境
Sea：“東南亞小騰訊”是如何發家的？
2021-03-29
gltf-pipeline 壓縮glb模型
2024-11-26
模型
yolov5--4.0--模型壓縮
2021-03-17
YOLO模型
無所不能的Embedding 1 - Word2vec模型詳解&程式碼實現
2020-08-02
模型
酷瓜雲課堂（騰訊雲版）v1.4.2 釋出，免費商用，開源搞錢小能手
2021-08-12
騰訊線上教育的小程式雲開發實踐
2020-06-08
擴充和縮小LV
2018-09-10
如何縮小物件體積
2019-08-08
物件
離職騰訊後，他們做的小眾遊戲被騰訊發行到了免費榜第一
2020-11-05
遊戲
【騰訊地圖】騰訊地圖定位解析
2020-10-15
地圖
騰訊雲TDSQL MySQL版 - 開發指南二級分割槽
2021-08-19
MySql
WeMap騰訊地圖產業版白皮書（附下載）
2023-03-16
地圖產業
騰訊雲TDSQL MySQL版 - 開發指南分散式事務
2021-08-27
MySql分散式
騰訊雲上線DeepSeek模型API介面，率先支援聯網搜尋！
2025-02-08
模型API

騰訊word2vec模型縮小版

使用

讀模型

使用

相關文章