騰訊word2vec模型縮小版
騰訊開源的word2vec模型。
原版15個G,一般愛好者很難玩出來。
所以做了一些小的。方便大家使用。
5000-small.txt 這個有5000詞,可以下下來玩玩
45000-small.txt 這個有4.5w的詞,已經能解決很多問題了
70000-small.txt 7w詞 133MB https://pan.baidu.com/s/1DprHD8HwEqkWRBG0ss2y1A
100000-small.txt 10w詞 190MB https://pan.baidu.com/s/1KqPOwfrw3KoLJqTsCUdriA
500000-small.txt 50w詞 953MB https://pan.baidu.com/s/1SGwxpGW8HjYw8HdKQUB8Gw
1000000-small.txt 100w詞 1.9GB https://pan.baidu.com/s/1ObstPl7R8o1L98Ag9owGiw
2000000-small.txt 200w詞 3.8GB https://pan.baidu.com/s/1hmCiMandgyedjmP520_Aog
再大就自己去下載吧
https://ai.tencent.com/ailab/nlp/data/Tencent_AILab_ChineseEmbedding.tar.gz
使用
讀模型
from gensim.models import KeyedVectors
model = KeyedVectors.load_word2vec_format("50-small.txt")
使用
model.most_similar(positive=['女', '國王'], negative=['男'], topn=1)
model.doesnt_match("上海 成都 廣州 北京".split(" "))
model.similarity('女人', '男人')
model.most_similar('川普',topn=10)
相關文章
- Word2Vec模型之CBOW模型
- 壓縮大型語言模型(LLMs):縮小10倍、效能保持不變模型
- 騰訊 AI Lab提出自動化模型壓縮框架PocketFlow:將深度學習裝進口袋AI模型框架深度學習
- 「騰訊地圖」小程式外掛地圖
- 深入淺出騰訊BERT推理模型--TurboTransformers模型ORM
- 模型壓縮-模型蒸餾、模型剪枝、模型量化模型
- 87 GB 模型種子,GPT-4 縮小版,超越ChatGPT3.5,多平臺線上體驗模型ChatGPT
- #產品體驗#騰訊相簿小程式
- 開源社群引數量最大的文生影片模型來了,騰訊版Sora免費使用模型Sora
- 動手實踐word2vec和doc2vec模型模型
- BERT 模型壓縮方法模型
- 朱展:騰訊雲小程式解決方案
- 部署小說api服務到騰訊雲API
- 基於騰訊元器搭建前端小助手前端
- 小視訊原始碼,java使用Thumbnails壓縮圖片原始碼JavaAI
- 重磅!騰訊將代理國行版 Nintendo Switch
- NeurIPS 2018 | 騰訊AI Lab詳解3大熱點:模型壓縮、機器學習及最優化演算法AI模型機器學習優化演算法
- 區間縮小
- uniapp小程式上傳圖片到騰訊雲APP
- 騰訊:2022年騰訊一級市場投資事件只有67起 對外投資規模明顯縮減事件
- Word2Vec
- 2020·騰訊遊戲投資版圖全解析遊戲
- 酷瓜雲課堂(騰訊雲版)v1.4.0 釋出,免費商用,搞錢小能手
- 使用騰訊雲配置小程式Python開發環境Python開發環境
- Sea:“東南亞小騰訊”是如何發家的?
- gltf-pipeline 壓縮glb模型模型
- yolov5--4.0--模型壓縮YOLO模型
- 無所不能的Embedding 1 - Word2vec模型詳解&程式碼實現模型
- 酷瓜雲課堂(騰訊雲版)v1.4.2 釋出,免費商用,開源搞錢小能手
- 騰訊線上教育的小程式雲開發實踐
- 擴充和縮小LV
- 如何縮小物件體積物件
- 離職騰訊後,他們做的小眾遊戲被騰訊發行到了免費榜第一遊戲
- 【騰訊地圖】騰訊地圖定位解析地圖
- 騰訊雲TDSQL MySQL版 - 開發指南 二級分割槽MySql
- WeMap騰訊地圖產業版白皮書(附下載)地圖產業
- 騰訊雲TDSQL MySQL版 - 開發指南 分散式事務MySql分散式
- 【開源】騰訊 omi-mp-create 釋出 - 極小卻精巧的小程式框架框架