一.中文庫下載
國內可以使用映象https://hf-mirror.com/下載。地址:https://hf-mirror.com/spacy/zh_core_web_md/tree/main,中文所以下載的是zh_core_web_md-any-py3-none-any.whl。然後使用pip install安裝。
二.簡單測試
import spacy from spacy.language import Language # 自定義管道元件 @Language.component("custom_component") def custom_component(doc): print("自定義管道元件:",doc) print(type(doc)) return doc # 下載並載入中文模型 # 可以從 https://github.com/howl-anderson/spacy_model 獲取中文模型 nlp = spacy.load('zh_core_web_md') nlp.add_pipe("custom_component",last=True) # 分詞並列印實體 text = "中國是一個偉大的國家,它擁有龐大的人口和豐富的文化。" doc = nlp(text) tokens=[token.text for token in doc] print("分詞結果:",tokens) pos_tags=[(token.text,token.pos_)for token in doc] print("詞性標註結果:",pos_tags) entities=[(ent.text,ent.label_)for ent in doc.ents] print("實體識別結果:",entities) dependency_tree=[(token.text,token.dep_,token.head.text)for token in doc] print("依賴關係分析結果:",dependency_tree)
三、執行結果