Gse v0.10.0 釋出了, Go 高效能分詞
Go 語言高效分詞, 支援英文、中文、日文等
詞典用雙陣列 trie(Double-Array Trie)實現, 分詞器演算法為基於詞頻的最短路徑加動態規劃。
支援普通和搜尋引擎兩種分詞模式,支援使用者詞典、詞性標註,可執行 JSON RPC 服務。
專案地址: https://github.com/go-ego/gse
package main
import (
"fmt"
"github.com/go-ego/gse"
)
func main() {
var seg gse.Segmenter
seg.LoadDict("zh,testdata/test_dict.txt,testdata/test_dict1.txt")
text1 := []byte("你好世界, Hello world")
segments := seg.Segment(text1)
fmt.Println(gse.ToString(segments, false))
}
Danube River
Add
- [NEW] 增加載入詞典錯誤行檢測
- [NEW] 增加不同語言詞典縮寫
- [NEW] 增加模式分詞方法
- [NEW] 增加自定義字典和示例
- [NEW] 更多測試
- [NEW] 更新測試工具
Update
- [NEW] 更新 tool 和 benchmark 程式碼
- [NEW] 更新 cedar 程式碼
- [NEW] 簡化程式碼 name
- [NEW] 更新 README.md
- [NEW] 細分程式碼方法
- [NEW] 更新版本並使用 dep 管理包
- [NEW] 優化字典載入
- [NEW] 更新 log print 和檔名
Fix
- [FIX] Format some code and fix godoc
更多原創文章乾貨分享,請關注公眾號
- 加微信實戰群請加微信(註明:實戰群):gocnio
相關文章
- Gse v0.30.0 釋出了, Go 高效能分詞, 增加 hmm 支援GseGo分詞HMM
- Gse v0.40.0 釋出了, Go 高效能分詞, 增加更多常用 APIGseGo分詞API
- Gse v0.20.0 釋出了, Go 高效能分詞, 優化效能和程式碼, 更多測試GseGo分詞優化
- riot 搜尋引擎 v0.10.0 釋出, 優化引擎和分詞等優化分詞
- go1.13釋出了Go
- go-carbon 1.2.1 版本釋出了,新增多個方法Go
- Robotgo v0.50.0 釋出了, Go 桌面自動化, 巨大更新OTGGo
- Go 語言高效分詞, 支援英文、中文、日文等Go分詞
- Go1.14 釋出了,快來圍觀新的特性啦Go
- go-carbon 1.1.0版本釋出了,增加對gorm的支援GoORM
- Gitea 1.0 釋出了,Go語言開發的自助 Git 服務GitGo
- Gitea 1.0 釋出了,Go 語言開發的自助 Git 服務GitGo
- Robotgo v0.49.0 釋出了, Go 桌面自動化, 更多特性OTGGo
- Wine 5.0 釋出了!
- PHP 8.0.0釋出了!PHP
- PHP 8 釋出了PHP
- 《TypeScript 教程》釋出了TypeScript
- Java 18釋出了Java
- POSTGRESQL 9.2.2 釋出了。SQL
- 分詞分詞
- Metasploit釋出了版本5.0.76
- GoPHP3.2.5釋出了GoPHP
- KunlunBase 1.0 釋出了!
- Istio 1.12 釋出了!
- PHP 8.1.0 正式釋出了PHP
- HttpReports 2.0 釋出了 !!!HTTP
- PHP 5.6.0 正式釋出了!PHP
- Robotgo v0.60.0 釋出了, Go 桌面自動化, 重構 window 和 exampleOTGGo
- HanLP分詞工具中的ViterbiSegment分詞流程HanLP分詞Viterbi
- #Elasticsearch中文分詞器 #IK分詞器 @FDDLCElasticsearch中文分詞
- 分詞-1分詞
- Python分詞模組推薦:jieba中文分詞PythonJieba中文分詞
- go-carbon 1.2.0 版本釋出了,完善優化對ORM的多場景支援Go優化ORM
- 《Bash 指令碼教程》釋出了指令碼
- LWUIT 1.3終於釋出了!UI
- Hyperledger Fabric 2.0 Alpha釋出了!
- ApkToolBoxGUI 0.0.8釋出了!!APKGUI
- 《SSH 入門教程》釋出了