Gse v0.30.0 釋出了, Go 高效能分詞, 增加 hmm 支援
Go 語言高效分詞, 支援英文、中文、日文等
詞典用雙陣列 trie(Double-Array Trie)實現, 分詞器演算法為基於詞頻的最短路徑加動態規劃。v0.30.0 版本主要新增了 DAG 和 HMM (Viterbi) 演算法分詞, 新增 API 基本和結巴分詞保持一致.
支援普通、搜尋引擎、全模式、精確模式和 HMM 模式多種分詞模式,支援使用者詞典、詞性標註,可執行 JSON RPC 服務。
專案地址: https://github.com/go-ego/gse
package main
import (
"fmt"
"github.com/go-ego/gse"
)
func main() {
var seg gse.Segmenter
seg.LoadDict()
text1 := "你好世界, Hello world"
fmt.Println(seg.Cut(text1, true))
}
Rhine River
Add
- [NEW] Add HMM cut support
- [NEW] Add go mod support and remove dep files
- [NEW] Add find word in dictionary func
- [NEW] Add Cut(), CutAll(), CutSearch(), LoadModel(), HMMCut() func
- [NEW] Add hmm cut test code
- [NEW] Add hmm cut example code
Update
- [NEW] Cutting the dict method, move load dictionary to dict_util.go
- [NEW] Update example and Add more test
- [NEW] Update and clean utils code
- [NEW] Simplify test code, add equal benchmark code
- [NEW] Update pkg cedar code
- [NEW] Update code style
- [NEW] Update README.md [ Format README.mdand Update example ]
Fix
- [FIX] Fixed and clean issue template
- [FIX] Update README.md [ update and fixed example ]
See Commits for more details, after Oct 9.
更多原創文章乾貨分享,請關注公眾號
- 加微信實戰群請加微信(註明:實戰群):gocnio
相關文章
- Gse v0.10.0 釋出了, Go 高效能分詞GseGo分詞
- Gse v0.40.0 釋出了, Go 高效能分詞, 增加更多常用 APIGseGo分詞API
- Gse v0.20.0 釋出了, Go 高效能分詞, 優化效能和程式碼, 更多測試GseGo分詞優化
- go-carbon 1.1.0版本釋出了,增加對gorm的支援GoORM
- go-carbon 1.1.2版本釋出了,修復已知錯誤,增加對農曆的支援Go
- go1.13釋出了Go
- go-carbon 1.1.0版本釋出了,php carbon時間處理庫的golang版,增加對gorm的支援PHPGolangORM
- go-carbon 2.1.0 版本釋出, 增加對 go1.18 版本的相容支援Go
- Robotgo v0.80.0 釋出了, Go 跨平臺 GUI 自動化. 增加非同步事件和多組合鍵監聽 hook 支援OTGGoGUI非同步事件Hook
- Lucene的IK分詞器學習,增加支援單個特殊符號搜尋分詞符號
- go-carbon 1.2.0 版本釋出了,完善優化對ORM的多場景支援Go優化ORM
- Echarts4.0釋出了,都增加哪些黑科技呢?Echarts
- Solon 1.5.67 釋出,增加 GraalVm Native 支援LVM
- Go-carbon 1.1.1版本釋出了,完善對主流ORM的支援,新增公共方法GoORM
- go-carbon 1.2.0 版本釋出了,完善最佳化對ORM的多場景支援GoORM
- 中文分詞的探索,CRF(條件隨機場)和HMM(隱馬爾可夫模型)用於分詞的對比,以及中文分詞的評估中文分詞CRF條件隨機場HMM隱馬爾可夫模型
- go-dongle 0.0.2 版本釋出了,新增base58編碼解碼和aes解密解密支援Go解密
- go-carbon 1.2.1 版本釋出了,新增多個方法Go
- 剛剛,GitHub釋出了Copilot X,增加了全新的對話模式Github模式
- View UI Plus 釋出 1.1.0 版本,支援 SSR、支援 Nuxt、增加 TS 宣告檔案ViewUIUX
- Robotgo v0.50.0 釋出了, Go 桌面自動化, 巨大更新OTGGo
- Go1.14 釋出了,快來圍觀新的特性啦Go
- Robotgo v0.49.0 釋出了, Go 桌面自動化, 更多特性OTGGo
- HMMHMM
- sensitive-word v0.13 特性版本釋出 支援英文單詞全詞匹配
- 《TypeScript 教程》釋出了TypeScript
- Wine 5.0 釋出了!
- HttpReports 2.0 釋出了 !!!HTTP
- ApkToolBoxGUI 0.0.8釋出了!!APKGUI
- KunlunBase 1.0 釋出了!
- Java 18釋出了Java
- Istio 1.12 釋出了!
- PHP 8 釋出了PHP
- PHP 8.0.0釋出了!PHP
- Seata-go 1.1.0 釋出,補齊 AT 模式支援Go模式
- 支援泛型的Go語言1.18釋出泛型Go
- 使用cjieba(結巴分詞庫)實現php擴充套件中文分詞-支援php5, php7JiebaPHP套件中文分詞
- Go 語言開發工具 LiteIDE X35 釋出,支援 Go modulesGoIDE