GO語言敏感詞檢測

因為工作需求,需要一個敏感詞檢測的功能,本來準備接入雲平臺.但是後來想想還是自己做了吧.由於是第一次接觸敏感詞檢測,剛開始的想法是使用字串匹配,或者分詞匹配,但是一想到如果敏感詞有幾千,而需要檢測的內容又特別長的時候,效率就非常低,於是從《演算法導論》裡面查了一下,找到了dfa演算法.於是dfa 的 go 語言包就誕生了.

DFA 全稱為：Deterministic Finite Automaton，即確定有窮自動機。其特徵為：有一個有限狀態集合和一些從一個狀態通向另一個狀態的邊，每條邊上標記有一個符號，其中一個狀態是初態，某些狀態是終態。但不同於不確定的有限自動機，DFA 中不會有從同一狀態出發的兩條邊標誌有相同的符號。

這裡我們用 Trie 樹實現. 下面我們有and,as,at,cn,com這些關鍵詞, 我們看下使用Tire 樹怎麼儲存這些資料

從這個圖中可以看出這個樹儲存的資料規律:

根節點不包含字元，除根節點外的每一個子節點都包含一個字元。
從根節點到某一節點，路徑上經過的字元連線起來，就是該節點對應的字串。
每個單詞的公共字首作為一個字元節點儲存

根據這些特性,我們構建一個 Trie 樹, 我實現了一個敏感詞檢測包.程式碼非常簡單,有需要使用的可以直接將檔案拷貝到自己的專案中使用.

GitHub地址: github.com/bean-du/dfa

本作品採用《CC 協議》，轉載必須註明作者和本文連結

基於 Tire 樹的敏感詞檢測
2019-04-24
使用 Go 語言與 OpenCV 進行物體檢測
2024-12-03
GoOpenCV
Go 語言的詞法分析和語法分析(1)
2021-03-23
Go詞法分析語法分析
Go語言————1、初識GO語言
2018-06-23
Go
Go 測驗 101 Go 語言 101 學習地址
2019-05-27
Go
多語言檢測工具實踐
2020-12-04
Go 語言基準測試入門
2024-10-14
Go
Go 語言的詞法分析和語法分析(2)—Import宣告的解析
2021-03-26
Go詞法分析語法分析Import
GO語言————2、GO語言環境安裝
2018-06-23
Go
[NLP]OpenNLP語言檢測器的使用
2020-12-15
匹配關鍵詞和敏感詞
2020-07-05
【Go語言入門系列】（八）Go語言是不是面嚮物件語言？
2020-09-01
Go物件
Go_go語言初探
2020-12-14
Go
Go語言map
2018-11-30
Go
go 語言切片
2018-07-16
Go
go 語言常量
2019-12-22
Go
go語言使用
2020-10-12
Go
物體檢測（YOLO）示例：使用 C 語言
2024-12-03
YOLO
C語言英文單詞
2020-04-05
C語言
Go 語言區塊鏈測試實踐指南（一）：GO單元測試
2023-12-12
Go區塊鏈
什麼是Go語言?Go語言有什麼特點?
2020-12-10
Go
go語言與c語言的相互呼叫
2019-04-09
GoC語言
【譯】Go語言宣告語法
2019-03-29
Go
Go語言運算子
2018-10-26
Go
Go語言————7.2 切片
2018-07-01
Go
GO語言————4.6 字串
2018-06-29
Go字串
GO語言————4.3常量
2018-06-26
Go
go語言變數
2018-06-08
Go變數
Go語言介紹
2018-08-07
Go
go語言學習
2024-04-14
Go
Go 語言效能分析
2019-11-14
Go
Go語言的”坑“
2020-09-15
Go
Go語言簡史
2020-04-07
Go
go語言的介面
2019-07-16
Go
Go 語言函式
2022-03-25
Go函式
go 語言陣列
2022-03-24
Go陣列
初識go語言
2021-09-28
Go
GO語言併發
2021-09-09
Go

GO語言敏感詞檢測

相關文章