tinysearch/tinysearch: 使用Rus和Wasm構建的靜態網站的微型全文搜尋引擎
使用 Rust 和 Wasm 構建的靜態網站的小型全文搜尋引擎tinysearch ,tinysearch 是一個輕量級、快速、全文搜尋引擎。它專為靜態網站而設計。
tinysearch 是用 Rust 編寫的,然後編譯成 WebAssembly 以在瀏覽器中執行。它可以與靜態站點生成器一起使用,例如Jekyll、 Hugo、Zola、 Cobalt或Pelican。
技術原理:
tinysearch 是來自文章“使用布隆過濾器編寫全文搜尋引擎”的 Python 程式碼的 Rust/WASM 埠。它可以被看作是lunr.js和 elasticlunr的替代品,它們對於較小的網站來說太重並且載入了大量的 JavaScript。
在幕後,它使用Xor 過濾器——一種用於快速逼近集合成員資格的資料結構,它比布隆過濾器和布穀鳥過濾器小。每篇博文都被轉換成一個過濾器,然後使用bincode將其序列化為二進位制 blob 。請注意,底層技術可能會發生變化。
限制
- 只找到整個單詞。因此,目前還沒有搜尋建議。這是減少記憶體使用的必要折衷。特里資料結構比異或過濾器大 10 倍左右。用於字首搜尋的緊湊資料結構的新研究可能會在未來解除這一限制。
- 由於我們將所有文章的所有搜尋索引捆綁到一個靜態二進位制檔案中,因此我們建議僅將其用於中小型網站。每篇文章預計大約 2 kB 未壓縮(壓縮約 1 kb)。
相關文章
- 使用 Postgres 的全文搜尋構建可擴充套件的事件驅動搜尋架構套件事件架構
- ElasticSearch全文搜尋引擎Elasticsearch
- sphinx 全文搜尋引擎
- Nebula 基於 ElasticSearch 的全文搜尋引擎的文字搜尋Elasticsearch
- 使用 Docker 和 Elasticsearch 構建一個全文搜尋應用程式DockerElasticsearch
- 使用Node,Vue和ElasticSearch構建實時搜尋引擎VueElasticsearch
- Laravel5.5 使用 Elasticsearch 做引擎,scout 全文搜尋LaravelElasticsearch
- 高效的使用搜尋引擎
- 如何修改網站的 SEO,最佳化網站搜尋引擎排名的方法網站
- Mac上神奇的內建搜尋引擎——Spotlight(聚焦搜尋)Mac
- CV+NLP,使用tf.Keras構建影像搜尋引擎Keras
- Tantivy與Quickwit:類似Lucene的Rust全文搜尋引擎庫UIRust
- Elasticsearch 的配置與使用,為了全文搜尋Elasticsearch
- 前後端,靜態網站和動態網站, 的理解後端網站
- Tomcat和搜尋引擎網路爬蟲的攻防Tomcat爬蟲
- 如何使用robots禁止各大搜尋引擎爬蟲爬取網站爬蟲網站
- Elasticsearch——全文搜尋Elasticsearch
- 網站搜尋引擎優化值得關注的4個策略網站優化
- 基於Kafka和Elasticsearch構建實時站內搜尋功能的實踐KafkaElasticsearch
- ES(Elasticsearch)支援PB級全文搜尋引擎入門教程Elasticsearch
- 網站SEO在搜尋引擎中如何獲得更加靠前的排名的?網站
- 使用Google百度等搜尋引擎的常用搜尋技巧Go
- Laravel 使用 xunsearch(迅搜)全文檢索引擎Laravel索引
- 基於 Elasticsearch 的站內搜尋引擎實戰Elasticsearch
- 網站進行SEO搜尋引擎優化的七條規則網站優化
- Web網站如何檢視搜尋引擎蜘蛛爬蟲的行為Web網站爬蟲
- Laravel xunsearch 全文搜尋Laravel
- 【搜尋引擎】 PostgreSQL 10 實時全文檢索和分詞、相似搜尋、模糊匹配實現類似Google搜尋自動提示SQL分詞Go
- elasticsearch 搜尋引擎工具的高階使用Elasticsearch
- 使用開源搜尋引擎 YaCy 的技巧
- 分散式搜尋引擎Elasticsearch的架構分析分散式Elasticsearch架構
- 網站最佳化搜尋引擎與關鍵詞網站
- 國內主流搜尋引擎提交Sitemap(網站地圖)網站地圖
- 使用Java和Maven(JBake)生成靜態網站 - optaplannerJavaMaven網站
- 18. 使用MySQL之全文字搜尋MySql
- 使用 Laravel Scout + ElasticSearch 實現全文搜尋LaravelElasticsearch
- 搜尋引擎-03-搜尋引擎原理
- python 寫的搜尋引擎Python