.Net與AI的強強聯合：AntSK知識庫專案中Rerank模型的技術突破與實戰應用

许泽宇發表於2024-04-21

原文網址 : https://www.cnblogs.com/xuzeyu/p/18148685

隨著人工智慧技術的飛速發展，.Net技術與AI的結合已經成為了一個新的技術熱點。今天，我要和大家分享一個令人興奮的開源專案——AntSK，這是一個基於.net平臺構建的開源離線AI知識庫專案。在這個專案中，我們最近加入了一項強大的Rerank（重排）模型，進一步增強了我們的AI知識庫的查詢能力。如果你關心.NET和AI的融合應用，那麼請繼續閱讀，我保證這會是一次充滿技術洞見的探索旅程。

引言

在現代搜尋引擎技術中，如何從龐大的資料中快速、準確地找到使用者需要的資訊，這一點至關重要。雖然向量匹配技術已經可以實現語義相關度的匹配，它是根據向量之間的距離來判斷文件與查詢之間的相關性，但這往往不能滿足我們日益增長的精準匹配需求。文件質量的參差不齊，以及使用者查詢意圖的多樣性，讓向量匹配技術看起來有些力不從心。

AntSK知識庫專案正是針對這些挑戰而誕生，目標是構建一個強大、靈活且易於擴充套件的AI知識庫框架。引入Rerank技術後，AntSK可以對向量匹配後的初步結果進行進一步的重排序，從而顯著提升搜尋結果的相關性和質量。

AntSK專案簡介

AntSK是一個開源且強大的AI知識庫框架，它整合了先進的語義理解技術。透過結合

semantic kernel和kernel memory，它提供了一個擴充套件的AI功能平臺，還支援Python混合程式設計，讓.NET開發者也可以輕鬆利用Python豐富的AI生態庫進行開發。

專案地址參見：

https://github.com/AIDotNet/AntSK

Rerank模型的介紹及應用

要在AntSK中加入Rerank模型，我們可以使用一個名為FlagEmbedding的開源專案作為參考。FlagEmbedding提供了一個用於文件重排序的優秀實踐，它可以透過更復雜的模型和更多因素，例如文件的語義深度、使用者查詢意圖等，來篩選出更加配準的結果。

FlagEmbedding專案地址：

https://github.com/FlagOpen/FlagEmbedding/tree/master/FlagEmbedding/llm_reranker#model-list

在AntSK中，我們需要透過pythonnet來執行Rerank模型，這樣可確保.NET和Python之間的無縫整合。由於網路原因，一些國內使用者在下載模型時可能會遇到困難，因此我們對下載部分進行了修改，使其支援從modelscope進行下載。

接下來，我們來看看如何在AntSK中實現ReRank模型的整合。首先建立一個pythonnet類，以下是一個簡化版的程式碼實現：

public static class BegRerankConfig
{
    public static dynamic model { get; set; }

    static object lockobj = new object();



    /// <summary>
    /// 模型寫死
    /// </summary>
    public static dynamic LoadModel(string pythondllPath, string modelName)
    {
        lock (lockobj)
        {
            if (model == null)
            {
                if (string.IsNullOrEmpty(Runtime.PythonDLL))
                {
                    Runtime.PythonDLL = pythondllPath;
                }
                PythonEngine.Initialize();
                try
                {
                    using (GIL())// 初始化Python環境的Global Interpreter Lock)
                    {
                        dynamic modelscope = Py.Import("modelscope");
                        dynamic flagEmbedding = Py.Import("FlagEmbedding");

                        dynamic model_dir = modelscope.snapshot_download(modelName, revision: "master");
                        dynamic flagReranker = flagEmbedding.FlagReranker(model_dir, use_fp16: true);
                        model = flagReranker;
                        return model;
                    }
                }
                catch (Exception ex)
                {
                    throw ex;
                }
            }
            else
            {
                return model;
            }
        }
    }


    public static double Rerank(List<string> list)
    {
        using (GIL())
        {
            try
            {
                PyList pyList = new PyList();
                foreach (string item in list)
                {
                    pyList.Append(item.ToPython()); // 將C# string轉換為Python物件並新增到PyList中
                }
                PyObject result = model.compute_score(pyList, normalize: true);
                return result.As<double>();
            }
            catch (Exception ex)
            {
                throw ex;
            }
        }
    }
}

程式碼詳見AntSK專案。透過簡單的整合，我們就能為AntSK賦予ReRank的能力。另外，我們將初步查詢的top 5結果擴充套件為top 20，甚至更多，然後透過ReRank模型對這些結果進一步篩選和排序，最後只抽取重排後的top 5。這樣的操作流程大大提升了結果的準確性。

為什麼需要向量匹配後再Rerank？

這是因為Rerank依賴的是一對一的精確匹配模型，在處理海量文件時效率較低。因此，將向量匹配作為第一輪粗篩選擇，然後讓Rerank技術進行第二輪精細的篩選排序，就顯得格外高效且合理。

效能測試

經過初步的測試，引入Rerank技術後，AntSK在搜尋結果的相關性和準確性上都得到了顯著的提升。這不僅加深了我們對混合AI系統的認識，也為.NET平臺上的AI應用開發提供了新的可能性和方向。

結語

透過AntSK這一案例，我們可以明顯看到.NET和AI領域融合的趨勢。隨著技術的不斷進步，我們預計會有越來越多精彩的.NET結合AI的應用場景出現。現在，你可以透過訪問Github上的AntSK專案，深入瞭解這一先進技術，並將其應用於你自己的工作當中。

本文僅是一個起點，探討AntSK知識庫框架以及Rerank在內的相關深度技術。我將繼續關注這一個領域的進展，並與大家分享更多精彩內容。感謝閱讀，讓我們一起期待.NET/AI的融合未來！

另外也歡迎大家加入我們的社群交流群，關注公眾號《許澤宇的技術分享》傳送進群！
這是一個非常和諧的社群，大家在裡面討論AI技術，非常融洽。

RAG知識庫最佳化之Rerank應用
2024-04-15
乾貨 | 知識圖譜的技術與應用
2019-11-20
知識圖譜——技術與行業應用
2022-10-14
行業
Android知識問答與分享專案實戰
2018-07-21
Android
深度強化學習技術開發與應用
2022-08-10
強化學習
DiT：Transformers 與擴散模型強強聯手
2023-01-16
ORM模型
RAG：AI大模型聯合向量資料庫和 Llama-index，助力檢索增強生成技術
2024-05-07
AI大模型資料庫Index
GPU在AI業務中的核心技術與應用
2022-01-11
GPUAI
.NET 8 強大功能 IHostedService 與 BackgroundService 實戰
2024-11-14
深入解析：AntSK 0.1.7版本的技術革新與多模型管理策略
2024-03-12
模型
強化學習入門知識與經典專案分析1.3
2022-02-28
強化學習
人工智慧中的文字分類：技術突破與實戰指導
2023-12-15
人工智慧文字分類
AI 大模型企業應用實戰(07)-LangChain的Hello World專案
2024-06-23
大模型LangChain
Embedding技術與應用(3)：Embeddings技術的實踐應用
2023-11-08
加強小區電動車安全管理：影片監控與AI智慧分析技術的應用
2024-04-25
AI
【高階RAG技巧】在大模型知識庫問答中增強文件分割與表格提取
2024-04-18
大模型
知識圖譜增強下的智慧推薦系統與應用-於敬
2022-11-17
? 時間與概念增強的深度多維專案反應理論的可解釋知識跟蹤
2022-02-28
AI應用Google NotebookLM知識庫與音訊摘要生成影片
2024-09-21
AIGo音訊
Redis在Web專案中的應用與實踐
2019-02-17
RedisWeb
Redis 在 Web 專案中的應用與實踐
2019-02-21
RedisWeb
英特爾、聯想與賽特斯強強聯手,共推NFV應用程式
2018-07-03
Scratch列表的知識與應用
2024-10-13
黃波：AI技術在知乎的應用實踐
2019-01-16
AI
AntSK：打造你的本地AI知識庫——離線執行詳細教程
2024-03-03
AI
聽懂未來：AI語音識別技術的進步與實戰
2023-12-14
AI
《ASP.Net Core技術內幕與專案實戰》讀書筆記_1
2024-11-11
ASP.NET筆記
胡思亂想：AI模型開發與中臺技術結合
2024-09-02
AI模型
通義靈碼知識庫問答增強：知識庫構建與管理指南
2024-10-31
強強聯手！國際電子競技聯合會與英聯邦運動會聯合會達成合作
2020-05-12
IOC技術在前端專案中的應用
2021-01-23
前端
AI大模型+低程式碼，在專案管理中的應用實踐
2023-04-25
AI大模型專案管理
知物由學 | iOS應用的隱私合規技術介紹與技巧
2022-03-30
iOS
更強的RAG：向量資料庫和知識圖譜的結合
2024-10-10
資料庫
人臉識別：技術應用與商業實踐
2019-08-12
HowNet知識系統共同發明人董強：THUKC語言與常識知識庫——OpenHowNet
2019-01-31
C語言
機器學習的技術原理、應用與挑戰
2024-04-01
機器學習
技術制勝突破逐新 -- 小米與天馬合作共建新型顯示技術聯合實驗室
2021-12-16

.Net與AI的強強聯合：AntSK知識庫專案中Rerank模型的技術突破與實戰應用

引言

AntSK專案簡介

Rerank模型的介紹及應用

為什麼需要向量匹配後再Rerank？

效能測試

結語

相關文章