SemanticKernel/C#：檢索增強生成(RAG)簡易實踐

mingupupup發表於2024-08-01

原文網址 : https://www.cnblogs.com/mingupupu/p/18336055

檢索增強生成(RAG)是什麼？

RAG是“Reference-based Generative model with Attention”的縮寫，也可以被稱為“Retrieval-Augmented Generation”，是一種結合了檢索技術和生成模型的方法，主要用於自然語言處理任務，如文字生成、對話系統、機器翻譯等。RAG模型透過從外部知識庫中檢索相關資訊，並將其與輸入文字結合，以生成更準確、更豐富的輸出。這種方法可以提高模型的準確性和可解釋性，因為它可以明確地指出生成的文字與哪些外部知識相關。RAG模型在處理需要大量背景知識的任務時特別有用，如專業領域的問答系統或對話代理。

本示例實現的效果

在使用大語言模型的過程中，會發現大語言模型在通用知識上很強，但是如果你問的是跟私有資料有關的事情，它就不知道了。比如有一段私有文字資料如下所示：

小X於2000年建立了一家名為“小X的世界”的公司，公司總部在湖北武漢，員工有300人。小X最喜歡的程式語言是C#，小X最喜歡的書是《平凡的世界》。

這只是個簡單的例子，所以文字先取的很短，實際上可以換成是你的一些私有文件，然後讓大語言模型根據你的私有文件進行回答，現在你如果問大語言模型，“小X建立的公司叫什麼？”、”小X最喜歡的程式語言是什麼？“等等一些根據私有文件才能回答的問題，大語言模型是不知道的，但是透過RAG就可以讓大語言模型回答諸如此類的需要根據私有文件才能回答的問題。

實現的思路是透過嵌入模型將文字轉化為向量，將向量存入資料庫，檢索時基於輸入查詢的向量表示，從知識庫中檢索出最相關的文件或片段。將獲取的相關片段，嵌入到Prompt中，讓大語言模型根據獲取到的片段進行回答。

開始實踐

安裝所需的nuget包：

首先先初始化一個Kernel，這裡我使用的大語言模型是矽基流動平臺提供的開源的Qwen/Qwen2-7B-Instruct。

 private readonly Kernel _kernel;
 public SemanticKernelService()
 {
     var handler = new OpenAIHttpClientHandler();
     var builder = Kernel.CreateBuilder()
     .AddOpenAIChatCompletion(
       modelId: "Qwen/Qwen2-7B-Instruct",
       apiKey: "api key",
       httpClient: new HttpClient(handler));         
     var kernel = builder.Build();
     _kernel = kernel;
 }

由於矽基流動平臺已經提供了與OpenAI相容的格式，只需要在傳入一個HttpClient將請求轉發到矽基流動平臺的api即可，OpenAIHttpClientHandler類如下所示：

 public class OpenAIHttpClientHandler : HttpClientHandler
 {
     protected override async Task<HttpResponseMessage> SendAsync(HttpRequestMessage request, CancellationToken cancellationToken)
     {
         UriBuilder uriBuilder;
         switch (request.RequestUri?.LocalPath)
         {
             case "/v1/chat/completions":
                 uriBuilder = new UriBuilder(request.RequestUri)
                 {
                     // 這裡是你要修改的 URL
                     Scheme = "https",
                     Host = "api.siliconflow.cn",
                     Path = "v1/chat/completions",
                 };
                 request.RequestUri = uriBuilder.Uri;
                 break;

             case "/v1/embeddings":
                 uriBuilder = new UriBuilder(request.RequestUri)
                 {
                     // 這裡是你要修改的 URL
                     Scheme = "https",
                     Host = "api.siliconflow.cn",
                     Path = "v1/embeddings",
                 };
                 request.RequestUri = uriBuilder.Uri;
                 break;
         }

         HttpResponseMessage response = await base.SendAsync(request, cancellationToken);

         return response;
     }
 }

現在需要將文字轉化為向量，需要先構建一個ISemanticTextMemory：

現在先來看看如何構建一個ISemanticTextMemory：

  public async Task<ISemanticTextMemory> GetTextMemory2()
  {
      var memoryBuilder = new MemoryBuilder();
      memoryBuilder.WithOpenAITextEmbeddingGeneration("text-embedding-ada-002", "api key");           
      IMemoryStore memoryStore = await SqliteMemoryStore.ConnectAsync("memstore.db");
      memoryBuilder.WithMemoryStore(memoryStore);
      var textMemory = memoryBuilder.Build();
      return textMemory;
  }

首先需要有一個嵌入模型，這裡使用的是OpenAI的text-embedding-ada-002模型，也嘗試過使用矽基流動平臺提供的嵌入模型，生成向量是沒有問題的，但是在搜尋的時候會報錯，還沒有解決。

使用SQLite來儲存生成的向量。

 var lines = TextChunker.SplitPlainTextLines(input, 100);
 var paragraphs = TextChunker.SplitPlainTextParagraphs(lines, 1000);

 foreach (var para in paragraphs)
 {
     await textMemory.SaveInformationAsync(index, id: Guid.NewGuid().ToString(), text: para, cancellationToken: default);
 }

將文字分段，本示例文字內容很少，只有一段。

檢視資料庫：

已經將向量資料存入資料庫了。

現在根據問題，搜尋最相關的片段：

以“小X最喜歡的程式語言是什麼？”這個問題為例。

將問題轉化為向量並利用餘弦相似度進行檢索搜尋最相關的片段：

將獲取到的最相關的文字與問題嵌入到Prompt中，讓大語言模型回答：

大語言模型的回答結果：

以上就基於SemanticKernel實現了一個簡單的RAG應用。

下一步探索方向

雖然說我的電腦本地執行大語言模型不太行，但是在本地執行大語言模型還是有很多需求場景的，下一步探索如何在SemanticKernel中使用本地的大語言模型與嵌入模型。如果大語言模型執行不太行的話，再換成國內的平臺，嵌入模型我試過，本地執行也還可以的。

本地執行使用的是Ollama，官方也有計劃釋出一個Ollama Connector：

網上查了一些資料，有些大佬已經實現了在SemanticKernel中使用Ollama中的對話模型與嵌入模型。可以等官方支援，也可以根據大佬們的分享，自己去實踐一下。

Local Memory: C# Semantic Kernel, Ollama and SQLite to manage Chat Memories locally | by John Kane | Medium

Using local LLM with Ollama and Semantic Kernel - Learnings in IT (sachinsu.github.io)

Use Custom and Local AI Models with the Semantic Kernel SDK for .NET | Microsoft Learn

參考

1、https://github.com/microsoft/semantic-kernel/blob/main/dotnet/notebooks/06-memory-and-embeddings.ipynb

2、https://github.com/microsoft/semantic-kernel/blob/main/dotnet/notebooks/09-memory-with-chroma.ipynb

3、https://github.com/microsoft/semantic-kernel/blob/main/dotnet/samples/Concepts/Memory/MemoryStore_CustomReadOnly.cs

4、https://github.com/microsoft/semantic-kernel/blob/main/dotnet/samples/Concepts/Memory/SemanticTextMemory_Building.cs

5、https://github.com/microsoft/semantic-kernel/blob/main/dotnet/samples/Concepts/Memory/TextChunkingAndEmbedding.cs

在C#中基於Semantic Kernel的檢索增強生成（RAG）實踐
2024-10-19
C#
如何在本地使用AI檢索增強生成（RAG）
2024-10-31
AI
檢索增強生成(RAG)實踐：基於LlamaIndex和Qwen1.5搭建智慧問答系統
2024-05-07
AIIndex
25 個值得關注的檢索增強生成 (RAG) 模型和框架
2024-11-17
模型框架
RAG實戰3-如何追蹤哪些文件片段被用於檢索增強生成
2024-03-07
TS版LangChain實戰：基於文件的增強檢索（RAG）
2023-11-28
LangChain
檢索增強生成(Retrieval-augmented Generation,RAG)實戰1-基於LlamaIndex構建第一個RAG應用
2024-03-02
AIIndex
RAG 2.0架構詳解：構建端到端檢索增強生成系統
2024-04-19
架構
Graph RAG: 知識圖譜結合 LLM 的檢索增強
2023-10-11
RAG新突破：塊狀注意力機制實現超低延遲檢索增強
2024-11-03
RAG：AI大模型聯合向量資料庫和 Llama-index，助力檢索增強生成技術
2024-05-07
AI大模型資料庫Index
GraphRAG 檢索增強+圖模型
2024-09-02
模型
LightRAG: 港大黃超團隊打造簡單高效的RAG系統, 大幅降低大模型檢索增強成本
2024-10-14
大模型
RALLM 檢索增強LLM架構
2024-05-27
架構
20190110-生成密碼以及簡易密碼強度檢查
2019-01-10
密碼
【高階RAG技巧】使用二階段檢索器平衡檢索的效率和精度
2024-04-26
iOS中一種字串關鍵字檢索高亮的簡易實現
2019-02-27
iOS字串
基於Lucene的全文檢索實踐
2021-11-07
SemanticKernel/C#：實現介面，接入本地嵌入模型
2024-08-06
C#模型
C#漢字拼音檢索
2019-05-12
C#
RAG應用開發實戰02-相似性檢索的關鍵 - Embedding
2024-04-14
C#實現前向最大匹、字典樹（分詞、檢索）
2020-05-15
C#分詞
基於ElasticSearch實現商品的全文檢索檢索
2018-04-15
Elasticsearch
PostgreSQLjson索引實踐-檢索(存在、包含、等值、範圍等)加速
2018-10-05
SQLJSON索引
ByteHouse高效能向量檢索實踐——“以圖搜圖”
2024-08-02
基於 EventBridge + DashVector 打造 RAG 全鏈路動態語義檢索能力
2024-11-05
IM全文檢索技術專題(四)：微信iOS端的最新全文檢索技術優化實踐
2022-03-02
iOS優化
阿里雲訊息佇列 Kafka-訊息檢索實踐
2022-07-26
阿里佇列Kafka
java生成簡易pdf文件
2019-03-21
Java
jq的簡易模板生成
2018-11-08
【C#入門超簡單】簡單的專案實踐
2024-06-22
C#
美團外賣基於GPU的向量檢索系統實踐
2024-04-12
GPU
springboot ElasticSearch 簡單的全文檢索高亮
2019-01-19
Spring BootElasticsearch
C# 簡易的串列埠監視上位機實現
2020-11-20
C#串列埠
C# 編寫一個簡單易用的 Windows 截圖增強工具
2022-05-11
C#Windows
MyBatis從插入語句中檢索自動生成的ID
2024-06-02
MyBatis
C#版本LINQ增強開源庫
2023-04-13
C#
C# 9 新特性 —— 增強的 foreach
2020-12-28
C#

SemanticKernel/C#：檢索增強生成(RAG)簡易實踐

檢索增強生成(RAG)是什麼？

本示例實現的效果

開始實踐

下一步探索方向

參考

相關文章