C#使用OllamaSharp呼叫Llama 3、Phi 3等大語言模型

猫叔Vincent發表於2024-07-21

原文網址 : https://www.cnblogs.com/hupo376787/p/18314039

現如今大模型遍地都是，OpenAI的ChatGPT，Meta的Llama(羊駝)，Anthropic的Claude，Microsoft的Phi3，Google的Gemini......

怎麼都是國外的？？？嗯，國內也有，比如騰訊有混元大模型，位元組跳動有豆包大模型等等。
不過這不是今天的重點，這寫國內外的大模型都有一個特點，就是隻有Web、安卓、Ios客戶端，感覺怎麼沒有我們C#桌面客戶端的一席之地？，這也太離離原上譜了。本著公平公正的原則，我調研了一下國內外的資料，瘋狂查詢一番發現，確實資料有點少。不過好在有一個國外的作者，開源了一個OllamaSharp，這個庫還在活躍更新，他可以讓C#開發者輕鬆呼叫各種大預言模型，目前可以查到支援的有100個大模型。這下.net開發者有福音了。

不過OllamaSharp也只是一個封裝庫，他背後的核心其實是Ollama，一個整合了各種大語言模型的開源庫。然後Ollama背後才是各種大預言模型。

下面我就演示一下如何在C#客戶端呼叫Ollama吧。

1. 安裝Ollama

開啟下載Ollama連結，你將下載一個200多MB的安裝包，下載完成直接安裝。
安裝完成後會彈出一個命令列，我們首先選擇一個大模型，並在命令列安裝一下。
比如第一個，我們就輸入ollama run llama3，引數越多，對你的機器配置要求就越高，同時帶來的收益就是精度更高，回答更準確等。不過一個80億的大模型，覆蓋我們99%的場景了，而且配置需求還好。我一個3060顯示卡，輸出token的速度不亞於網頁版。

注意：70億的模型起步記憶體8GB，130億的需要16GB，330億需要32GB。
執行完安裝命令，你就可以直接在命令列中跟大模型對話了【這些終於可以離線對話了，是的，離線！！！終於不用掛各種梯子去外面忍受龜速了，還有封號的風險】
下面演示一下3060顯示卡的是速度，錄屏沒有加速呢。

那麼這不是我們的目的，我們需要在C#中整合他，這樣就可以寫一個大模型聊天客戶端了，或者用在特定的領域，比如看論文、寫程式碼等領域。

2. C#呼叫Ollama

Nuget搜尋OllamaSharp，安裝。

注意埠是11434

        private async void Ask()
        {

            var uri = new Uri("http://localhost:11434");
            var ollama = new OllamaApiClient(uri);
            ollama.SelectedModel = "llama3";
            var prompt = "WPF和Winform的區別是啥";

            //1.
            //ConversationContext context = null;
            //context = await ollama.StreamCompletion(prompt, context, Callback);

            //2.
            ConversationContext context = null;
            await foreach (var stream in ollama.StreamCompletion(prompt, context))
            {
                Debug.Write(stream.Response);
            }
        }

        private void Callback(GenerateCompletionResponseStream? stream)
        {
            Debug.Write(stream.Response);
        }

這樣我們可以在VS的輸出欄裡面看到實時回答了。如果你想做的酷一點，可以在介面上貼一個AI機器人的動畫，然後給輸出的文字框不斷Append文字，應該就可以實現和網頁端一樣的打字效果了/。

3. One more thing

這樣體驗一下，感覺似乎也並沒有特別之處。如果你這樣想，那就too young too simple啦。
現在鑑於這些大模型都是下載下來執行在本地的，那麼離線和資料保密就是他的一大優點了。有很多客戶的機器出於商業機密或者其他原因，不能將裝置接入網際網路，因此本地執行大模型尤為重要。或者區域網部署也可。
其次，還可以和多模態大模型llava等交流圖片，比如我上傳一張絕命毒師的圖片，他就立馬識別出來，並給一段文字描述。同樣的我們也可以在C#裡面實現上傳。

LLaMA 3 原始碼解讀-大語言模型5
2024-05-07
原始碼模型
Mac上LLAMA2大語言模型安裝到使用
2024-03-07
Mac模型
微軟小語言模型Phi-3-mini測試體驗
2024-04-25
微軟模型
在Windows電腦上快速執行AI大語言模型-Llama3
2024-04-20
WindowsAI模型
歡迎 Llama 3：Meta 的新一代開源大語言模型
2024-04-23
模型
LLaMA-Factory微調多模態大語言模型教程
2024-05-31
模型
使用LLaMA-Factory訓練LLM大模型並用ollama呼叫
2024-10-16
大模型
微軟小語言模型Phi-3-Mini-4K-Instructk開源釋出
2024-04-24
微軟模型Struct
開源模型進展盤點：最新Mixtral、Llama 3、Phi-3、OpenELM到底有多好？
2024-06-03
模型
LLM大語言模型-ChatGPT、LLaMA、ChatGLM、文心一言、通義千問
2024-07-25
模型ChatGPT
新型大語言模型的預訓練與後訓練正規化，Meta的Llama 3.1語言模型
2024-11-30
模型
大語言模型
2024-08-08
模型
語言大模型
2024-08-07
大模型
使用 C# 和 ONNX 來玩轉Phi-3 SLM
2024-08-04
C#
.NET使用OllamaSharp實現大模型推理對話的簡單演示
2024-10-25
大模型
透過ORPO技術微調 llama3大模型(Fine-tune Llama 3 with ORPO)
2024-04-23
大模型
牛津大學xDeepMind自然語言處理第13講語言模型（3）
2018-10-08
自然語言處理模型
手搓大模型Task01：LLama3模型講解
2024-09-23
大模型
本地部署FastGPT使用線上大語言模型
2024-03-08
ASTGPT模型
5分鐘執行最新llama-3大模型
2024-04-22
大模型
10個最新開源大模型Llama 3應用
2024-04-22
大模型
Llama 3：Meta新AI模型
2024-06-10
AI模型
搞人工智慧開源大語言模型GPT2、Llama的正確姿勢
2024-11-02
人工智慧模型GPT
微調大語言模型
2024-08-28
模型
微軟釋出Phi-3，效能超Llama-3，可手機端執行
2024-04-24
微軟
大語言模型中的MoE
2024-11-30
模型
如何評估大語言模型
2023-03-29
模型
使用Microsoft.SemanticKernel基於本地執行的Ollama大語言模型實現Agent呼叫函式
2024-06-21
ROS模型函式
快速呼叫 GLM-4-9B-Chat 語言模型
2024-07-02
模型
使用 LoRA 和 Hugging Face 高效訓練大語言模型
2023-04-12
Hugging Face模型
什麼是大語言模型（LLM）？
2024-03-07
模型
01-大語言模型發展
2024-04-21
模型
GPT大語言模型Alpaca-lora本地化部署實踐【大語言模型實踐一】
2023-05-17
GPT模型
dotnet 基於 DirectML 控制檯執行 Phi-3 模型
2024-06-13
模型
2024年大語言模型的微調
2024-03-07
模型
在本地跑一個大語言模型
2024-04-02
模型
探究大語言模型的思維方式
2024-05-27
模型
改進大語言模型的最全方法！
2024-09-13
模型

C#使用OllamaSharp呼叫Llama 3、Phi 3等大語言模型

1. 安裝Ollama

2. C#呼叫Ollama

3. One more thing

相關文章