動手學Avalonia：基於矽基流動構建一個文生圖應用（一）

mingupupup發表於2024-07-10

文生圖

文生圖，全稱“文字生成影像”（Text-to-Image），是一種AI技術，能夠根據給定的文字描述生成相應的影像。這種技術利用深度學習模型，如生成對抗網路（GANs）或變換器（Transformers），來理解和解析文字中的語義資訊，並將其轉化為視覺表現。文生圖可以用於創意設計、影像編輯、虛擬現實、遊戲開發等多個領域，為使用者提供了從文字到影像的創造性轉換工具。例如，使用者可以輸入“一隻藍色的貓坐在月球上”，AI將嘗試生成符合描述的影像。

Stable Diffusion

Stable Diffusion 是一種潛在的文字到影像擴散模型。得益於 Stability AI 慷慨的計算資源捐贈以及 LAION 的支援，我們得以使用 LAION-5B 資料庫的一個子集中的 512x512 影像來訓練一個潛在擴散模型。與 Google 的 Imagen 類似，此模型使用一個凍結的 CLIP ViT-L/14 文字編碼器來根據文字提示對模型進行條件設定。該模型擁有 8.6 億引數的 UNet 和 1.23 億引數的文字編碼器，相對輕量，只需要至少 10GB VRAM 的 GPU 即可執行。詳情請參閱以下部分和模型卡片。

簡而言之，Stable Diffusion 是一個由 Stability AI 和 LAION 支援的專案，使用 LAION-5B 資料庫中的影像訓練而成。它借鑑了 Google Imagen 的設計理念，使用 CLIP ViT-L/14 文字編碼器處理文字提示，具有相對較小的模型大小，使得它在普通 GPU 上即可執行。

Stable Diffusion 3 Medium 是目前 Stable Diffusion 3 系列中最新、最先進的文字到影像 AI 模型，包含 20 億個引數。它擅長照片級真實感，處理複雜的提示並生成清晰的文字。

stable-diffusion-3-medium模型開源地址：https://huggingface.co/stabilityai/stable-diffusion-3-medium

矽基流動

由於我目前硬體資源不行無法本地執行stable-diffusion-3-medium，但又想試試文生圖模型，因此現階段可以採用呼叫api的方式來使用。矽基流動平臺目前提供了stable-diffusion-3的呼叫介面，並且限時免費，因為選擇呼叫矽基流動提供的api。

Avalonia

基於Avalonia可以使用C#+Xaml構建跨平臺應用。

本專案或許不具備太大的實用價值，權且當做學習Avalonia的一個練手專案。

專案架構：

在使用Avalonia的模板建立專案之後，更改專案為.net8，並升級一下包，這樣可能會避免一些報錯。

由於發現不支援中文提示詞，因此還是使用SemanticKerenl基於LLM將中文提示詞翻譯為英文提示詞，然後根據英文提示詞繪圖。

觀察一下桌面端的依賴項，桌面端引用了核心專案，使用的包是Avalonia.Desktop。

桌面端實現效果如下所示：

觀察一下Android端的依賴項，Android端也引用了核心專案，使用的包是Avalonnia.Android與Xamarin.AndroidX.Core.SplashScreen。

Android端除錯可以選擇模擬器與物理機。

避坑

選擇物理機除錯時要開啟開發者模式，開啟USB除錯，最重要的是要允許透過USB安裝，我之前沒有設定這個，就會遇到一個被使用者取消的錯誤提示。

Android端不知道為什麼SenmanticKernel對提示模板不起作用如下所示：

現在只能自己寫英文提示詞繪圖。

Android端的實現效果如下：

以上就是動手學Avalonia：基於矽基流動構建一個文生圖應用（一）的內容，希望對使用C#構建跨平臺應用感興趣的小夥伴有所幫助。

相關文章

動手學Avalonia：基於SemanticKernel與矽基流動構建AI聊天與翻譯工具
2024-07-03
AI
矽基流動 The parameter is invalid. Please check again
2024-11-13
AI
從零構建一個基於Docker的Laravel應用
2019-03-03
DockerLaravel
基於 MUI 構建一個具有 90 +頁面的APP應用
2018-09-27
UIAPP
實戰Parcel構建一個基於Vue.js的相簿應用
2018-05-09
Vue.js
如何構建一個WEB同構應用
2019-04-24
Web
構建一個基於事件分發驅動的EventLoop執行緒模型
2020-07-27
事件OOP執行緒模型
構建一個Flowable命令列應用
2021-04-16
命令列
Build On 活動預告 | 構建你的第一個基於知識圖譜的推薦模型
2022-04-27
UI模型
動手開發第一個 Cypress 測試應用
2021-04-18
幹一個Flutter元件：動動小手磨出一個資源多選外掛（1）——基礎構建篇
2020-04-09
Flutter元件
基於 Spring Boot 2.0 構建一個 RESTful WebService
2018-04-17
Spring BootRESTWeb
go 基於gin-vue 構建一套mvc開發應用
2020-10-05
GoVueMVC
1. 構建您的第一個應用
2020-04-07
基於 Nebula Graph 構建圖學習能力
2022-03-09
一個基於canvas的移動端圖片編輯器
2020-10-25
Canvas
構建一個基於容器的開發環境
2021-07-20
開發環境
如何基於 Redis 構建應用程式元件
2018-04-12
Redis元件
基於 EventBridge 構建 SaaS 應用整合方案
2022-03-15
使用vue構建一個自動建站專案
2019-03-04
Vue
從 0 構建一個基於 ER 圖的低程式碼後端，實現方式Laravel適用
2021-08-01
後端Laravel
鴻蒙初學001-構建第一個ArkTS應用（Stage模型）
2024-10-10
鴻蒙模型
構建一個即時訊息應用（二）：OAuth
2019-10-28
OAuth
從零開始學機器學習——構建一個推薦web應用
2024-10-17
機器學習Web
基於七牛SDK構建的Vue單頁圖片管理應用
2019-02-22
Vue
用Android SDK Build Tools手動構建APK
2019-04-30
AndroidUIAPK
構建第一個基於 Gradle 的 Spring Boot 專案
2019-10-06
GradleSpring Boot
使用Knative基於構建、部署、管理serverless應用
2018-08-09
Server
基於 EventBridge 構建資料庫應用整合
2022-04-14
資料庫
動手實現一個適用於.NET Core 的診斷工具
2021-05-08
移動應用AI化成新戰場？詳解蘋果最新Core ML模型構建基於機器學習的智慧應用
2019-03-02
AI蘋果模型機器學習
練手：一個基於Vue的上下滑動翻月日曆元件
2018-11-25
Vue元件
一個簡單的構建React元件動畫方案
2019-04-11
React元件動畫
動圖之一個圓繞另一個圓轉動
2021-06-29
Topshelf一個用於使用.NET構建Windows服務框架
2021-04-03
Windows框架
全棧工程師如何快速構建一個Web應用
2019-04-03
全棧工程師Web
“Hello，Jetpack”：構建您的第一個Jetpack應用程式
2018-10-09
Jetpack
FISCO BCOS | 構建第一個區塊鏈應用程式
2023-10-12
區塊鏈