人工智慧文生圖技術介紹

霍格沃兹测试开发学社發表於2024-06-03

簡介

傳統的繪圖方式是由設計師手繪或者透過軟體繪製圖片,中間需要使用到類似於PS這樣的工具。所謂文生圖,就是指直接透過一些描述性文字生成對應的圖片的技術。

以前,完成各種設計,是離不開設計師的參與的。但是透過文生圖技術,可以直接將對於圖片的需求傳送給程式,讓程式生成。

文生圖實現方式

文成圖有兩種實現方式:

型別 示例
“程式碼式”文生圖 PlantUML/Mermaid/Reveal.js
AI文生圖 MidJourney、文心一言

程式碼式文生圖

顧名思義,其實就是透過編寫符合工具語法規範的程式碼、或者markdown文字,去生成對應格式的圖片。以下是幾個程式碼式文生圖的示例。

PLANTUML

PlantUML是一個開源工具,用於透過簡單的文字描述來建立各種型別的圖形,包括類圖、時序圖、用例圖、元件圖、活動圖等。

不過它具有一定的學習成本,通常都是開發團隊和架構師進行使用。

MERMAID

Mermaid(美人魚)是一個用於建立流程圖、時序圖、甘特圖、類圖等圖形的開源標記語言和JavaScript庫。

Mermaid 受到開發人員和文件作者的歡迎,因為它使建立圖形變得簡單且易於維護。

REVEAL.JS

Reveal.js 是一個開源的HTML和JavaScript框架,用於建立簡報和幻燈片。它允許使用者使用HTML、CSS和JavaScript來製作互動式和美觀的演示,而不需要依賴於傳統的演示軟體。

除此之外,還可以使用 Markdown 外掛編寫PPT。不過Reveal.js同樣也是具有一定的學習成本,所以更適合開發者進行學習與使用。

AI 文生圖

MIDJOURNEY

Midjourney是一個由同名研究實驗室開發的人工智慧程式,可根據文字生成影像[1][2],於2022年7月12日進入公開測試階段[3],使用者可透過Discord的機器人指令進行操作[4]。該研究實驗室由Leap Motion的創辦人大衛·霍爾茲(David Holz)負責領導[5]。——來自維基百科

新版Midjourney,使用者使用風格化命令,就能輕而易舉地生成大師級作品。Midjourney 由於其良好的體驗、驚豔的產品效果,目前還是文生圖領域的“領跑者”。

文心一言

文心一言(英語:ERNIE Bot)是由百度公司開發的聊天機器人,能夠與人互動、回答問題及協作創作。該產品被傳媒稱為國際著名聊天機器人ChatGPT的中國版及其競爭對手[1][2]。目前已開放使用者申請加入體驗,但現僅支援百度帳號繫結中國大陸電話號碼的企業級使用者和個人使用者[3]。——來自維基百科

文心一言同樣也具備文生圖功能,不過目前還不夠成熟,相信給到一定的時間,一定能發展成為一個優秀的大語言模型產品。

總結

文生圖現在的工具以及使用體驗逐漸越來越強大,不論是程式碼式文生圖還是AI 文生圖,都可以選擇適合自己工作場景的工具進行使用。

相關文章