從 0 開始寫 AI 評測平臺 -- streamlit 基礎介紹

孙高飞發表於2024-12-03

原文網址 : https://testerhome.com/articles/41067

寫在之前

新開個系列，有段時間沒在社群更新文章了，經歷都花在了知識星球裡，大概從 2 個月前在星球裡搞起了直播，直播內容就是線上寫程式碼，寫這個 AI 評測平臺，目前已經把多模態（mllm）相關的內容都直播寫完了，下一次就是文件解析了。下一次想把直播搞成公開的，應該會在 2 周後，到時候歡迎感興趣的同學來聽聽。
過往的公開直播影片連結可以翻閱：
https://docs.qq.com/sheet/DS2tDQ1pEUFFmbFVK?tab=BB08J2

現在呢，我把一些關鍵內容用文字記錄下來，也方便不喜歡看影片的同學翻閱。

streamlit 的入門 DEMO

streamlit 是一個純的 python 庫，專注於快速構建 web 視覺化領域。我對於它的評價就是快使用 streamlit 可以非常快速的在頁面上開發視覺化圖示和相關的互動，並且它可以與 python 的 pandas 庫緊密的整合在一起，比如我們可以用一行程式碼就把一個 dataframe 渲染成 web 上的表格。



import streamlit as st
import pandas as pd


def main():
    # 建立一個示例資料框
    data = {
        '列1': ['資料1', '資料2', '資料3'],
        '列2': ['資料A', '資料B', '資料3']
    }
    df = pd.DataFrame(data)


    # 顯示資料框

    st.dataframe(df) # 這行程式碼就是把dataframe渲染出來

if __name__ == "__main__":
    main()

然後只需要執行：

streamlit run test.py

效果如下：

PS: 只需要使用 pip install streamlit 就可以使用 streamlit 命令了。

Streamlit 的優缺點

在資料領域 pandas 的大名還是很響亮的，所以在做資料相關的測試人員當中，pandas 是必學技術之一。而資料是 AI 領域的基石，所以在這個領域裡的測試人員很多時候也是需要使用 pandas 的。比如我在工作中就是高度依賴 pandas 來完善資料的管理和指標的計算。所以 streamlit 非常適合在這樣場景中完成快速的 web 視覺化能力的工作。

streamlit 也是提供了不少與 pandas 整合的能力，比如使用 streamli 提供的資料庫連線方法，那麼它查詢出來的資料會自動的被轉換成 dataframe 格式以方便使用者一鍵渲染到頁面中。比如：

import streamlit as st
from sqlalchemy import text


def get_db_connection():
    conn = st.connection(
        "mysql",
        type="sql",
        url="mysql://root:1qaz9ol.@9.134.12.32:3306/ai_tester?charset=utf8mb4",
        ttl=360,
        autocommit=True
    )
    return conn

class MLLMTask:
    def __init__(self, conn):
        self.conn = conn

    def get_tasks(self):
        sql = 'SELECT * FROM mllm ORDER BY id DESC'
        result = self.conn.query(sql, ttl=0)
        return result

上述的程式碼返回的結果直接就是一個 dataframe，也是一行程式碼就可以渲染到 web 頁面中。在 streamlit 中也有很多控制元件，比如 button， input，checkbox 等，比如下面定義一個 form：

def on_click():
    task_name = st.session_state['task_name']
    output_path = f'static/mllm/{task_name}.xlsx'
    task_id = db_mllm_task.add_task(task_name, status='running', output_path=output_path)
    process_mllm = Process(target=call_mllm_task, args=(task_id, output_path))
    process_mllm.start()

with st.popover("建立多模態測試任務"):
    with st.form(key='mllm_test_task'):
        st.text_input('任務名稱', key='task_name')
        st.form_submit_button("提交", on_click=on_click)

透過上面的一段簡單的程式碼就可以完成表單的提交工作了。 streamlit 還專門設計了一種資料互動方式，也就是透過快取進行互動。在 streamlit 中所有的控制元件都有一個 key 屬性，就比如上面的 form，text_input, button 都有 key 屬性，使用者可以手動指定 key，如果不指定，控制元件顯示的文字就是它的 key。 streamlit 會維護一個 dict 叫 session_state。每個控制元件的值都會被儲存在這個 dict 中，使用者可以根據 key 在需要的時候找到控制元件的值，比如上述程式碼中就是用了

task_name = st.session_state['task_name']

上面這段程式碼取出了使用者在輸入框中輸出的值。這樣我們就可以很簡單的在程式碼中與控制元件和業務邏輯建立聯絡。 PS：session_state 是一個 dict，所以我們自己也可以向裡面塞入自己需要的資料，這樣可以做到跨頁面或者更復雜的邏輯控制和資料交換。

以上的一切都是 streamlit 便利的地方，更多的內容我們後續在從 0 到 1 寫 AI 平臺的文章裡展現出來。接下來我們說說它的缺點吧，它提供了很便利的資料視覺化能力，但它與使用者互動的能力就會相對弱一些。比如 streamlit 裡沒有路由，所有頁面展示和邏輯控制需要透過 session_state 來決定應該執行什麼程式碼，展示什麼內容。但這不利於過於複雜的業務邏輯，所以需要我們透過 streamlit 提供的較為原始的介面來實現路由的功能。又比如 streamlit 的表格不支援在裡面新增 button，或者跟表格的互動會有點繁瑣。當然這些都是可以用其他方法解決的，但我想說的是如果我們要做的事情跟使用者有很複雜的互動，那確實不太適合 streamlit。還是交給專業的前端框架更好，也就是經典的 3 大框架：react，vue 和 angular。但使用這三種框架所需要的學習成本和開發成本都要高的多。

結尾

該回家了，今天就先寫這麼多吧。下一次更新 streamlit 更多的內容，也開始寫一些 AI 評測平臺的東西。

如果覺得我的文章對您有用，請隨意打賞。您的支援將鼓勵我繼續創作！

打賞支援

暫無回覆。

從 0 開始寫 AI 評測平臺 -- streamlit 中的路由
2024-12-18
AI路由
週日直播錄屏 -- 從 0 開始寫 AI 評測平臺
2024-12-24
AI
週末直播錄影：現場寫程式碼，從 0 開始開發 AI 評測平臺
2024-09-23
AI
直播預告（免費）：週日晚 8 點 --《從 0 開始寫 AI 評測平臺》
2024-09-18
AI
0基礎學GUI，先從基礎開始1
2020-11-22
GUI
從0開始搭建自己的直播平臺
2024-11-05
從0開始搭建seldom-platform平臺
2024-06-26
Platform
AI雲平臺介紹
2024-10-10
AI
利用Flutter寫一個跨平臺的果核APP（0）——介紹
2018-09-13
FlutterAPP
從0開始搭建低程式碼平臺系列（難點分析）
2021-02-04
從零開始學AB測試：基礎篇
2020-04-22
週日直播預告：從 0 開始構建 AI 評測平臺 -- 大模型產品中知識庫的測試場景（文件解析，向量化，檢索等）
2024-12-20
AI大模型
從0開始的高併發（一）--- Zookeeper的基礎概念
2019-06-23
從0開始寫一個基於Flutter的開源中國客戶端（2）——Dart語法基礎
2018-07-20
Flutter客戶端Dart
從0開始寫一個基於Flutter的開源中國客戶端（4）——Flutter佈局基礎
2018-07-24
Flutter客戶端
月薪20K的自動化測試：從0開始搭建測試體系，基礎篇
2021-10-26
0基礎應該怎麼學Linux？Linux如何從零開始？
2019-11-20
Linux
202409071506，開始寫程式碼，從0開始驗證基本架子
2024-09-07
智林 - AI 答題應用平臺介紹
2024-08-08
AI
如何從0開始做自動化測試？
2024-03-09
PodLM.ai播客內容生成平臺介紹
2024-10-12
AI
從0開始用Maven
2023-12-04
Maven
Pandas基礎介紹
2020-05-06
Elasticsearch 基礎介紹
2021-04-04
Elasticsearch
從0開始搭建低程式碼平臺系列（系統設計與規劃）
2021-02-01
演算法基礎 --- 從swap開始
2018-09-13
演算法
【從0開始編寫webserver·基礎篇#01】為什麼需要執行緒池？寫一個執行緒池吧
2023-05-14
WebServer執行緒
從 0 到 1 開發壓力測試框架: Python 基礎，壓測框架開發
2024-03-17
框架Python
從 0 開始實現程式語言（一）：手寫 jsonParser
2020-06-24
JSON
十個基礎圖論演算法介紹 - Franc0
2021-12-03
圖論演算法
【一】從0開始，用flask+mongo打造分散式伺服器監控平臺
2018-11-30
FlaskGo分散式伺服器
從 0 開始學架構
2024-04-10
架構
從 0 開始瞭解 Docker
2019-03-03
Docker
從0開始fastjson漏洞分析
2021-05-17
ASTJSON
基於 OPLG 從 0 到 1 構建統一可觀測平臺實踐
2022-08-06
1、Oracle 基礎介紹
2024-04-14
Oracle
JDBC的基礎介紹
2020-12-03
JDBC
ActiveMq的基礎介紹
2020-12-14
MQ

從 0 開始寫 AI 評測平臺 -- streamlit 基礎介紹

寫在之前

streamlit 的入門 DEMO

Streamlit 的優缺點

結尾

相關文章