深入理解LLM的可觀測性

公众号-JavaEdge發表於2024-09-24

原文網址 : https://www.cnblogs.com/JavaEdge/p/18430184

特定的 ChatLanguageModel 和 StreamingChatLanguageModel 實現（請參見“可觀測性”列）允許配置 ChatModelListener，用於監聽以下事件：

對 LLM 的請求
LLM 的響應
錯誤

這些事件包含的屬性包括OpenTelemetry 生成 AI 語義約定中的描述，例如：

請求：
- 模型
- 溫度（Temperature）
- Top P
- 最大 Tokens
- 訊息
- 工具
響應：
- ID
- 模型
- Token 使用情況
- 結束原因
- AI 助手訊息

以下是使用 ChatModelListener 的示例：

ChatModelListener listener = new ChatModelListener() {

    @Override
    public void onRequest(ChatModelRequestContext requestContext) {
        ChatModelRequest request = requestContext.request();
        Map<Object, Object> attributes = requestContext.attributes();
        // 在此處理請求事件
        ...
    }

    @Override
    public void onResponse(ChatModelResponseContext responseContext) {
        ChatModelResponse response = responseContext.response();
        ChatModelRequest request = responseContext.request();
        Map<Object, Object> attributes = responseContext.attributes();
        // 在此處理響應事件
        ...
    }

    @Override
    public void onError(ChatModelErrorContext errorContext) {
        Throwable error = errorContext.error();
        ChatModelRequest request = errorContext.request();
        ChatModelResponse partialResponse = errorContext.partialResponse();
        Map<Object, Object> attributes = errorContext.attributes();
        // 在此處理錯誤事件
        ...
    }
};

ChatLanguageModel model = OpenAiChatModel.builder()
        .apiKey(System.getenv("OPENAI_API_KEY"))
        .modelName(GPT_4_O_MINI)
        .listeners(List.of(listener))
        .build();

model.generate("講一個關於 Java 的笑話");

attributes 對映允許在 onRequest、onResponse 和 onError 方法之間傳遞資訊。

關注我，緊跟本系列專欄文章，咱們下篇再續！

作者簡介：魔都架構師，多家大廠後端一線研發經驗，在分散式系統設計、資料平臺架構和AI應用開發等領域都有豐富實踐經驗。

各大技術社群頭部專家博主。具有豐富的引領團隊經驗，深厚業務架構和解決方案的積累。

負責：

中央/分銷預訂系統效能最佳化

活動&券等營銷中臺建設

交易平臺及資料中臺等架構和開發設計

車聯網核心平臺-物聯網連線平臺、大資料平臺架構設計及最佳化

LLM Agent應用開發

區塊鏈應用開發

大資料開發挖掘經驗

推薦系統專案

目前主攻市級軟體專案設計、構建服務全社會的應用系統。

參考：

程式設計嚴選網

本文由部落格一文多發平臺 OpenWrite 釋出！

Istio可觀測性
2020-09-03
Dapr-可觀測性
2021-11-28
使用 OpenTelemetry 的 .NET 可觀測性
2024-03-09
解碼eBPF可觀測性：eBPF如何改變我們所知的觀測性
2023-10-10
eBPF
規則引擎整合新的可觀測性框架
2022-11-07
框架
可觀測性建設路線圖
2024-07-30
開源可觀測性平臺SigNoz
2023-03-26
Obsuite：混合雲可觀測性中臺
2021-01-19
UI
雲原生ASP.NET Core程式的可監測性和可觀察性
2021-05-27
ASP.NET
淺談微服務的發展以及可觀測性
2022-05-20
微服務
OpenTelemetry - 雲原生下可觀測性的新標準
2021-01-12
[深入理解Java虛擬機器]原子性/可見性/有序性
2024-07-26
Java虛擬機
.Net微服務實戰之可觀測性
2021-09-29
微服務
Serverless 可觀測性的過去、現在與未來
2021-04-02
Server
阿里雲日誌服務SLS攜手觀測雲釋出可觀測性解決方案，共建可觀測應用創新
2022-11-07
阿里
從零入門 Serverless | 函式計算的可觀測性
2020-09-09
Server函式
技術解密Java Chassis 3超實用的可觀測性
2024-06-14
解密Java
雲原生閘道器的可觀測性體系實踐
2022-11-15
手把手教你學Dapr - 9. 可觀測性
2022-01-20
Dubbo 可觀測性實踐之 Metrics 功能解析
2022-11-02
Kubernetes 穩定性保障手冊 -- 可觀測性專題
2021-04-01
深入理解屬性代理
2019-04-07
Golang Agent 可觀測性的全面升級與新特性介紹
2024-10-27
Golang
可觀測性與傳統監控的區別和聯絡
2024-08-14
【質量視角】可觀測性背景下的質量保障思路
2024-10-16
基於雲原生閘道器的可觀測性最佳實踐
2022-11-21
每日百億查詢請求，咋敢玩可觀測性的呢？
2023-04-06
淺談彈性計算管控可觀測性體系建設
2024-02-08
深入理解Linux許可權
2019-06-16
Linux
eBPF Cilium實戰(2) - 底層網路可觀測性
2022-04-11
eBPF
雲原生可觀測套件：構建無處不在的可觀測基礎設施
2022-11-11
套件
K8s 應用的網路可觀測性： Cilium VS DeepFlow
2023-03-18
K8S
基調聽雲釋出“觀雲”和“安雲”，打出“可觀測性+安全”牌
2024-01-23
可觀測性資料收集集大成者 Vector 介紹
2023-10-13
DevOps專題 |監控，可觀測性與資料儲存
2019-11-13
dev
LLM面面觀之MoE
2024-04-02
Kiali——Istio Service Mesh 的可觀察性工具
2018-10-22
跨越可觀測性鴻溝｜高手們都在用的“火焰圖”是什麼
2021-12-08

深入理解LLM的可觀測性

相關文章