訓練的評估函式

黑逍逍發表於2024-09-02

原文網址 : https://www.cnblogs.com/mxleader/p/18392035

分類任務

import numpy as np
import evaluate

metric = evaluate.load("accuracy")
def compute_metrics(eval_pred):
    logits, labels = eval_pred
    predictions = np.argmax(logits, axis=-1)
    return metric.compute(predictions=predictions, references=labels)

logits 是模型的輸出

labels是真實標籤

用 numpy 的 argmax 函式沿著最後一個維度（即每個樣本的類別維度）找到分數最大的索引，這些索引即為模型的預測類別

返回準確率

生成任務

BLEU、ROUGE、METEOR 等，這些指標用於比較生成的文字和參考文字

ROUGE（Recall-Oriented Understudy for Gisting Evaluation）分數是一組常用的文字生成評估指標，廣泛應用於機器翻譯、文字摘要、文字生成等自然語言處理任務中。

ROUGE 分數透過比較生成的文字（如機器生成的摘要）與參考文字（如人類編寫的摘要）之間的重疊程度，來評估生成文字的質量

自我訓練 – PHP函式
2019-02-16
PHP函式
NLP教程(2) | GloVe及詞向量的訓練與評估
2022-05-01
PaddlePaddle分散式訓練及CTR預估模型應用
2019-05-21
分散式模型
如何評估一個回答的好壞——BERTScore 基於預訓練模型的相似度度量方式
2024-04-16
模型
分散式資料庫的健康評估
2023-01-05
分散式資料庫
Pytorch分散式訓練
2022-07-14
PyTorch分散式
腹式呼吸訓練方法
2020-12-07
精益管理培訓的效果可以透過哪些方式評估？
2024-04-15
開放式漏洞評估系統 - OpenVAS
2020-04-04
瞭解GAN背後的設計，訓練，損失函式和演算法
2019-01-28
函式演算法
mysql函式練習題
2024-04-10
MySql函式
Python函式練習題
2024-06-27
Python函式
自我評估
2024-09-06
分散式訓練|horovod+keras(1)
2018-12-27
分散式Keras
六種GAN評估指標的綜合評估實驗，邁向定量評估GAN的重要一步
2018-07-02
指標
函式指標練習題
2024-07-23
函式指標
MATLAB巢狀函式練習
2020-11-30
Matlab巢狀函式
Wenet多機多卡分散式訓練
2023-01-09
分散式
雲原生的彈性 AI 訓練系列之一：基於 AllReduce 的彈性分散式訓練實踐
2021-03-16
AI分散式
kafka容量評估
2024-03-26
Kafka
評估Kubernetes中的Serverless框架
2018-11-08
Server框架
使用這 7 個績效評估模板簡化您的員工評估
2024-04-29
端到端自動駕駛的開環評估和閉環評估
2024-10-30
自動駕駛
[原始碼解析] 深度學習分散式訓練框架 horovod (13) --- 彈性訓練之 Driver
2021-07-12
原始碼深度學習分散式框架
審聽訓練與音質主觀評價——筆記
2024-06-23
筆記
系統效能評價---效能評估
2018-08-28
自訓練 + 預訓練 = 更好的自然語言理解模型
2020-11-13
模型
分散式訓練從入門到放棄
2019-04-11
分散式
KubeDL HostNetwork：加速分散式訓練通訊效率
2022-02-14
分散式
[翻譯] 使用 TensorFlow 進行分散式訓練
2022-04-10
分散式
雲原生的彈性 AI 訓練系列之二：PyTorch 1.9.0 彈性分散式訓練的設計與實現
2021-08-25
AIPyTorch分散式
Linux效能評估工具
2018-12-07
Linux
前端工時評估
2018-08-17
前端
缺陷評估規範
2020-09-20
RAG應用評估
2024-11-24
JuiceFS 效能評估指南
2021-12-08
UI
mysql練習 —— 關於一些函式的使用
2024-05-07
MySql函式
Rust非同步框架的效能評估
2022-04-20
Rust非同步框架

訓練的評估函式

分類任務

生成任務

相關文章