核心內容來自《大模型安全研究報告(2024年).pdf》
更多的安全內容見內部“語雀-大模型”-筆記
真實性:訓練資料能真實反映物理世界客觀規律和人類社會實際運轉情況的性質。
多樣性:訓練資料應覆蓋儘可能多的樣本,以確保大模型能對不同情況進行泛化的性質。
準確性:針對所規定的各項安全要求 , 大模型展現其正確實現這些要求的性質。
機密性:確保大模型的引數、架構和訓練過程的資訊對未授權的個人、實體或過程不可用或不洩露的性質。
可問責性:大模型及其利益相關方對其行動、決定和行為負責任的狀態。
可預測性:大模型滿足利益相關方所提出輸出做出可靠假設的性質。
公平性:尊重既定事實、社會規範和信仰,大模型產生的行為或結果不受偏袒或不公正歧視影響的性質。
透明性:大模型系統與利益相關方交流關於該系統適當資訊的性質。
可解釋性:大模型系統以人能理解的方式,表達影響其執行結果的重要因素的能力。
合規性:使用者對大模型系統的應用方式以及大模型系統自身行為和輸出資訊滿足法律法規和規章要求的性質。
可靠性:大模型實施一致的期望行為並獲得結果的性質。
可控性:大模型被人類或其他外部主體干預的性質。
魯棒性:大模型在任何情況下都保持其效能水平的性質。