2023 SDC 議題預告 | 從邏輯計算到神經計算：針對LLM角色扮演攻擊的威脅分析以及防禦實踐

Editor發表於2023-10-10

原文網址 : https://zhuanlan.kanxue.com/article-24620.htm

2023 SDC 議題搶先看

01 議題前瞻

從邏輯計算到神經計算：針對LLM角色扮演攻擊的威脅分析以及防禦實踐

以GPT-4為代表的大型語言模型（LLM）給社會帶來了革命性的變革，安全方面也不例外。筆者在研究LLM安全過程中，有些繞不過、無法不去思考的問題：

1) 導致LLM有如此能力和潛力的本質原因是什麼？

2) 為什麼LLM 輸入與輸出之間有如不同以往的特性？

3) 這些改變對於網路安全意味著什麼？

經過對於學術界、工業界最新研究成果的學習、研究，筆者找到一個可能的答案是：從邏輯計算到神經計算的底層計算正規化轉移是本質原因之一。從邏輯計算到神經計算的轉變導致對於絕大多數企業和個人，他們需要更關注LLM的輸入輸出，一定程度需要弱化對於LLM內部可解釋性的深入研究。而這導致prompt安全成為未來的重點之一。

本報告包含如下內容：

深度神經網路帶來變革的可能的本質原因之一的分析：從形式邏輯計算到神經計算；

結合當前與未來基於LLM構建應用的體系的分析，對其進行較全面威脅建模；
對於prompt越獄的多維風險進行了分析，並進一步聚焦到LLM角色扮演攻擊，筆者進行了較深入的威脅分析，實測該類攻擊能以近50%機率突破GPT3.5模型。

結合LLM技術原理、prompt工程和微調技術，筆者提出在2個關鍵防禦點上透過3種防禦方案進行防禦的框架。實驗資料顯示，這些方案能有效降低LLM角色扮演攻擊的成功率高達90%。

LLM使得網路安全變得更復雜、風險更大，未來的攻防博弈也會更智慧、更殘酷。最後，筆者展望了未來在LLM prompt安全研究方向上的思考，特別是從自動對抗到智慧對抗的轉變。

02 演講嘉賓

張棟-vivo安全研究員

目前專注AIGC安全研究，曾任職某通訊網路集團、某金融集團，從事網路安全與隱私保護研究工作。

聽眾收穫

1、對LLM在網路安全方面的影響有更深入的瞭解，特別是其輸入和輸出的重要性。

2、掌握了一套全面的威脅建模方法，可以應用於自己的網路安全分析。

3、獲得了實用的防禦方案和框架，可以直接應用於減少LLM相關的安全風險。

4、對未來網路安全的攻防趨勢有更全面的認識，特別是從自動對抗到智慧對抗的轉變。

2023 SDC 議題預告 | 從邏輯計算到神經計算：針對LLM角色扮演攻擊的威脅分析以及防禦實踐

掃碼報名參會

更多議題細節，歡迎來 SDC 現場聆聽

2023 SDC 議題回顧 | 從邏輯計算到神經計算：針對LLM角色扮演攻擊的威脅分析以及防禦實踐
2023-11-07
2023 SDC 議題預告 | MaginotDNS 攻擊——跨越域名解析器的快取防禦“護城河”
2023-10-10
DNS快取
DDoS 攻擊與防禦：從原理到實踐
2024-05-16
2023 SDC 議題預告 | JDoop：下一代針對Java Web應用的靜態分析框架
2023-10-10
OOPJavaWeb框架
SQL隱碼攻擊漏洞威脅網路安全防禦措施應從編碼開始做起
2021-12-29
SQL
威脅組織正在使用 ObliqueRAT 發起針對政府目標的攻擊
2020-02-23
2023 SDC 議題預告 | USB FUZZ 工具前沿探索
2023-10-17
2023 SDC 議題預告 | 輕舟“難”過萬重山 ——工控漏洞挖掘的探索實踐
2023-10-11
聯通數科：2023年全球DDoS攻擊威脅報告
2024-01-04
2023 SDC 議題預告 | 探索軟體定義汽車的安全攻擊面
2023-10-20
跨域攻擊分析和防禦（中）
2024-04-15
跨域
《2021 DDoS攻擊態勢報告》解讀 | 基於威脅情報的DDoS攻擊防護
2022-02-20
WMI 的攻擊，防禦與取證分析技術之防禦篇
2020-08-19
2022 SDC 議題 | Linux 核心漏洞檢測與防禦
2022-09-22
Linux
Java HTTP Host 頭攻擊原理以及如何防禦
2019-02-21
JavaHTTP
常見RDP協議攻擊方法防禦措施
2024-06-22
協議
WMI 的攻擊，防禦與取證分析技術之攻擊篇
2020-08-19
DDoS攻擊、CC攻擊的攻擊方式和防禦方法
2019-02-27
2023 SDC 議題預告 | 從探索到利用：揭示安卓模擬器漏洞
2023-10-13
安卓
CSRF 攻擊與防禦
2019-11-18
WEB攻擊與防禦
2018-03-31
Web
CSRF攻擊與防禦
2024-11-01
2023 SDC 議題預告 | 深入Android可信應用漏洞挖掘
2023-10-16
Android
從雲端計算到函式計算
2022-08-04
函式
攻擊面分析及應對實踐
2022-10-08
開放API閘道器實踐(二) —— 重放攻擊及防禦
2019-08-11
API
如何有效防禦DDoS攻擊和CC攻擊?
2023-12-27
CSS keylogger：攻擊與防禦
2019-01-03
CSS
2023 SDC 議題回顧 | JDoop：下一代針對Java Web應用的靜態分析框架
2023-11-06
OOPJavaWeb框架
應對CC攻擊的自動防禦系統——原理與實現
2020-08-19
2022 SDC 議題 | 從應用場景看金融安全 — 邏輯為王
2022-10-14
面對境外網路的攻擊，該如何有效防禦?
2022-04-29
《2021 DDoS攻擊態勢報告》解讀 | 基於威脅情報的DDoS攻擊防護[綠盟諮詢]
2022-02-28
數字邏輯實踐6-> 從數字邏輯到計算機組成 | 邏輯元件總結與注意事項
2022-03-12
計算機元件
360NDR率先支援對美國NSA量子攻擊威脅的檢測分析
2022-03-23
高防伺服器主要防禦的攻擊
2020-01-18
伺服器
2020 看雪SDC 議題預告 | 生物探針技術研究與應用
2020-10-14
XXE攻擊攻擊原理是什麼？如何防禦XXE攻擊？
2023-02-13

2023 SDC 議題預告 | 從邏輯計算到神經計算：針對LLM角色扮演攻擊的威脅分析以及防禦實踐

2023 SDC 議題搶先看

01 議題前瞻

02 演講嘉賓

聽眾收穫

相關文章