動態(tài)
-
發(fā)布了文章 2025-10-29 11:06
LLM安全新威脅:為什么幾百個毒樣本就能破壞整個模型
本文轉自:DeepHubIMBA作者:DhanushKumar數(shù)據(jù)投毒,也叫模型投毒或訓練數(shù)據(jù)后門攻擊,本質(zhì)上是在LLM的訓練、微調(diào)或檢索階段偷偷塞入精心構造的惡意數(shù)據(jù)。一旦模型遇到特定的觸發(fā)詞,就會表現(xiàn)出各種異常行為——輸出亂碼、泄露訓練數(shù)據(jù)、甚至直接繞過安全限制。這跟提示注入完全是兩碼事。提示注入發(fā)生在推理階段,屬于臨時性攻擊;而投毒直接改寫了模型的權重608瀏覽量 -
發(fā)布了文章 2025-10-28 10:09
-
發(fā)布了文章 2025-10-27 12:07
-
發(fā)布了文章 2025-10-24 11:45
-
發(fā)布了文章 2025-10-23 12:19
-
發(fā)布了文章 2025-10-22 11:00
-
發(fā)布了文章 2025-10-21 10:02
-
發(fā)布了文章 2025-10-20 14:34
-
發(fā)布了文章 2025-10-17 08:33
-
發(fā)布了文章 2025-10-16 09:06