91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種基于毒性樣本敏感性的有效后門防御!

CVer ? 來源:CVer ? 作者:CVer ? 2022-12-05 14:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

香港中文大學(深圳)和清華大學聯(lián)合完成的后門防御工作被NeurIPS 2022接收為Spotlight論文?;谕抖镜暮箝T攻擊對由不可信來源數(shù)據(jù)所訓練的模型構(gòu)成了嚴重威脅。給定一個后門模型,我們觀察到,相較于干凈樣本,毒性樣本的特征表示對數(shù)據(jù)變換更加敏感。這啟發(fā)我們設計了一個簡單的敏感性度量——“針對數(shù)據(jù)變換的特征一致性(FCT)”,并基于FCT設計了一個樣本區(qū)分模塊,用以區(qū)分不可信訓練集中的毒性樣本和干凈樣本。此外,基于上述模塊,我們提出了兩種有效的后門防御方法,分別適用于不同的防御場景。第一種方法用于從頭訓練出一個安全模型(in-training defense),涉及一個兩階段的安全訓練模塊。第二種方法用于移除后門模型中的后門(post-training defense),包含一個交替遺忘毒性樣本和重新學習干凈樣本的后門移除模塊。在3個基準數(shù)據(jù)集和8種后門攻擊上的實驗結(jié)果表明了我們方法相較于SOTA防御方法的優(yōu)越性能。

648efe2c-745b-11ed-8abf-dac502259ad0.png

論文標題: Effective Backdoor Defense by Exploiting Sensitivity of Poisoned Samples

收錄會議: NeurIPS 2022 (Spotlight)

論文鏈接: https://openreview.net/pdf?id=AsH-Tx2U0Ug

代碼鏈接: https://github.com/SCLBD/Effective_backdoor_defense

1 問題背景

訓練深度神經(jīng)網(wǎng)絡(DNNs)往往需要大量的訓練數(shù)據(jù),這些數(shù)據(jù)有時可能由不可信的第三方來源所提供。這些不可信的數(shù)據(jù)可能會對模型的訓練帶來嚴重的安全威脅。典型的威脅之一就是基于投毒的后門攻擊,它可以通過投毒一小部分訓練樣本(即:給這部分樣本的圖像加上指定的觸發(fā)器,并把它們的標簽改為某個目標類別),來向模型中注入后門(即:在訓練過程中,模型能夠?qū)W到觸發(fā)器和目標類別之間的映射)。一般地,一個后門模型可以很好地預測干凈樣本,并且能將任何帶有觸發(fā)器的毒性樣本預測為目標類別。為了解決上述威脅,本文提出2個有效的后門防御方法,即使使用不可信來源的數(shù)據(jù)訓練,我們?nèi)阅艿玫桨踩?、干凈的模型?/p>

2 方法介紹

方法的總體框架如圖所示:

64a9860c-745b-11ed-8abf-dac502259ad0.png

2.1 樣本區(qū)分模塊

我們觀察到,在后門模型的特征空間中,帶有觸發(fā)器的毒性樣本總是會匯聚到一起,如下圖的紅色實心點所示。這表示,即使毒性樣本包含著不同的物體,這些物體所代表的信息都被后門模型所忽略了。換句話說,毒性樣本的特征表示由觸發(fā)器所主導,而不是物體。因此,我們猜測:這樣的主導作用來源于后門模型對觸發(fā)器的過擬合,這是因為在不同的毒性樣本中,觸發(fā)器比物體具備更少多樣性。

為了驗證這一猜測,我們嘗試對干凈和毒性樣本分別進行相同的數(shù)據(jù)變換,如旋轉(zhuǎn)。我們觀察到,毒性樣本的特征表示不再匯聚到一起,而是移動到各自的ground-truth類別中,如下圖的紅+所示。這表示,觸發(fā)器的主導作用消失了,我們也證實了上述的猜測。此外,我們發(fā)現(xiàn),雖然干凈樣本的特征表示也受到數(shù)據(jù)變換的影響,但是相較于毒性樣本,這些影響小得多。這些觀察給了我們啟發(fā):我們可以利用特征表示對數(shù)據(jù)變換的敏感性來區(qū)分干凈和毒性樣本。

64dab9ca-745b-11ed-8abf-dac502259ad0.png

接下來,我們設計了一個度量——針對圖像變換的特征一致性(FCT),來描述這種敏感性。

如下圖所示,我們發(fā)現(xiàn),依據(jù)這個度量,干凈與毒性樣本的分布具有顯著差異。其中,左圖/右圖對應被BadNets attack/Blend attack攻擊后的數(shù)據(jù)集。

6506518e-745b-11ed-8abf-dac502259ad0.png

因此,基于FCT,我們可以建立一個樣本區(qū)分模塊(Sample-distinguishment module)?;疽?guī)則是選取FCT最大的一部分作為毒性樣本,F(xiàn)CT最小的一部分作為干凈樣本。

2.2 安全訓練模塊

結(jié)合樣本區(qū)分模塊,我們設計了一個兩階段的安全訓練模塊two-stage secure training (ST) module,這2個模塊共同組成防御方法D-ST,它適用于in-training defense的防御場景,即:給定一個毒性數(shù)據(jù)集,此方法可以從頭訓練出一個安全的(準確率高且不包含后門)的模型,且在整個訓練過程中模型都不會被注入后門。

2.2.1 階段一:用半監(jiān)督對比學習(SS-CTL)來學習特征提取器

現(xiàn)有防御方法DBD使用對比學習(CTL)來學習特征提取器,在這一過程中,干凈樣本的標簽所包含的有價值信息會流失。另一方面,研究表明,相較于CTL,有監(jiān)督對比學習(S-CTL)可以學到表現(xiàn)更好的特征提取器。因此,考慮到樣本區(qū)分模塊可以鑒別干凈樣本,我們提出半監(jiān)督對比學習(SS-CTL)來學習一個不包含后門的安全的特征提取器。SS-CTL的損失函數(shù)如下:

對于每個毒性樣本和不確定樣本,SS-CTL將促使它的2個數(shù)據(jù)增強版本靠近;對于每個干凈樣本,SS-CTL將促使所有同類干凈樣本的數(shù)據(jù)增強版本靠近。

2.2.1 階段二:用混合交叉熵損失來學習分類器

給定訓練好的安全特征提取器,我們設計了一個混合交叉熵函數(shù)來學習分類器,表示如下:

它能夠從干凈樣本學習到正確映射的同時,防止后門注入分類器。

2.3 后門移除模塊

結(jié)合樣本區(qū)分模塊,我們設計了一個后門移除模塊backdoor removal (BR) module,這2個模塊共同組成防御方法D-BR,它適用于post-training defense的防御場景,即給定一個毒性數(shù)據(jù)集,我們先使用標準監(jiān)督訓練得到一個準確率高且包含后門的模型,再利用此方法移除模型中的后門,從而得到一個安全的(準確率高且不包含后門)模型。特別地,后門移除模塊本質(zhì)上是一個交替學習算法,包含了2個交替的步驟,分別是遺忘與重新學習。

2.3.1 遺忘

這一步旨在通過遺忘從毒性樣本中學到的知識來移除后門,損失函數(shù)如下:

2.3.3 重新學習

這一步旨在通過從干凈樣本中重新學習知識來維持模型的識別準確率,損失函數(shù)如下:

3 實驗結(jié)果

3.1 D-ST的有效性

我們選取適用于安全訓練防御范式的方法DBD來作為baseline。此外,我們設計2個baseline方法。Baseline1和baseline2分別用CTL和S-CTL來訓練特征提取器,且都用標準交叉熵來訓練分類器。表1表示我們的方法D-ST不僅能夠得到較高的ACC,還能將平均ASR抑制為1.21%(在CIFAR-10數(shù)據(jù)集上,在CIFAR-100上則是0.05%)。

6537f450-745b-11ed-8abf-dac502259ad0.png

3.2 D-BR的有效性

我們選取5個適用于后門移除防御范式的SOTA方法來作為baselines。表2表示我們的方法D-BR不僅能夠維持高ACC,還能將平均ASR由97.29%減小至0.31%(在CIFAR-10數(shù)據(jù)集上,在CIFAR-100上則是由99.77%減小至0.07%)。

65674160-745b-11ed-8abf-dac502259ad0.png

3.3 其它實驗

除了上述的主體實驗以外,我們做了大量的實驗來說明:(1)單個SD模塊的有效性,(2)單個BR模塊的有效性,(3)單個ST模塊的有效性,(4)在不同數(shù)據(jù)變換類型下方法的表現(xiàn),(5)在不同干凈/毒性樣本選擇比例下方法的表現(xiàn),(6)在不同投毒比例下方法的表現(xiàn),(7)在不同模型結(jié)構(gòu)及特征維度下方法的表現(xiàn)。更多的結(jié)果與分析請見原論文。

4 總結(jié)

在本文中,我們揭示了毒性樣本對數(shù)據(jù)變換的敏感性,并提出了一個敏感性度量(FCT)。此外,我們提出了樣本區(qū)分模塊(SD module),安全訓練模塊(ST module)和后門移除模塊(BR module)3個模塊,它們構(gòu)成了2種適用于不同防御范式的后門防御方法(D-ST, D-BR)。大量的實驗分別證明了每個模塊與整體方法的有效性。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模塊
    +關(guān)注

    關(guān)注

    7

    文章

    2837

    瀏覽量

    53304
  • 神經(jīng)網(wǎng)絡

    關(guān)注

    42

    文章

    4838

    瀏覽量

    107851
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1236

    瀏覽量

    26207

原文標題:NeurIPS 2022 | 一種基于毒性樣本敏感性的有效后門防御!

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    經(jīng)顱超聲脈沖刺激(TPS)適合干預哪些適應癥?

    HUIYINGTPS機理、優(yōu)勢、適應癥概述經(jīng)顱脈沖超聲刺激(TranscranialPulseStimulation,TPS)是一種利用超短超聲脈沖(3μs)進行非侵入性腦刺激的創(chuàng)新技術(shù),其作用機制
    的頭像 發(fā)表于 02-28 18:18 ?81次閱讀
    經(jīng)顱超聲脈沖刺激(TPS)適合干預哪些適應癥?

    航空與航天應用中抗輻照MCU的SEE閾值差異及防護策略對比分析

    單粒子效應是制約航空與航天電子系統(tǒng)可靠性的關(guān)鍵因素,不同應用環(huán)境下抗輻照微控制器的單粒子效應敏感性存在顯著差異。
    的頭像 發(fā)表于 02-14 21:11 ?1.4w次閱讀
    航空與航天應用中抗輻照MCU的SEE閾值差異及防護策略對比分析

    紅外感知地球的溫度與能量

    紅外遙感利用近紅外波段監(jiān)測植被、水分和土壤,具有高反射率、敏感性及大氣透過性,廣泛應用于農(nóng)業(yè)和環(huán)境監(jiān)測。
    的頭像 發(fā)表于 01-08 10:20 ?227次閱讀
    紅外感知地球的溫度與能量

    【新品速遞】面向時間敏感網(wǎng)絡的模塊化測試利器——TSN CoreSolution 4.0

    在汽車電子、工業(yè)自動化和航空航天等對時間敏感性要求較高的領(lǐng)域,傳統(tǒng)的網(wǎng)絡測試工具已難以應對挑戰(zhàn),尤其是TSN(時間敏感網(wǎng)絡)技術(shù)的應用,萬兆車載以太網(wǎng)的需求對測試工具提出了更高
    的頭像 發(fā)表于 12-10 10:03 ?628次閱讀
    【新品速遞】面向時間<b class='flag-5'>敏感</b>網(wǎng)絡的模塊化測試利器——TSN CoreSolution 4.0

    如何保障電能質(zhì)量在線監(jiān)測裝置數(shù)據(jù)管理的安全要點的有效性?

    ? 保障電能質(zhì)量在線監(jiān)測裝置數(shù)據(jù)管理安全要點的有效性,需從 “制度落地、技術(shù)強化、人員管控、持續(xù)驗證、應急兜底、動態(tài)優(yōu)化” 六個維度構(gòu)建閉環(huán)體系,結(jié)合電力行業(yè)數(shù)據(jù)特性(如實時性、敏感性、分布式部署
    的頭像 發(fā)表于 09-25 17:50 ?791次閱讀

    傳感器的敏感元件為啥不能維修?

    1.技術(shù)敏感性與易損性精密性高:傳感器(如光學、MEMS、壓力傳感器等)屬于高精度元件,運輸或拆卸過程中容易因震動、靜電、濕度等外界因素導致性能下降或損壞。校準失效:許多傳感器出廠前經(jīng)過專業(yè)校準
    的頭像 發(fā)表于 08-06 12:04 ?830次閱讀
    傳感器的<b class='flag-5'>敏感</b>元件為啥不能維修?

    傳感器的敏感元件為哈不能維修?

    1.技術(shù)敏感性與易損性精密性高:傳感器(如光學、MEMS、壓力傳感器等)屬于高精度元件,運輸或拆卸過程中容易因震動、靜電、濕度等外界因素導致性能下降或損壞。校準失效:許多傳感器出廠前經(jīng)過專業(yè)校準
    的頭像 發(fā)表于 08-04 12:02 ?1229次閱讀
    傳感器的<b class='flag-5'>敏感</b>元件為哈不能維修?

    國安部:境外產(chǎn)芯片或故意留“后門

    影響著國家安全。需要警惕的是,些別有用心的設計或惡意植入的技術(shù)后門,可能成為失泄密的導火索。 看不見的“電子間諜”和“定時炸彈” 技術(shù)后門通常指繞過正常的安全檢查機制,獲取對程序或系統(tǒng)訪問權(quán)的方法。技術(shù)
    的頭像 發(fā)表于 07-21 11:47 ?1w次閱讀

    一種適用于動態(tài)環(huán)境的實時RGB-D SLAM系統(tǒng)

    近期用于視覺SLAM的3D高斯?jié)姙R(3DGS)技術(shù)在跟蹤和高保真建圖方面取得了顯著進展。然而,其順序優(yōu)化框架以及對動態(tài)物體的敏感性限制了其在現(xiàn)實場景中的實時性能和魯棒性。為此,我們提出
    的頭像 發(fā)表于 07-04 15:14 ?1303次閱讀
    <b class='flag-5'>一種</b>適用于動態(tài)環(huán)境的實時RGB-D SLAM系統(tǒng)

    磁敏二極管概述資料

    磁敏二極管是一種依靠半導體材料的磁電效應(像霍爾效應、磁阻效應等)來實現(xiàn)磁電轉(zhuǎn)換的器件,其顯著特點是對磁場具有較高的敏感性,能夠?qū)⒋艌鰪姸鹊淖兓D(zhuǎn)化為電流或電壓的變化。它在磁場檢測、位移測量、電流傳感等眾多領(lǐng)域都有著廣泛的應用。
    發(fā)表于 07-02 16:23 ?0次下載

    感應電機磁鏈觀測器的參數(shù)敏感性研究

    (MRAS)轉(zhuǎn)速估算對參數(shù)的敏感性。 純分享帖,需要者可點擊附件免費獲取完整資料~~~*附件:兩感應電機磁鏈觀測器的參數(shù)敏感性研究.pdf【免責聲明】本文系網(wǎng)絡轉(zhuǎn)載,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問題
    發(fā)表于 06-09 16:16

    VirtualLab Fusion應用:氧化硅膜層的可變角橢圓偏振光譜(VASE)分析

    摘要 可變角度橢圓偏振光譜儀(VASE)是一種常用的技術(shù),由于其對光學參數(shù)的微小變化具有高靈敏度,而被用在許多使用薄膜結(jié)構(gòu)的應用中,如半導體、光學涂層、數(shù)據(jù)存儲、平板制造等。在本用例中,我們演示了
    發(fā)表于 06-05 08:46

    IGBT器件的防靜電注意事項

    IGBT作為功率半導體器件,對靜電極為敏感。我將從其靜電敏感性原理入手,詳細闡述使用過程中防靜電的具體注意事項與防護措施,確保其安全穩(wěn)定運行。
    的頭像 發(fā)表于 05-15 14:55 ?1844次閱讀

    TPS40422 帶 PMBus 的雙輸出或多相同步降壓控制器數(shù)據(jù)手冊

    TPS40422 是一種雙輸出 PMBus 協(xié)議、同步降壓控制器。它也可以配置為單相兩相輸出。 寬輸入范圍支持 5V 和 12V 中間總線。精確的參考電壓滿足了現(xiàn)代 ASIC 對精密電壓的需求,并可能降低輸出電容。電壓模式控制降低了噪聲敏感性,并確保了低占空比轉(zhuǎn)換。
    的頭像 發(fā)表于 03-27 14:00 ?697次閱讀
    TPS40422 帶 PMBus 的雙輸出或多相同步降壓控制器數(shù)據(jù)手冊

    《電子技術(shù)基礎》(模電+數(shù)電)教材配套課件PPT

    ,半導體般呈晶體結(jié)構(gòu)。 二、半導體的特性半導體的導電特性:1.摻雜性:在半導體中摻入微量雜質(zhì),可改變其電阻率和導電類型(可做成各種不同用途的半導體器件,如二極管和三極管等)。 2.溫度敏感性:半導體
    發(fā)表于 03-25 16:21