91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

4種神經(jīng)網(wǎng)絡(luò)不確定性估計方法對比與代碼實現(xiàn)

穎脈Imgtec ? 2025-11-10 10:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文轉(zhuǎn)自:DeepHub IMBA


回歸任務(wù)在實際應(yīng)用中隨處可見——天氣預報、自動駕駛、醫(yī)療診斷、經(jīng)濟預測、能耗分析,但大部分回歸模型只給出一個預測值,對這個值到底有多靠譜卻只字不提。這在某些應(yīng)用場景下會造成很多問題,比如用模型預測患者血壓,假設(shè)輸出是120/80這樣的正常值,表面看沒問題。但如果模型其實對這個預測很不確定呢?這時候光看數(shù)值就不夠了。

神經(jīng)網(wǎng)絡(luò)有幾種方法可以在給出預測的同時估計不確定性。


回歸中的不確定性問題

分類任務(wù)里,每個類別都有對應(yīng)的預測分數(shù),經(jīng)過softmax之后就是概率值,可以直接當作置信度來看——概率高說明模型比較有把握。

回歸就沒這么簡單了。用MSE(均方誤差)訓練回歸模型時,模型對那些難擬合的樣本會傾向于預測平均值。比如說訓練集里有幾個輸入特征幾乎一樣、但目標值差異很大的樣本,模型為了降低MSE,會把預測往它們的均值靠攏。

這就帶來一個問題:當預測值接近訓練集的整體均值時,很難判斷模型是真的有把握,還是純粹為了優(yōu)化損失函數(shù)在"混日子"。而如果預測值偏離均值較遠,可能說明模型比較確信——因為預測錯了的話MSE懲罰會更重。

假設(shè)目標值在-1到1之間,訓練集均值接近0。模型預測0.1時,不好說它是有信心還是在敷衍;但預測0.8時,大部分情況說明它確實掌握了某些模式,當然這個現(xiàn)象也不是在所有情況下都成立。

這里涉及兩類不確定性的概念:

任意不確定性(Aleatoric uncertainty)來自數(shù)據(jù)本身的隨機性和噪聲,比如測量誤差、自然界的隨機過程。這種不確定性沒法通過增加數(shù)據(jù)來消除,它就是客觀存在的。

認知不確定性(Epistemic uncertainty)源于知識或數(shù)據(jù)的缺乏。弄日三級片訓練數(shù)據(jù)太少或者測試樣本落在從沒見過的區(qū)域,模型就會產(chǎn)生這類不確定性。但是這種不確定性是可以通過改進模型結(jié)構(gòu)、收集更多樣化的數(shù)據(jù)來降低的。

前面提到的那個例子主要說的就是任意不確定性。但即便預測0.8,如果是在數(shù)據(jù)稀疏的區(qū)域,模型也可能因為認知不確定性而不靠譜。


四種不確定性估計方法

這里對比了四種在神經(jīng)網(wǎng)絡(luò)回歸中估計不確定性的方法。

1、均值 + 對數(shù)標準差(Mean + LogStd)

模型輸出兩個值:均值作為預測值,對數(shù)標準差表示不確定性——值越大說明越不確定。損失函數(shù)用的是負對數(shù)似然,假設(shè)目標值服從正態(tài)分布,參數(shù)就是預測的均值和標準差。

x='input features'
y='targets'
mu,log_std=mean_logstd_model(x)
dist_obj=torch.distributions.Normal(loc=mu,scale=log_std.exp())
loss=-dist_obj.log_prob(y).mean()

2、均值 + 對數(shù)方差(Mean + LogVariance)

跟上一個類似,只是把標準差換成了方差。對數(shù)方差越大不確定性越高。損失計算方式如下:

bf889b4c-bdde-11f0-8ce9-92fbcf53809c.jpg

x='input features'
y='targets'
mu,log_variance=mean_logvariance_model(x)
loss=(0.5*log_variance)+(((y-mu)**2)/(2*torch.exp(log_variance)))
loss=loss.mean()

3、蒙特卡洛Dropout(MC Dropout)

訓練時用dropout,但預測階段的時候不關(guān)閉它。對同一個樣本預測多次,由于dropout的隨機性,每次結(jié)果會略有差異。把這些預測值的均值當作最終預測,標準差就是不確定性的度量。

4、簡化版PPO方法

PPO本來是強化學習里的算法,這里做了簡化改造用到監(jiān)督學習上。Actor網(wǎng)絡(luò)預測均值和標準差,獎勵定義為采樣預測的負MSE。跟標準PPO的主要區(qū)別在于優(yōu)勢(advantage)的計算——監(jiān)督回歸可以看作單步環(huán)境不需要GAE,優(yōu)勢就是reward減去value。

bf9ca614-bdde-11f0-8ce9-92fbcf53809c.jpg


實驗設(shè)置

數(shù)據(jù)集

混凝土抗壓強度數(shù)據(jù)集包含1030個樣本,8個特征,1個目標值。按7:3隨機劃分訓練集和測試集。輸入特征標準化到均值0、標準差1,目標值除以100歸一化到(0,1)區(qū)間。

模型結(jié)構(gòu)

基礎(chǔ)架構(gòu)都是全連接網(wǎng)絡(luò),4個隱藏層,每層64個神經(jīng)元。輸出層根據(jù)不同方法有各自的設(shè)計。

訓練參數(shù)

統(tǒng)一訓練2000個epoch,batch size 256,學習率0.0001。


實驗結(jié)果分析

bfac3750-bdde-11f0-8ce9-92fbcf53809c.jpg

圖1展示了各方法在訓練集和測試集上的MSE?;€方法(不估計不確定性的普通回歸)測試集MSE最低,均值對數(shù)方差最高。均值對數(shù)標準差和MC Dropout在測試集上表現(xiàn)相當,排第二,PPO排第三。

bfbb3cfa-bdde-11f0-8ce9-92fbcf53809c.jpg

圖2畫出了真實值和預測值的散點圖,x軸是真值,y軸是預測。點越靠近對角線,預測越準。

bfd1952c-bdde-11f0-8ce9-92fbcf53809c.jpg

圖3展示了不確定性估計的實際效果。x軸是確定性閾值,比如0.3表示過濾掉30%最不確定的預測,只保留70%最有把握的,y軸是這些篩選后樣本的MSE。

基線方法沒有不確定性估計,所以MSE是條平線。PPO的表現(xiàn)比較奇怪——按理說高標準差應(yīng)該對應(yīng)高不確定性,但這里似乎反過來了,篩掉低標準差的預測后MSE反而上升。這可能跟PPO用標準差控制探索有關(guān),那些被分配低標準差的樣本探索不夠充分反而預測不準。

均值對數(shù)標準差、均值方差和MC Dropout三者表現(xiàn)接近。均值對數(shù)標準差稍微好一點,在0.55閾值之后還能繼續(xù)降低MSE,而均值方差已經(jīng)平了。

bfdeef4c-bdde-11f0-8ce9-92fbcf53809c.jpg

圖4把PPO的不確定性順序反過來試了試——最確定的當最不確定,最不確定的當最確定。雖然在0到0.2的區(qū)間MSE有所下降,但0.2之后又回升了。說明即便反著用,PPO的不確定性估計也不太對。


總結(jié)

在混凝土強度這個數(shù)據(jù)集上,均值對數(shù)標準差和均值對數(shù)方差兩種方法在估計預測不確定性方面效果最好。MC Dropout也不錯,但PPO的簡化版本表現(xiàn)不佳,即使反轉(zhuǎn)其不確定性指標也無法獲得可靠的估計。

代碼倉庫:https://github.com/navid-bamdad-roshan/regression-with-uncertainty-methods-comparison

作者:Navid Bamdad Roshan


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4838

    瀏覽量

    107767
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3752

    瀏覽量

    52109
  • MSE
    MSE
    +關(guān)注

    關(guān)注

    0

    文章

    7

    瀏覽量

    6699
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    去嵌入和不確定性是否使用了正確的設(shè)置

    大家好,所以我遇到的問題是確定用于測試夾具糾錯過程的適配器特征的不確定性。我們將使用適配器及其s2p文件對測試夾具中的所有信號路徑進行路徑表征,然后移除以進行性能測試。這個過程在不確定性計算器中被
    發(fā)表于 09-27 15:47

    E8364C PNA的不確定性和跟蹤是什么?

    在中斷后,我回到網(wǎng)絡(luò)分析儀,并提出一個簡單的問題。我正在閱讀E8364C PNA的數(shù)據(jù)表,并遇到了E8364C PNA,不確定性和跟蹤,但沒有解釋這些術(shù)語。我的猜測是,不確定性是與公認標準相比的誤差
    發(fā)表于 10-18 17:03

    是否可以使用全雙端口校準中的S11不確定性來覆蓋單端口校準的不確定性?

    我們一直在使用Agilent VNA不確定度計算器電子表格,讓我們了解我們測量的設(shè)備的不確定性。有關(guān)單端口校準的問題:目前您必須從電子表格中選擇您的VNA(帶寬和平均值),然后選擇校準類型(全雙端口
    發(fā)表于 12-29 16:32

    N5531S TRFL不確定性

    我正在嘗試使用N5531S(選擇550傳感器)測量接收器系統(tǒng)測量0到-130dBm的絕對功率水平,然后計算它的不確定性。安捷倫的應(yīng)用筆記已經(jīng)提到,不確定度可以使用公式+/-計算(功率計范圍2-4
    發(fā)表于 02-19 15:40

    容差模擬電路軟故障診斷的小波與量子神經(jīng)網(wǎng)絡(luò)方法設(shè)計

    能力是無法解決的。而量子神經(jīng)網(wǎng)絡(luò)被認為是一具有固有模糊性的網(wǎng)絡(luò),它的隱層單元采用多量子能級變換函數(shù),每個多能級變換函數(shù)是一系列具有量子間隔偏移的S型函數(shù)之和,能將決策的不確定性數(shù)據(jù)合
    發(fā)表于 07-05 08:06

    測試系統(tǒng)不確定性分析

    測試系統(tǒng)不確定性分析
    發(fā)表于 09-18 09:19

    5G網(wǎng)絡(luò)架構(gòu)的不確定性及其對承載網(wǎng)的影響

    運營商若想在5G網(wǎng)絡(luò)部署領(lǐng)先世界,必須考慮上述不確定性的風險因素,建議適度把握5G部署節(jié)奏,降低上述風險的負面影響?! ?b class='flag-5'>4 結(jié)束語  本文通過對LTE和5G網(wǎng)絡(luò)架構(gòu)的
    發(fā)表于 12-03 16:03

    傅里葉變換與不確定性看了就知道

    傅里葉變換與不確定性
    發(fā)表于 12-30 06:41

    求解動態(tài)及不確定性優(yōu)化問題的新方法

    求解動態(tài)及不確定性優(yōu)化問題的新方法_劉曉
    發(fā)表于 01-07 18:56 ?0次下載

    LUCT工具主要特性及不確定性時鐘樹設(shè)計方法和算法的介紹

    時鐘樹設(shè)計及其設(shè)計方式是引起系統(tǒng)芯片性能差異的主要原因。 低不確定性時鐘樹[LUCT]設(shè)計及算法與在系統(tǒng)芯片上實現(xiàn)的第一層時鐘樹的物理定義有關(guān),能夠讓設(shè)計人員克服傳統(tǒng)設(shè)計方法的所有低效率問題。 從
    發(fā)表于 11-29 10:58 ?6次下載
    LUCT工具主要特性及<b class='flag-5'>不確定性</b>時鐘樹設(shè)計<b class='flag-5'>方法</b>和算法的介紹

    如何用不確定性解決模型問題

    再比如,你想搭建一個模型,要在一系列動物圖片中預測哪種動物會吃掉你。假設(shè)你在訓練時給模型提供的都是獅子和長頸鹿的照片,現(xiàn)在模型看到了一張僵尸照片。由于之前它沒有見過僵尸,所以這里的不確定性就非常高。如果在訓練時能提供足夠的僵尸照片,那么模型的不確定性會隨之減少。
    的頭像 發(fā)表于 09-07 09:45 ?5944次閱讀

    針對自閉癥輔助的不確定性聯(lián)合組稀疏建模方法

    自閉癥是一神經(jīng)發(fā)育障礙類疾病,其診斷過程存在著很大的不確定性。目前已有的面向自閉癥診斷的建模方法沒有針對診斷過程的不確定性進行有效硏究。為
    發(fā)表于 04-07 11:23 ?2次下載
    針對自閉癥輔助的<b class='flag-5'>不確定性</b>聯(lián)合組稀疏建模<b class='flag-5'>方法</b>

    深部目標姿態(tài)估計不確定性量化研究

      FastUQ 是一新的用于深部目標姿態(tài)估計的快速不確定性量化方法,具有高效、即插即用的特點,支持一類通用的姿態(tài)估計任務(wù)。這項研究在自主
    的頭像 發(fā)表于 04-26 16:18 ?1748次閱讀

    不確定性感知和姿態(tài)回歸結(jié)合用于自動駕駛車輛定位

    提出了一聯(lián)合訓練姿態(tài)估計不確定性方法,其具有可靠的不確定性估計和改進的訓練穩(wěn)
    的頭像 發(fā)表于 01-30 11:30 ?2133次閱讀

    科技云報到:數(shù)字化轉(zhuǎn)型,從不確定性確定性的關(guān)鍵路徑

    科技云報到:數(shù)字化轉(zhuǎn)型,從不確定性確定性的關(guān)鍵路徑
    的頭像 發(fā)表于 11-16 16:52 ?1200次閱讀
    科技云報到:數(shù)字化轉(zhuǎn)型,從<b class='flag-5'>不確定性</b>到<b class='flag-5'>確定性</b>的關(guān)鍵路徑