91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NeurIPS23|視覺 「讀腦術(shù)」:從大腦活動中重建你眼中的世界

智能感知與物聯(lián)網(wǎng)技術(shù)研究所 ? 來源:未知 ? 2023-12-24 21:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在這篇 NeurIPS23 論文中,來自魯汶大學(xué)、新加坡國立大學(xué)和中科院自動化所的研究者提出了一種視覺 「讀腦術(shù)」,能夠從人類的大腦活動中以高分辨率出解析出人眼觀看到的圖像。

人類的感知不僅由客觀刺激塑造,而且深受過往經(jīng)驗的影響,這些共同促成了大腦中的復(fù)雜活動。在認(rèn)知神經(jīng)科學(xué)領(lǐng)域,解碼大腦活動中的視覺信息成為了一項關(guān)鍵任務(wù)。功能性磁共振成像(fMRI)作為一種高效的非侵入性技術(shù),在恢復(fù)和分析視覺信息,如圖像類別方面發(fā)揮著重要作用。

然而,由于 fMRI 信號的噪聲特性和大腦視覺表征的復(fù)雜性,這一任務(wù)面臨著不小的挑戰(zhàn)。針對這一問題,本文提出了一個雙階段 fMRI 表征學(xué)習(xí)框架,旨在識別并去除大腦活動中的噪聲,并專注于解析對視覺重建至關(guān)重要的神經(jīng)激活模式,成功從大腦活動中重建出高分辨率且語義上準(zhǔn)確的圖像。

wKgZomWINLKALJHdAADF5GvzRlU019.png

論文鏈接:https://arxiv.org/abs/2305.17214

項目鏈接:https://github.com/soinx0629/vis_dec_neurips/

論文中提出的方法基于雙重對比學(xué)習(xí)、跨模態(tài)信息交叉及擴散模型,在相關(guān) fMRI 數(shù)據(jù)集上取得了相對于以往最好模型接近 40% 的評測指標(biāo)提升,在生成圖像的質(zhì)量、可讀性及語義相關(guān)性相對于已有方法均有肉眼可感知的提升。該工作有助于理解人腦的視覺感知機制,有益于推動視覺的腦機接口技術(shù)的研究。相關(guān)代碼均已開源。

功能性磁共振成像(fMRI)雖廣泛用于解析神經(jīng)反應(yīng),但從其數(shù)據(jù)中準(zhǔn)確重建視覺圖像仍具挑戰(zhàn),主要因為 fMRI 數(shù)據(jù)包含多種來源的噪聲,這些噪聲可能掩蓋神經(jīng)激活模式,增加解碼難度。此外,視覺刺激引發(fā)的神經(jīng)反應(yīng)過程復(fù)雜多階段,使得 fMRI 信號呈現(xiàn)非線性的復(fù)雜疊加,難以逆轉(zhuǎn)并解碼。

傳統(tǒng)的神經(jīng)解碼方式,例如嶺回歸,盡管被用于將 fMRI 信號與相應(yīng)刺激關(guān)聯(lián),卻常常無法有效捕捉刺激和神經(jīng)反應(yīng)之間的非線性關(guān)系。近期,深度學(xué)習(xí)技術(shù),如生成對抗網(wǎng)絡(luò)(GAN)和潛在擴散模型(LDMs),已被采用以更準(zhǔn)確地建模這種復(fù)雜關(guān)系。然而,將視覺相關(guān)的大腦活動從噪聲中分離出來,并準(zhǔn)確進(jìn)行解碼,依然是該領(lǐng)域的主要挑戰(zhàn)之一。

為了應(yīng)對這些挑戰(zhàn),該工作提出了一個雙階段 fMRI 表征學(xué)習(xí)框架,該方法能夠有效識別并去除大腦活動中的噪聲,并專注于解析對視覺重建至關(guān)重要的神經(jīng)激活模式。該方法在生成高分辨率及語義準(zhǔn)確的圖像方面,其 50 分類的 Top-1 準(zhǔn)確率超過現(xiàn)有最先進(jìn)技術(shù) 39.34%。

方法概述

fMRI 表征學(xué)習(xí) (FRL)

wKgZomWINLKAcFDpAAO2RXreIdY129.png

第一階段:預(yù)訓(xùn)練雙對比掩模自動編碼器 (DC-MAE)

為了在不同人群中區(qū)分共有的大腦活動模式和個體噪聲,本文引入了 DC-MAE 技術(shù),利用未標(biāo)記數(shù)據(jù)對 fMRI 表征進(jìn)行預(yù)訓(xùn)練。DC-MAE 包含一個編碼器wKgZomWINLOACY85AAATCYkGrj4217.jpg和一個解碼器wKgZomWINLOABwpmAAATHGKaoqQ493.jpg,其中wKgZomWINLOACY85AAATCYkGrj4217.jpg以遮蔽的 fMRI 信號為輸入,wKgZomWINLOABwpmAAATHGKaoqQ493.jpg?則被訓(xùn)練以預(yù)測未遮蔽的 fMRI 信號。所謂的 “雙重對比” 是指模型在 fMRI 表征學(xué)習(xí)中優(yōu)化對比損失并參與了兩個不同的對比過程。

在第一階段的對比學(xué)習(xí)中,每個包含 n 個 fMRI 樣本 v 的批次中的樣本wKgZomWINLOAZytRAAAY_FrfB3k709.jpg被隨機遮蔽兩次,生成兩個不同的遮蔽版本wKgZomWINLOAArgcAAAUaigjVac307.jpgwKgZomWINLOAPQaBAAAUPkzrEOE862.jpg,作為對比的正樣本對。隨后,1D 卷積層將這兩個版本轉(zhuǎn)換為嵌入式表示,分別輸入至 fMRI 編碼器wKgZomWINLOACY85AAATCYkGrj4217.jpg。解碼器wKgZomWINLOABwpmAAATHGKaoqQ493.jpg?接收這些編碼的潛在表示,產(chǎn)生預(yù)測值wKgZomWINLOAO6mOAAASQACFk9g996.pngwKgZomWINLOAet-dAAAVNYeXg70733.jpg。通過 InfoNCE 損失函數(shù)計算的第一次對比損失,即交叉對比損失,來優(yōu)化模型:

wKgZomWINLSAIiN7AABBN0m1cj8083.jpg

在第二階段對比學(xué)習(xí)中,每個未遮蔽的原始圖像wKgZomWINLSAHEJRAAAXn-h_7Ng614.jpg及其相應(yīng)的遮蔽圖像wKgZomWINLSAC2WQAAAT5Kwzsi8234.jpg形成一對天然正樣本。這里的wKgZomWINLSAQovGAAAUiK-KtBw912.jpg代表解碼器wKgZomWINLOABwpmAAATHGKaoqQ493.jpg預(yù)測出的圖像。第二次對比損失,也就是自對比損失,根據(jù)以下公式進(jìn)行計算:

wKgZomWINLSAMPzRAABAeYZE5Qc055.jpg

優(yōu)化自對比損失wKgZomWINLSAF2rFAAARX8jVJfI764.png能夠?qū)崿F(xiàn)遮蔽重建。無論是wKgZomWINLSAfymTAAAS0IvT2_Q525.jpg還是wKgZomWINLSAF2rFAAARX8jVJfI764.png,負(fù)樣本wKgZomWINLSAXwLZAAAN_22lvAA884.png都來自同一批次的實例。wKgZomWINLSAfymTAAAS0IvT2_Q525.jpgwKgZomWINLSAF2rFAAARX8jVJfI764.png共同按如下方式優(yōu)化:wKgZomWINLWAD1DbAAAch545_CM537.jpg,其中超參數(shù)wKgZomWINLWAdlluAAASYyUq0R4990.jpgwKgZomWINLWAMR7FAAASq6Kh68E113.jpg于調(diào)節(jié)各損失項的權(quán)重。

  • 第二階段:使用跨模態(tài)指導(dǎo)進(jìn)行調(diào)整

考慮到 fMRI 記錄的信噪比較低且高度卷積的特性,專注于與視覺處理最相關(guān)且對重建最有信息價值的大腦激活模式對 fMRI 特征學(xué)習(xí)器來說至關(guān)重要。

在第一階段預(yù)訓(xùn)練后,fMRI 自編碼器通過圖像輔助進(jìn)行調(diào)整,以實現(xiàn) fMRI 的重建,第二階段同樣遵循此過程。具體而言,從 n 個樣本批次中選擇一個樣本wKgZomWINLWATUnSAAAXnpwIGVw982.jpg及其對應(yīng)的 fMRI 記錄的神經(jīng)反應(yīng)wKgZomWINLWAUdYrAAATFNte410567.jpg。wKgZomWINLWAV1W_AAASi0eS_Co553.jpgwKgZomWINLWAUdYrAAATFNte410567.jpg經(jīng)過分塊和隨機遮蔽處理,分別轉(zhuǎn)變?yōu)?/span>wKgZomWINLWARjeiAAAT3H5zAhk833.jpgwKgZomWINLSAC2WQAAAT5Kwzsi8234.jpg,然后分別輸入到圖像編碼器wKgZomWINLaAVwfBAAAS6nvhto0598.jpg和 fMRI 編碼器wKgZomWINLOACY85AAATCYkGrj4217.jpg中,生成wKgZomWINLaAIzbCAAAcAQiZ6Yc949.jpgwKgZomWINLaAe6vgAAAcmXnXrIY053.jpg為重建 fMRIwKgZomWINLWAUdYrAAATFNte410567.jpg,利用交叉注意力模塊將wKgZomWINLaASTQoAAAUKoGGLKU898.jpgwKgZomWINLaAfeUhAAAT-v86Tio504.jpg進(jìn)行合并:

wKgZomWINLaAajRJAABNntKnTqU552.jpg

W 和 b 分別代表相應(yīng)線性層的權(quán)重和偏置。wKgZomWINLaATBQZAAAVPGeh5Og542.jpg是縮放因子,wKgZomWINLaAeeVsAAATW_AMVgw267.jpg是鍵向量的維度。CA 是交叉注意力(cross-attention)的縮寫。wKgZomWINLeAHF1nAAAfybuIBoI821.jpgwKgZomWINLaAe6vgAAAcmXnXrIY053.jpg后,輸入到 fMRI 解碼器中以重建wKgZomWINLWAUdYrAAATFNte410567.jpg,得到wKgZomWINLeAVvYYAAATnH0DhiA804.jpg

wKgZomWINLeAFXQxAAAxL45-TkQ550.jpg

圖像自編碼器中也進(jìn)行了類似的計算,圖像編碼器wKgZomWINLaAVwfBAAAS6nvhto0598.jpg的輸出wKgZomWINLeAUm6AAAAcAaDek6k559.jpg通過交叉注意力模塊wKgZomWINLeAQpWXAAATeI5Kmq8032.jpgwKgZomWINLOACY85AAATCYkGrj4217.jpg的輸出合并,然后用于解碼圖像wKgZomWINLWAV1W_AAASi0eS_Co553.jpg,得到wKgZomWINLeAKIigAAATwpBzL4M079.jpg

wKgZomWINLiAb5_6AAAxBx5M7Xg526.jpg

通過優(yōu)化以下?lián)p失函數(shù),fMRI 和圖像自編碼器共同進(jìn)行訓(xùn)練:

wKgZomWINLiAZrSMAAArMzBgJiY411.jpg

使用潛在擴散模型 (LDM) 生成圖像

wKgZomWINLiARoeeAAKqfqRTYGQ047.png

在完成 FRL 第一階段和第二階段的訓(xùn)練后,使用 fMRI 特征學(xué)習(xí)器的編碼器wKgZomWINLOACY85AAATCYkGrj4217.jpg來驅(qū)動一個潛在擴散模型(LDM),從大腦活動生成圖像。如圖所示,擴散模型包括一個向前的擴散過程和一個逆向去噪過程。向前過程逐漸將圖像降解為正態(tài)高斯噪聲,通過逐漸引入變方差的高斯噪聲。

該研究通過從預(yù)訓(xùn)練的標(biāo)簽至圖像潛在擴散模型(LDM)中提取視覺知識,并利用 fMRI 數(shù)據(jù)作為條件生成圖像。這里采用交叉注意力機制,將 fMRI 信息融入 LDM,遵循穩(wěn)定擴散研究的建議。為了強化條件信息的作用,這里采用了交叉注意力和時間步條件化的方法。在訓(xùn)練階段,使用 VQGAN 編碼器wKgZomWINLiALLOQAAATKKDDL5A531.jpg和經(jīng) FRL 第一和第二階段訓(xùn)練的 fMRI 編碼器wKgZomWINLOACY85AAATCYkGrj4217.jpg處理圖像 u 和 fMRI v,并在保持 LDM 不變的情況下微調(diào) fMRI 編碼器,損失函數(shù)為:

wKgZomWINLiAURK6AAAxi8Qwnmw428.jpg

其中,wKgZomWINLiAJMGVAAAh0LxI2rw895.jpg是擴散模型的噪聲計劃。在推理階段,過程從時間步長 T 的標(biāo)準(zhǔn)高斯噪聲開始,LDM 依次遵循逆向過程逐步去除隱藏表征的噪聲,條件化在給定的 fMRI 信息上。當(dāng)?shù)竭_(dá)時間步長零時,使用 VQGAN 解碼器wKgZomWINLiAXoQOAAATapgIzh8041.jpg將隱藏表征轉(zhuǎn)換為圖像。

實驗

重建結(jié)果

wKgZomWINLmADsjhAAWOjRY9Q58396.png

通過與 DC-LDM、IC-GAN 和 SS-AE 等先前研究的對比,并在 GOD 和 BOLD5000 數(shù)據(jù)集上的評估中顯示,該研究提出的模型在準(zhǔn)確率上顯著超過這些模型,其中相對于 DC-LDM 和 IC-GAN 分別提高了 39.34% 和 66.7%

wKgZomWINLmAUZrOAAQs152VB3o042.png

在 GOD 數(shù)據(jù)集的其他四名受試者上的評估顯示,即使在允許 DC-LDM 在測試集上進(jìn)行調(diào)整的情況下,該研究提出的模型在 50 種方式的 Top-1 分類準(zhǔn)確率上也顯著優(yōu)于 DC-LDM,證明了提出的模型在不同受試者大腦活動重建方面的可靠性和優(yōu)越性。

實驗結(jié)果表明,利用所提出的 fMRI 表示學(xué)習(xí)框架和預(yù)先訓(xùn)練的 LDM,可以更好的重建大腦的視覺活動,大大優(yōu)于目前的基線。該工作有助于進(jìn)一步挖掘神經(jīng)解碼模型的潛力。


原文標(biāo)題:NeurIPS23|視覺 「讀腦術(shù)」:從大腦活動中重建你眼中的世界

文章出處:【微信公眾號:智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標(biāo)題:NeurIPS23|視覺 「讀腦術(shù)」:從大腦活動中重建你眼中的世界

文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    【匠師共研】系列之一 器件賦能系統(tǒng),打通生物大腦到新型半導(dǎo)體器件應(yīng)用新途

    【引言】生物大腦出發(fā)的一次工程對話 當(dāng)AI算力競賽愈演愈烈,一條源于生物大腦的技術(shù)路徑,正在悄然重塑半導(dǎo)體器件與系統(tǒng)架構(gòu)。近日,泰克專家在展臺與類器件領(lǐng)域資深研究者萬老師展開深度交
    的頭像 發(fā)表于 01-29 11:02 ?352次閱讀
    【匠師共研】系列之一 器件賦能系統(tǒng),打通<b class='flag-5'>從</b>生物<b class='flag-5'>大腦</b>到新型半導(dǎo)體器件應(yīng)用新途

    泰克專家探討類計算背后的器件邏輯與現(xiàn)實挑戰(zhàn)

    當(dāng)AI算力競賽愈演愈烈,一條源于生物大腦的技術(shù)路徑,正在悄然重塑半導(dǎo)體器件與系統(tǒng)架構(gòu)。近日,泰克專家在展臺與類器件領(lǐng)域資深研究者萬老師展開深度交流,圍繞“器件如何賦能系統(tǒng)、打通生物大腦
    的頭像 發(fā)表于 01-20 10:15 ?582次閱讀

    高隱蔽性的柔性耳周電采集系統(tǒng)優(yōu)勢幾何?

    長期使用的局限性。該技術(shù)靈感來源于對“自然認(rèn)知”和“主動感知”研究的需求,即在日常環(huán)境無感、持續(xù)地監(jiān)測大腦活動。cEEGrid由10個Ag/AgCl印刷電極排列成C形
    的頭像 發(fā)表于 12-10 18:03 ?430次閱讀
    高隱蔽性的柔性耳周<b class='flag-5'>腦</b>電采集系統(tǒng)優(yōu)勢幾何?

    地平線五篇論文入選NeurIPS 2025與AAAI 2026

    近日,兩大頂級學(xué)術(shù)會議錄用結(jié)果相繼揭曉,地平線憑借在機器人算法領(lǐng)域的深度鉆研,共有5篇論文全球數(shù)萬份投稿脫穎而出,分別入選NeurIPS 2025與AAAI 2026。
    的頭像 發(fā)表于 11-27 11:39 ?1113次閱讀
    地平線五篇論文入選<b class='flag-5'>NeurIPS</b> 2025與AAAI 2026

    網(wǎng)絡(luò)接口:數(shù)字世界的“門鈴”,了解多少?

    插上網(wǎng)線,連接Wi-Fi,可曾想過數(shù)據(jù)是如何在網(wǎng)絡(luò)世界穿梭的?今天,讓我們一起揭開網(wǎng)絡(luò)接口的神秘面紗! 是否曾好奇,當(dāng)我們插上網(wǎng)線或連接Wi-Fi時,數(shù)據(jù)是如何在網(wǎng)絡(luò)世界穿梭的?這
    發(fā)表于 11-26 18:53

    激光焊接技術(shù)在焊接機接口工藝的應(yīng)用

    激光焊接技術(shù)在機接口制造工藝扮演著關(guān)鍵角色。機接口作為一種連接大腦與外部設(shè)備的先進(jìn)技術(shù),其核心部件通常包括微型電極、傳感器和植入式裝置。這些元件對焊接工藝的要求極高,需要實現(xiàn)精密
    的頭像 發(fā)表于 11-20 16:58 ?688次閱讀
    激光焊接技術(shù)在焊接<b class='flag-5'>腦</b>機接口工藝<b class='flag-5'>中</b>的應(yīng)用

    機接口:運動康復(fù)與神經(jīng)康復(fù)的創(chuàng)新突破

    。 ? 在神經(jīng)康復(fù)與運動康復(fù)領(lǐng)域,機接口技術(shù)通過識別腦電波特征,直接讀取大腦意圖,實現(xiàn)人與機器的高效交互。這一技術(shù)的醫(yī)療價值,首要體現(xiàn)在為運動障礙患者重建生活自理能力上。通過意念控制假肢、輪椅等輔助設(shè)備,患者能夠完
    的頭像 發(fā)表于 11-19 09:12 ?2021次閱讀

    僅使用智能手機在NVIDIA Isaac Sim重建場景

    為機器人仿真構(gòu)建逼真的 3D 環(huán)境可能是一項耗時且勞動密集型的任務(wù)?,F(xiàn)在,借助 NVIDIA Omniverse NuRec,您只需使用智能手機即可完成整個流程。本文將逐步介紹操作方法:
    的頭像 發(fā)表于 11-10 14:03 ?872次閱讀

    時域干涉電刺激tTIS可持續(xù)增強運動皮層活動

    resting-statefMRI的低頻波動(如fALFF)和區(qū)域一致性(ReHo)等指標(biāo)來量化。這些活動反映了大腦的基礎(chǔ)功能狀態(tài)和神經(jīng)網(wǎng)絡(luò)的自我組織能力。圖1大腦皮層的功能組織刺激
    的頭像 發(fā)表于 09-22 18:04 ?1005次閱讀
    時域干涉電刺激tTIS可持續(xù)增強運動皮層<b class='flag-5'>活動</b>?

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+神經(jīng)形態(tài)計算、類芯片

    。是實現(xiàn)類芯片的基本模型。SNN的神經(jīng)元通過短的電脈沖相互溝通,脈沖之間的時間間隔起著重要作用。 最有利于硬件實現(xiàn)的脈沖神經(jīng)元模型是“漏電整合-激發(fā)”模型: 與DNN相比,SNN的優(yōu)勢與區(qū)別
    發(fā)表于 09-17 16:43

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+可期之變:AI硬件到AI濕件

    通常情況下,半導(dǎo)體芯片的制造過程是經(jīng)過光刻、蒸發(fā)、擴散、離子注入等物理方法來實現(xiàn)晶體管等元器件的生成和互連。芯片是被封裝在一個帶有大量引腳、不斷耗電和發(fā)熱的方形硬殼,這與大腦的結(jié)構(gòu)沿著完全
    發(fā)表于 09-06 19:12

    中國植入式機接口取得新突破

    首次機接口應(yīng)用于深部腫瘤術(shù)邊界精準(zhǔn)定位的臨床試驗,此次試驗成功標(biāo)志著我國自主研發(fā)的植入式臨床機接口技術(shù)實現(xiàn)重要突破。 據(jù)悉此次的臨床
    的頭像 發(fā)表于 08-29 15:26 ?667次閱讀

    【書籍評測活動NO.64】AI芯片,過去走向未來:《AI芯片:科技探索與AGI愿景》

    基礎(chǔ)。 ▲基于磁子 / 自旋波的類芯片示意 具身智能芯片填補了AI與物理世界的感知鴻溝,書中提出,真正的智能需具備對物理環(huán)境的感知與執(zhí)行能力,這類芯片集成視覺、觸覺、聽覺等多模態(tài)傳感器,通過 “感存算一體化
    發(fā)表于 07-28 13:54

    具身智能×邊緣計算:AI的“大腦”和“身體”如何聯(lián)手闖蕩世界

    兩個關(guān)鍵詞——具身智能和邊緣計算。它們就像是智能世界的“大腦”和“身體”,通過協(xié)同合作,讓機器“能聽話”進(jìn)化到“懂世界”。那么,這兩者是如何互相成就的呢?今天我
    的頭像 發(fā)表于 04-30 18:34 ?836次閱讀
    具身智能×邊緣計算:AI的“<b class='flag-5'>大腦</b>”和“身體”如何聯(lián)手闖蕩<b class='flag-5'>世界</b>?

    電基礎(chǔ)系列之電電極的分類與技術(shù)對比

    電電極的概述腦電圖(Electroencephalogram,EEG)是通過記錄大腦皮層神經(jīng)元電活動來反映功能狀態(tài)的重要技術(shù)手段,廣泛應(yīng)用于臨床診斷、神經(jīng)科學(xué)研究及
    的頭像 發(fā)表于 03-13 10:27 ?4383次閱讀
    <b class='flag-5'>腦</b>電基礎(chǔ)系列之<b class='flag-5'>腦</b>電電極的分類與技術(shù)對比