基于視覺(jué)的多模態(tài)觸覺(jué)感知系統(tǒng)

近日，華南師范大學(xué)的李昕明團(tuán)隊(duì)研究了一種基于視覺(jué)的多模態(tài)觸覺(jué)感知系統(tǒng)。傳統(tǒng)的多模態(tài)/多任務(wù)觸覺(jué)感知系統(tǒng)通過(guò)集成多種傳感單元來(lái)達(dá)到多模態(tài)觸覺(jué)信息的解耦，但其往往導(dǎo)致系統(tǒng)結(jié)構(gòu)的復(fù)雜性，以及需要應(yīng)對(duì)來(lái)自不同刺激間的干擾。相對(duì)地，基于視覺(jué)的觸覺(jué)傳感器能夠利用各種光學(xué)設(shè)計(jì)來(lái)感知多種觸覺(jué)信息，但隨著所需接觸信息維度的增加，這就需要為不同的接觸刺激采用特定的光學(xué)設(shè)計(jì)和信息解耦策略。

針對(duì)上述挑戰(zhàn)，李昕明團(tuán)隊(duì)提出了基于視覺(jué)的觸覺(jué)傳感系統(tǒng)，將觸覺(jué)信息轉(zhuǎn)換為視覺(jué)信號(hào)，并進(jìn)一步設(shè)計(jì)了一個(gè)能夠解耦多種接觸信息的深度神經(jīng)網(wǎng)絡(luò)模型。得益于視觸覺(jué)圖像的高密度特征，這種方法避免了為各種觸覺(jué)模態(tài)定制解耦設(shè)計(jì)的需求，從而實(shí)現(xiàn)了更為高效的多模態(tài)觸覺(jué)信息的提取。

在系統(tǒng)的驗(yàn)證中，該技術(shù)實(shí)現(xiàn)了與人類(lèi)觸覺(jué)類(lèi)似的微米級(jí)空間分辨率。引入神經(jīng)網(wǎng)絡(luò)后，模擬抓取實(shí)驗(yàn)顯示系統(tǒng)在力學(xué)識(shí)別上的平均絕對(duì)誤差為0.2N，而在姿態(tài)角度識(shí)別上的誤差為0.41°。此外，在物體定位和分類(lèi)上也表現(xiàn)出了優(yōu)異的性能。該系統(tǒng)有潛力在生物醫(yī)學(xué)和機(jī)器人技術(shù)等多模態(tài)觸覺(jué)感測(cè)任務(wù)中得到廣泛應(yīng)用。

編輯：黃飛

閱讀全文

傳感器(788347) 傳感器(788347)
機(jī)器人(220831) 機(jī)器人(220831)
感知系統(tǒng)(16404) 感知系統(tǒng)(16404)
深度學(xué)習(xí)(124080) 深度學(xué)習(xí)(124080)
觸覺(jué)傳感器(10334) 觸覺(jué)傳感器(10334)

評(píng)論

商湯科技饒學(xué)貴：AI多模態(tài)城市機(jī)器視覺(jué)，助力新型智慧城市建設(shè)

商湯科技公安行業(yè)產(chǎn)品總經(jīng)理饒學(xué)貴表示，目前城市建設(shè)中所涉及的視頻大數(shù)據(jù)處理和分析仍需借助大量人力完成，執(zhí)行效率較為低下，而商湯科技的目標(biāo)是構(gòu)建從感知、預(yù)警、分析到?jīng)Q策的自動(dòng)化高效智能視覺(jué)系統(tǒng)。這套多

2018-11-19 18:55:44

6780

如何通過(guò)立體視覺(jué)構(gòu)建小巧輕便的深度感知系統(tǒng)

有多種 3D 傳感器方案來(lái)實(shí)現(xiàn)深度感知系統(tǒng)，包括立體視覺(jué)相機(jī)、激光雷達(dá)和TOF(飛行時(shí)間)相機(jī)。每個(gè)選擇都有其優(yōu)缺點(diǎn)，其中，嵌入式深度感知立體系統(tǒng)成本低，堅(jiān)固耐用，適合戶外使用，并且能夠提供高分辨率的彩色點(diǎn)云。

2022-08-23 16:45:15

1871

基于多模態(tài)語(yǔ)義SLAM框架

本文提出了一個(gè)魯棒且快速的多模態(tài)語(yǔ)義 SLAM 框架，旨在解決復(fù)雜和動(dòng)態(tài)環(huán)境中的 SLAM 問(wèn)題。具體來(lái)說(shuō)，將僅幾何聚類(lèi)和視覺(jué)語(yǔ)義信息相結(jié)合，以減少由于小尺度對(duì)象、遮擋和運(yùn)動(dòng)模糊導(dǎo)致的分割誤差的影響。

2022-08-31 09:39:14

2569

愛(ài)芯通元NPU適配Qwen2.5-VL-3B視覺(jué)多模態(tài)大模型

熟悉愛(ài)芯通元NPU的網(wǎng)友很清楚，從去年開(kāi)始我們?cè)诙藗?cè)多模態(tài)大模型適配上一直處于主動(dòng)緊跟的節(jié)奏。先后適配了國(guó)內(nèi)最早開(kāi)源的多模態(tài)大模MiniCPM V 2.0，上海人工智能實(shí)驗(yàn)室的書(shū)生多模態(tài)大模型

2025-04-21 10:56:46

2690

炬芯科技 2019 多模態(tài)交互技術(shù)開(kāi)發(fā)者大會(huì)：AI多模態(tài)交互如何助力教育

賦能、語(yǔ)音賦能到視覺(jué)算法賦能、IP加速等多角度，共同探討多模態(tài)交互在教育上的落地情況。多模態(tài)交互技術(shù)賦能新智能硬件喜馬拉雅今年的用戶突破6億，擁有7000萬(wàn)以上的主播，其中100萬(wàn)以上是認(rèn)證主播，在整個(gè)音頻行業(yè)的覆蓋率73%，每個(gè)用戶平均每天的播放時(shí)長(zhǎng)超過(guò)

2019-12-24 11:46:43

14450

語(yǔ)音識(shí)別技術(shù)最新進(jìn)展：視聽(tīng)融合的多模態(tài)交互成為主要演進(jìn)方向

多種模態(tài)（聲學(xué)、語(yǔ)言模型、視覺(jué)特征等）進(jìn)行聯(lián)合建模，基于深度學(xué)習(xí)的多模態(tài)語(yǔ)音識(shí)別取得了新進(jìn)展。 ? 多模態(tài)交互的原理及優(yōu)勢(shì) ? 多模態(tài)交互技術(shù)融合了多種輸入方式，包括語(yǔ)音、手勢(shì)、觸摸和眼動(dòng)等，使用戶可以根據(jù)自己的喜好和習(xí)慣

2023-12-28 09:06:45

6608

人形機(jī)器人感知系統(tǒng)的特點(diǎn)：多模態(tài)感知、高精度、實(shí)時(shí)性

優(yōu)必選、小米科技、宇樹(shù)科技等。 ? 人形機(jī)器人感知系統(tǒng)包括哪些傳感器和算法 ? 人形機(jī)器人感知系統(tǒng)包括各種傳感器，如視覺(jué)傳感器：通過(guò)模擬人類(lèi)雙眼視覺(jué)系統(tǒng)的觀測(cè)原理，利用雙目相機(jī)、深度相機(jī)、激光雷達(dá)等獲取周?chē)h(huán)境的

2024-07-30 01:05:00

6815

多模態(tài)感知+豆包大模型！家居端側(cè)智能升級(jí)

電子發(fā)燒友網(wǎng)報(bào)道（文/李彎彎）日前，在火山引擎2025春季FORCE原動(dòng)力大會(huì)上，星宸科技股份有限公司董事副總經(jīng)理陳立敬談到，在人工智能技術(shù)飛速發(fā)展的時(shí)代，多模態(tài)感知與大模型的融合成為推動(dòng)各行業(yè)變革

2025-06-21 00:06:00

6832

人工觸覺(jué)的現(xiàn)在與未來(lái)

提供期望的觸覺(jué)體驗(yàn)。假性觸覺(jué)錯(cuò)覺(jué) 尋求使用觸覺(jué)錯(cuò)覺(jué)和視覺(jué)系統(tǒng)的總體優(yōu)勢(shì)來(lái)創(chuàng)建帶有被動(dòng)道具和視覺(jué)反饋的觸覺(jué)反饋。這種假觸覺(jué)反饋可以用來(lái)表示對(duì)摩擦力、剛度、尺寸和重量的感知。研究人員還尋求將視覺(jué)觸覺(jué)幻象

2018-12-17 15:03:35

人類(lèi)視覺(jué)感知方式對(duì)VR的挑戰(zhàn)

美國(guó)VR開(kāi)發(fā)商O(píng)culus VR首席科學(xué)家邁克爾·阿布拉西（Michael Abrash）近日撰文，闡述了人類(lèi)視覺(jué)感知給虛擬現(xiàn)實(shí)（VR）發(fā)展帶來(lái)的重大影響。作為人類(lèi)，我們看到的影像其實(shí)都是視覺(jué)騙局

2019-07-29 07:35:52

從安防到元宇宙：RK3588如何重塑視覺(jué)感知邊界？

示例：多模態(tài)AI融合：支持TensorFlow、PyTorch等主流框架模型部署，可應(yīng)用于智能零售中的行為識(shí)別系統(tǒng)，通過(guò)攝像頭+紅外傳感器數(shù)據(jù)融合，精準(zhǔn)分析顧客停留熱點(diǎn)。七屏異顯與8K編解碼：在數(shù)

2025-04-07 16:11:04

傳感器應(yīng)用在觸覺(jué)前沿圖像系統(tǒng)設(shè)計(jì)

尖端前沿區(qū)域叫做“被動(dòng)觸覺(jué)”一般的觸覺(jué)界面都是主動(dòng)感知,意思是系統(tǒng)使用電機(jī)和風(fēng)力等動(dòng)力設(shè)備增加用戶感知到的系統(tǒng)作用力。主動(dòng)觸覺(jué)系統(tǒng)的風(fēng)險(xiǎn)在于,動(dòng)力設(shè)備可能會(huì)增加過(guò)多的作用力,而傷害到用戶。被動(dòng)觸覺(jué)

2018-11-01 15:10:54

未來(lái)已來(lái)，多傳感器融合感知是自動(dòng)駕駛破局的關(guān)鍵

駕駛的關(guān)鍵的是具備人類(lèi)的感知能力，多傳感器融合感知正是自動(dòng)駕駛破局的關(guān)鍵。昱感微的雷視一體多傳感器融合方案就好像一雙比人眼更敏銳的眼睛，可以為自動(dòng)駕駛系統(tǒng)提供更豐富更精準(zhǔn)的視覺(jué)語(yǔ)言——目標(biāo)與環(huán)境的多

2024-04-11 10:26:51

米爾RK3576部署端側(cè)多模態(tài)多輪對(duì)話,6TOPS算力驅(qū)動(dòng)30億參數(shù)LLM

細(xì)化需求，系統(tǒng)需實(shí)時(shí)調(diào)整響應(yīng)策略 1.2 多輪對(duì)話系統(tǒng)鳥(niǎo)瞰：三顆“核心”協(xié)同驅(qū)動(dòng)RK3576 多模態(tài)交互對(duì)話方案基于 RKLLM 的核心運(yùn)作，依賴于圖像視覺(jué)編碼器、大語(yǔ)言模型與對(duì)話管家這三大模塊的協(xié)同

2025-09-05 17:25:10

計(jì)算機(jī)視覺(jué)論文速覽

AI視野·今日CS.CV 計(jì)算機(jī)視覺(jué)論文速覽transformer、新模型、視覺(jué)語(yǔ)言模型、多模態(tài)、clip、視角合成

2021-08-31 08:46:46

基于振動(dòng)觸覺(jué)的便攜式環(huán)境信息感知器

本項(xiàng)目利用雙目攝像頭、加速度傳感器，陀螺儀和振動(dòng)致動(dòng)器構(gòu)建了一個(gè)基于振動(dòng)觸覺(jué)的便攜式環(huán)境信息感知系統(tǒng)。該系統(tǒng)由攝像頭圖像獲取模塊、運(yùn)動(dòng)檢測(cè)模塊、中央處理模塊以及振

2011-12-02 14:31:17

基于感知的多代理的120急救系統(tǒng)

多代理系統(tǒng)以一種分布式的計(jì)算模式有助于信息協(xié)作分析和決策，而代理的智能感知能力讓系統(tǒng)可以根據(jù)周?chē)h(huán)境而動(dòng)態(tài)調(diào)整行為。本文基于多代理技術(shù)，介紹了一個(gè)普適計(jì)算環(huán)境下的

2012-08-20 11:58:28

lABCIWQmultyWindows多模態(tài)窗口2010

lABCIWQmultyWindows多模態(tài)窗口2010。

2016-05-17 17:47:59

體驗(yàn)MiniCPM-V 2.6 多模態(tài)能力

多模態(tài)組網(wǎng)

jf_23871869發(fā)布于 2025-01-20 13:40:48

傳感器的五種感覺(jué)第二部分：觸覺(jué)與視覺(jué)

在這一系列的最后一篇文章更新“五感傳感器”在2011區(qū)發(fā)表的文章（聲音、視覺(jué)、味覺(jué)、嗅覺(jué)、觸覺(jué)），我們將看看在觸覺(jué)和視覺(jué)的研究進(jìn)展。

2017-05-27 08:46:30

自適應(yīng)并行結(jié)構(gòu)的多模態(tài)生物特征識(shí)別

自適應(yīng)并行結(jié)構(gòu)的多模態(tài)生物特征識(shí)別

2017-10-16 11:06:04

多文化場(chǎng)景下的多模態(tài)情感識(shí)別

自動(dòng)情感識(shí)別是一個(gè)非常具有挑戰(zhàn)性的課題，并且有著廣泛的應(yīng)用價(jià)值．本文探討了在多文化場(chǎng)景下的多模態(tài)情感識(shí)別問(wèn)題．我們從語(yǔ)音聲學(xué)和面部表情等模態(tài)分別提取了不同的情感特征。包括傳統(tǒng)的手工定制特征和基于深度

2017-12-18 14:47:31

多模態(tài)生物特征識(shí)別系統(tǒng)框架

針對(duì)多模態(tài)生物特征識(shí)別系統(tǒng)并行融合模式中使用方便性和使用效率方面的問(wèn)題，在現(xiàn)有序列化多模態(tài)生物特征識(shí)別系統(tǒng)的基礎(chǔ)上，提出了一種結(jié)合并行融合和序列化融合的多生物特征識(shí)別系統(tǒng)框架?？蚣苤惺紫炔捎貌綉B(tài)

2018-01-02 18:47:31

觸覺(jué)感知和發(fā)展的模型

由于觸覺(jué)是一種主動(dòng)的感覺(jué)，即感覺(jué)器官在感覺(jué)過(guò)程中被移動(dòng)，所以這些模型經(jīng)常描述優(yōu)化感知結(jié)果的運(yùn)動(dòng)策略。

2018-05-03 16:18:55

5915

以智能音箱為主的智能硬件持續(xù)增長(zhǎng) 交互模式也從單模態(tài)向多模態(tài)轉(zhuǎn)變

近年來(lái)，以智能音箱為代表的智能硬件市場(chǎng)持續(xù)增長(zhǎng)，交互模式從單模態(tài)向多模態(tài)轉(zhuǎn)變的趨勢(shì)也日益顯著。帶屏幕的智能硬件能夠更好滿足聽(tīng)覺(jué)和視覺(jué)的交互，也是人工智能和硬件廠商發(fā)力的方向。

2018-12-14 13:49:41

1075

利用時(shí)空證據(jù)和獨(dú)立視覺(jué)通道改善車(chē)輛環(huán)境感知的多傳感器融合

對(duì)于智能車(chē)輛來(lái)說(shuō)，多傳感器融合對(duì)于高精度和魯棒性的感知交通環(huán)境至關(guān)重要。在這篇論文中，我們提出了兩種有效的方法，即時(shí)空證據(jù)生成和獨(dú)立視覺(jué)通道，以改善多傳感器跟蹤水平對(duì)車(chē)輛環(huán)境感知的影響。時(shí)空證據(jù)包括即時(shí)證據(jù)、跟蹤證據(jù)和跟蹤匹配證據(jù)，以改進(jìn)存在融合。

2019-01-05 09:35:57

4585

關(guān)于多模態(tài)機(jī)器學(xué)習(xí)綜述論文

因此，當(dāng)研究問(wèn)題或數(shù)據(jù)集包括多個(gè)這樣的模態(tài)時(shí)，其特征在于多模態(tài)。本文主要關(guān)注但不僅僅關(guān)注三種形式：自然語(yǔ)言既可以是書(shū)面的，也可以是口頭的; 視覺(jué)信號(hào)，通常用圖像或視頻表示; 和聲音信號(hào)，編碼聲音和口頭信息，如韻律和聲音表達(dá)。

2019-01-21 13:38:24

9419

人工智能實(shí)現(xiàn)觸覺(jué)和視覺(jué)的信息交互

觸覺(jué)使我們可以感受世界，而視覺(jué)幫助我們了解其全貌。

2019-07-19 11:53:31

5370

研究人員展示了一種事件驅(qū)動(dòng)的視覺(jué)觸覺(jué)感知系統(tǒng)

國(guó)大研究人員今天在本周舉行的虛擬機(jī)器人科學(xué)與系統(tǒng)會(huì)議上介紹了他們的研究結(jié)果。預(yù)期將觸覺(jué)感測(cè)（抓地力）與視覺(jué)（位置）結(jié)合起來(lái)，可以顯著提高機(jī)械手的精確度和處理物體時(shí)的抓地力。

2020-09-11 13:57:11

2386

多模態(tài)生物識(shí)別系統(tǒng)的原理及局限性

隨著技術(shù)的發(fā)展，使用生物識(shí)別技術(shù)實(shí)施安全個(gè)人識(shí)別協(xié)議的挑戰(zhàn)正在增加，并且在世界上幾乎每個(gè)市場(chǎng)中對(duì)于準(zhǔn)確的人類(lèi)識(shí)別的需求都比以往更高。生物識(shí)別管理市場(chǎng)的并行發(fā)展已經(jīng)確定，用于識(shí)別目的的單個(gè)硬件模態(tài)的使用可能不再是許多行業(yè)的最明智的選擇，那多模態(tài)生物識(shí)別系統(tǒng)有哪些優(yōu)勢(shì)？

2020-10-09 15:30:39

3703

一文解析多模態(tài)生物識(shí)別技術(shù)的安全性

多模態(tài)生物特征識(shí)別是指在識(shí)別系統(tǒng)中使用兩種或更多種生物特征的組合，例如，結(jié)合人臉識(shí)別和虹膜識(shí)別的系統(tǒng)可以被認(rèn)為是多模態(tài)生物識(shí)別系統(tǒng)，那多模態(tài)生物識(shí)別技術(shù)安全嗎？

2020-10-13 09:45:56

1243

多模態(tài)中NLP與CV融合的方式有哪些？

test 看文本部分在其中起到的作用為0... ( ) ? 現(xiàn)在看來(lái)還是wide and deep這種方式太粗暴了（對(duì)于復(fù)雜信息的融合），本文寫(xiě)寫(xiě)多模態(tài)掃盲基礎(chǔ)和最近大家精巧的一些圖像文本融合的模型設(shè)計(jì)，主要是在VQA（視覺(jué)問(wèn)答）領(lǐng)域，也有一個(gè)多模態(tài)QA，因?yàn)樵谕扑]領(lǐng)域，你

2020-12-31 10:12:37

5828

研發(fā)全新多模態(tài)感知AI框架 AI能同時(shí)模擬人眼和手預(yù)測(cè)物體運(yùn)動(dòng)

第一個(gè)利用視覺(jué)和觸覺(jué)感知來(lái)學(xué)習(xí)多模態(tài)動(dòng)力學(xué)模型的研究。運(yùn)動(dòng)預(yù)測(cè)是自動(dòng)化領(lǐng)域的一大關(guān)鍵技術(shù)，通過(guò)預(yù)判物體和環(huán)境的交互方式，自動(dòng)化系統(tǒng)得以作出更加智能的決策。該團(tuán)隊(duì)的這項(xiàng)研究，似乎又將這一技術(shù)的應(yīng)用向前推進(jìn)了一步。這篇論文名為《

2021-02-12 09:12:00

3829

Transformer模型的多模態(tài)學(xué)習(xí)應(yīng)用

隨著Transformer在視覺(jué)中的崛起，Transformer在多模態(tài)中應(yīng)用也是合情合理的事情，甚至以后可能會(huì)有更多的類(lèi)似的paper。

2021-03-25 09:29:59

11780

基于聯(lián)合壓縮感知的多模態(tài)目標(biāo)統(tǒng)一跟蹤方法

針對(duì)多模態(tài)目標(biāo)跟蹤中大多僅考慮單個(gè)圖像的異種特征融合或不同模態(tài)圖像的同種特征融合，為了使得這兩者間能自然集成，提出基于聯(lián)合壓縮感知的多模態(tài)目標(biāo)統(tǒng)一跟蹤方法。通過(guò)將多模態(tài)跟蹤問(wèn)題轉(zhuǎn)化為多重2-范數(shù)

2021-04-27 15:59:29

多模態(tài)MR和多特征融合的GBM自動(dòng)分割算法

多模態(tài)MR和多特征融合的GBM自動(dòng)分割算法

2021-06-27 11:45:54

簡(jiǎn)述文本與圖像領(lǐng)域的多模態(tài)學(xué)習(xí)有關(guān)問(wèn)題

來(lái)自：哈工大SCIR 本期導(dǎo)讀：近年來(lái)研究人員在計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理方向均取得了很大進(jìn)展，因此融合了二者的多模態(tài)深度學(xué)習(xí)也越來(lái)越受到關(guān)注。本期主要討論結(jié)合文本和圖像的多模態(tài)任務(wù)，將從多模態(tài)預(yù)訓(xùn)練

2021-08-26 16:29:52

7520

元宇宙怎么感知觸覺(jué)

元宇宙怎么感知觸覺(jué)？今年元宇宙爆火，元宇宙幾乎成了人們討論的家常，建立元宇宙，從感知現(xiàn)實(shí)開(kāi)始。元宇宙離不開(kāi)3D觸覺(jué)技術(shù)的支持，F(xiàn)acebook近日推出了一款適用于機(jī)器人和可穿戴設(shè)備的“皮膚”，讓機(jī)器人有觸覺(jué)。

2021-11-09 09:55:44

6922

NüWA多模態(tài)模型支持八大視覺(jué)生成與編輯任務(wù)

小編說(shuō)：“自然語(yǔ)言”正在越來(lái)越經(jīng)常地出現(xiàn)在我們的日常生活中。你有沒(méi)有想象過(guò)，我們有一天可以使用自然語(yǔ)言對(duì)視覺(jué)內(nèi)容進(jìn)行編輯?微軟亞洲研究院最新推出的多模態(tài)模型 NüWA，不僅讓視覺(jué)內(nèi)容創(chuàng)造多了一條路

2022-03-11 09:23:26

2282

普諾飛思傳感器Metavision實(shí)現(xiàn)更快速且節(jié)能機(jī)器觸覺(jué)感知

今天，人工智能技術(shù)的發(fā)展已經(jīng)成功將視覺(jué)和聽(tīng)覺(jué)等人類(lèi)重要的感官功能結(jié)合到機(jī)器人技術(shù)中，但賦予機(jī)器人予人類(lèi)觸覺(jué)的感知仍是一項(xiàng)不可小覷的挑戰(zhàn)。

2022-06-09 16:33:46

3348

實(shí)現(xiàn)多模態(tài)的神經(jīng)形態(tài)感知提供了一種新型硬件方案

論文中，課題組以裝有水的杯子為例對(duì)多模態(tài)感知進(jìn)行了說(shuō)明：通常對(duì)于只有壓力信息的單模態(tài)感知來(lái)講，我們只能知道杯子的形狀、以及杯中的水量，并不能獲悉杯中的水溫。如果想同時(shí)得知杯子形狀、水量以及水溫，那么就得引入另一個(gè)溫度模態(tài)的信息。

2022-07-28 09:14:10

2266

基于ATH指環(huán)的智能系統(tǒng) 打造沉浸式虛擬社交體驗(yàn)

據(jù)麥姆斯咨詢報(bào)道，近日，新加坡國(guó)立大學(xué)Chengkuo Lee教授團(tuán)隊(duì)提出了一種具有多模態(tài)傳感和反饋功能的增強(qiáng)觸覺(jué)感知和觸覺(jué)反饋指環(huán)（augmented tactile-perception

2022-09-19 16:31:28

1584

智能船舶視覺(jué)感知系統(tǒng)設(shè)計(jì)方案

智能船舶視覺(jué)感知系統(tǒng)也是監(jiān)控乘客或船員在白天或晚上在甲板上的活動(dòng)的工具?？梢粤⒓窗l(fā)現(xiàn)和識(shí)別擔(dān)任瞭望員、照料貨物或在惡劣天氣中外出的船員。作為船舶安全和安保系統(tǒng)的一部分，還可以檢測(cè)和監(jiān)控內(nèi)部和外部甲板上的乘客。

2022-09-30 15:59:44

2037

面向社交媒體的多模態(tài)屬性級(jí)情感分析

另一方面，相比于單一的文本數(shù)據(jù)，多模態(tài)數(shù)據(jù)包含了多種不同信息，這些信息之間往往一一對(duì)應(yīng)、互為補(bǔ)充，如何對(duì)齊不同模態(tài)的內(nèi)容并提出有效的多模態(tài)融合機(jī)制是一個(gè)十分棘手的問(wèn)題。

2022-10-19 10:10:11

3022

基于多模態(tài)智慧感知決策的S230芯片

提到多模態(tài)融合感知，我們難免會(huì)覺(jué)得有些困惑 “模態(tài)”，可理解為“感官” 多模態(tài)即將多種感官融合不夠直觀？那今天我們就以一道競(jìng)猜題開(kāi)場(chǎng) 請(qǐng)根據(jù)以下線索猜猜這是什么物品？

2022-11-03 11:59:06

1057

廣西大學(xué)：研發(fā)可穿戴摩擦電視覺(jué)傳感器用于觸覺(jué)感知

具有可見(jiàn)光反饋功能的觸覺(jué)傳感器，如可穿戴顯示器、電子皮膚和生物醫(yī)學(xué)設(shè)備，在各個(gè)領(lǐng)域都變得越來(lái)越重要。然而，現(xiàn)有方法由于其光映射性能有限和可移植性不足，無(wú)法滿足強(qiáng)度反饋和擴(kuò)展交叉的觸覺(jué)感知的應(yīng)用需求

2022-12-13 16:27:53

2083

廣西大學(xué)：研發(fā)可穿戴摩擦電視覺(jué)傳感器用于觸覺(jué)感知

2022-12-13 16:31:24

1774

一個(gè)真實(shí)閑聊多模態(tài)數(shù)據(jù)集TikTalk

隨著大量預(yù)訓(xùn)練語(yǔ)言模型在文本對(duì)話任務(wù)中的出色表現(xiàn)，以及多模態(tài)的發(fā)展，在對(duì)話中引入多模態(tài)信息已經(jīng)引起了大量學(xué)者的關(guān)注。

2023-02-09 09:31:26

3234

利用視覺(jué)+語(yǔ)言數(shù)據(jù)增強(qiáng)視覺(jué)特征

傳統(tǒng)的多模態(tài)預(yù)訓(xùn)練方法通常需要"大數(shù)據(jù)"+"大模型"的組合來(lái)同時(shí)學(xué)習(xí)視覺(jué)+語(yǔ)言的聯(lián)合特征。但是關(guān)注如何利用視覺(jué)+語(yǔ)言數(shù)據(jù)提升視覺(jué)任務(wù)（多模態(tài)->單模態(tài)）上性能的工作并不多。本文旨在針對(duì)上述問(wèn)題提出一種簡(jiǎn)單高效的方法。

2023-02-13 13:44:05

1587

中文多模態(tài)對(duì)話數(shù)據(jù)集

隨著大量預(yù)訓(xùn)練語(yǔ)言模型在文本對(duì)話任務(wù)中的出色表現(xiàn)，以及多模態(tài)的發(fā)展，在對(duì)話中引入多模態(tài)信息已經(jīng)引起了大量學(xué)者的關(guān)注。目前已經(jīng)提出了各種各樣的多模態(tài)對(duì)話數(shù)據(jù)集，主要來(lái)自電影、電視劇、社交媒體平臺(tái)等

2023-02-22 11:03:01

2184

微軟多模態(tài)ChatGPT的常見(jiàn)測(cè)試介紹

研究者將一個(gè)基于 Transformer 的語(yǔ)言模型作為通用接口，并將其與感知模塊對(duì)接。他們?cè)诰W(wǎng)頁(yè)規(guī)模的多模態(tài)語(yǔ)料庫(kù)上訓(xùn)練模型，語(yǔ)料庫(kù)包括了文本數(shù)據(jù)、任意交錯(cuò)的圖像和文本、以及圖像字幕對(duì)。

2023-03-13 11:23:00

1247

ImageBind：跨模態(tài)之王，將6種模態(tài)全部綁定！

最近，很多方法學(xué)習(xí)與文本、音頻等對(duì)齊的圖像特征。這些方法使用單對(duì)模態(tài)或者最多幾種視覺(jué)模態(tài)。最終嵌入僅限于用于訓(xùn)練的模態(tài)對(duì)。因此，視頻 - 音頻嵌入無(wú)法直接用于圖像 - 文本任務(wù)，反之亦然。學(xué)習(xí)真正的聯(lián)合嵌入面臨的一個(gè)主要障礙是缺乏所有模態(tài)融合在一起的大量多模態(tài)數(shù)據(jù)。

2023-05-11 09:30:44

1972

多模態(tài)GPT：國(guó)內(nèi)發(fā)布一款可以在線使用的多模態(tài)聊天機(jī)器人！

基于開(kāi)源多模態(tài)模型 OpenFlamingo，作者使用公開(kāi)數(shù)據(jù)集創(chuàng)建了各種視覺(jué)指令數(shù)據(jù)，包括視覺(jué)問(wèn)答、圖像字幕、視覺(jué)推理、文本 OCR 和視覺(jué)對(duì)話。此外，還使用僅包含語(yǔ)言指令數(shù)據(jù)的語(yǔ)言模型組件進(jìn)行了訓(xùn)練。

2023-05-12 09:55:03

1723

邱錫鵬團(tuán)隊(duì)提出具有內(nèi)生跨模態(tài)能力的SpeechGPT，為多模態(tài)LLM指明方向

LLM 與通用人工智能（AGI）之間仍存在顯著差距。首先，大多數(shù)當(dāng)前 LLM 只能感知和理解多模態(tài)內(nèi)容，而不能自然而然地生成多模態(tài)內(nèi)容。其次，像圖像和語(yǔ)音這樣的連續(xù)信號(hào)不能直接適應(yīng)接收離散 token 的 LLM。

2023-05-22 14:38:06

1332

自動(dòng)駕駛深度多模態(tài)目標(biāo)檢測(cè)和語(yǔ)義分割:數(shù)據(jù)集、方法和挑戰(zhàn)

了許多解決深度多模態(tài)感知問(wèn)題的方法。然而，對(duì)于網(wǎng)絡(luò)架構(gòu)的設(shè)計(jì)，并沒(méi)有通用的指導(dǎo)方針，關(guān)于“融合什么”、“何時(shí)融合”和“如何融合”的問(wèn)題仍然沒(méi)有定論。本文系統(tǒng)地總結(jié)了自動(dòng)駕駛中深度多模態(tài)目標(biāo)檢測(cè)和語(yǔ)義分割的方法，

2023-06-06 10:37:11

VisCPM：邁向多語(yǔ)言多模態(tài)大模型時(shí)代

隨著 GPT-4 和 Stable Diffusion 等模型多模態(tài)能力的突飛猛進(jìn)，多模態(tài)大模型已經(jīng)成為大模型邁向通用人工智能（AGI）目標(biāo)的下一個(gè)前沿焦點(diǎn)?？傮w而言，面向圖像和文本的多模態(tài)生成能力

2023-07-10 10:05:01

1255

全球首個(gè)面向網(wǎng)聯(lián)智能車(chē)的通信與多模態(tài)感知數(shù)據(jù)集發(fā)布

7月2日，2023中國(guó)智能車(chē)大會(huì)暨國(guó)家智能車(chē)發(fā)展論壇在廣州南沙盛大開(kāi)幕。會(huì)上重磅發(fā)布全球首個(gè)面向網(wǎng)聯(lián)智能車(chē)的包含多車(chē)和多路端的通信與多模態(tài)感知數(shù)據(jù)集Mixed Multi-Modal Sensing and Communication （M3SC）。

2023-07-13 15:20:21

1419

更強(qiáng)更通用：智源「悟道3.0」Emu多模態(tài)大模型開(kāi)源，在多模態(tài)序列中「補(bǔ)全一切」

當(dāng)前學(xué)界和工業(yè)界都對(duì)多模態(tài)大模型研究熱情高漲。去年，谷歌的 Deepmind 發(fā)布了多模態(tài)視覺(jué)語(yǔ)言模型 Flamingo ，它使用單一視覺(jué)語(yǔ)言模型處理多項(xiàng)任務(wù)，在多模態(tài)大模型領(lǐng)域保持較高

2023-07-16 20:45:02

1369

UniVL-DR: 多模態(tài)稠密向量檢索模型

模態(tài)數(shù)據(jù)的信息獲取需求在用戶搜索過(guò)程中尤為重要。 ▲?圖1. 不同多模態(tài)檢索框架示意圖為了實(shí)現(xiàn)多模態(tài)檢索過(guò)程，當(dāng)前的多媒體搜索系統(tǒng)通常采用“分而治之”的方法。如

2023-08-06 22:00:03

1796

基于Transformer多模態(tài)先導(dǎo)性工作

多模態(tài)（Multimodality）是指在信息處理、傳遞和表達(dá)中涉及多種不同的感知模態(tài)或信息來(lái)源。這些感知模態(tài)可以包括語(yǔ)言、視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)等，它們共同作用來(lái)傳遞更豐富、更全面的信息。在多模態(tài)系統(tǒng)中

2023-08-21 09:49:52

1516

北京航空航天大學(xué)發(fā)布軟體機(jī)器人智能感知系統(tǒng)最新進(jìn)展

如何區(qū)分一個(gè)以假亂真的蘋(píng)果模型和真實(shí)的蘋(píng)果？如何感知一張桌布的絲滑程度？當(dāng)視覺(jué)無(wú)法感知這些信息，我們便需要機(jī)器人通過(guò)觸覺(jué)來(lái)感知環(huán)境——開(kāi)發(fā)一個(gè)能夠多模態(tài)感知和描述物體的機(jī)器人，對(duì)幫助機(jī)器人與環(huán)境交互有十分重要的作用。

2023-08-30 15:22:29

2299

DreamLLM：多功能多模態(tài)大型語(yǔ)言模型，你的DreamLLM~

由于固有的模態(tài)缺口，如CLIP語(yǔ)義主要關(guān)注模態(tài)共享信息，往往忽略了可以增強(qiáng)多模態(tài)理解的模態(tài)特定知識(shí)。因此，這些研究并沒(méi)有充分認(rèn)識(shí)到多模式創(chuàng)造和理解之間潛在的學(xué)習(xí)協(xié)同作用，只顯示出創(chuàng)造力的微小提高，并且在多模式理解方面仍然存在不足。

2023-09-25 17:26:43

1532

觸覺(jué)傳感技術(shù)在軟體機(jī)械手領(lǐng)域的應(yīng)用

觸覺(jué)感知技術(shù)在人機(jī)交互領(lǐng)域具有重要價(jià)值。分布在軟體機(jī)械手的觸覺(jué)傳感器能夠在非結(jié)構(gòu)化的場(chǎng)景交互中為人們提供多模態(tài)感知信息

2023-10-17 09:05:20

2114

觸覺(jué)傳感技術(shù)在軟體機(jī)械手領(lǐng)域應(yīng)用

觸覺(jué)感知技術(shù)在人機(jī)交互領(lǐng)域具有重要價(jià)值。分布在軟體機(jī)械手的觸覺(jué)傳感器能夠在非結(jié)構(gòu)化的場(chǎng)景交互中為人們提供多模態(tài)感知信息，如接觸狀態(tài)（穩(wěn)態(tài)、滑動(dòng)、扭轉(zhuǎn)等）、表面特征（粗糙度、紋理、曲率等）、物理屬性

2023-10-18 10:35:04

1124

基于柔性機(jī)械手的觸覺(jué)傳感器技術(shù)研究

2023-10-24 11:46:36

1818

北大&華為提出：多模態(tài)基礎(chǔ)大模型的高效微調(diào)

深度學(xué)習(xí)的大模型時(shí)代已經(jīng)來(lái)臨,越來(lái)越多的大規(guī)模預(yù)訓(xùn)練模型在文本、視覺(jué)和多模態(tài)領(lǐng)域展示出杰出的生成和推理能力。然而大模型巨大的參數(shù)量有兩個(gè)明顯缺點(diǎn)

2023-11-08 16:20:25

2318

力觸覺(jué)感知系統(tǒng)的工作原理

力觸覺(jué)感知系統(tǒng)在機(jī)器人操作中具有非常重要的作用。它可以檢測(cè)機(jī)器人末端執(zhí)行器與工件相互作用時(shí)產(chǎn)生的三維力/力矩和接觸信息。這些信息對(duì)于機(jī)器人來(lái)說(shuō)是極其重要的，它們可以提供關(guān)于環(huán)境、操作和自身狀態(tài)

2023-11-08 17:37:23

1382

探究編輯多模態(tài)大語(yǔ)言模型的可行性

不同于單模態(tài)模型編輯，多模態(tài)模型編輯需要考慮更多的模態(tài)信息。文章出發(fā)點(diǎn)依然從單模態(tài)模型編輯入手，將單模態(tài)模型編輯拓展到多模態(tài)模型編輯，主要從以下三個(gè)方面：可靠性（Reliability），穩(wěn)定性（Locality）和泛化性（Generality）。

2023-11-09 14:53:22

1017

哈工大提出Myriad：利用視覺(jué)專家進(jìn)行工業(yè)異常檢測(cè)的大型多模態(tài)模型

最近，大型多模態(tài)（即視覺(jué)和語(yǔ)言）模型（LMM）在圖像描述、視覺(jué)理解、視覺(jué)推理等多種視覺(jué)任務(wù)上表現(xiàn)出了卓越的感知能力，使其成為更易于理解的異常檢測(cè)的有競(jìng)爭(zhēng)力的潛在選擇。然而，現(xiàn)有的通用 LMM 中缺乏有關(guān)異常檢測(cè)的知識(shí)，而訓(xùn)練特定的 LMM 進(jìn)行異常檢測(cè)需要大量的注釋數(shù)據(jù)和大量的計(jì)算資源。

2023-11-21 16:08:12

3815

用語(yǔ)言對(duì)齊多模態(tài)信息，北大騰訊等提出LanguageBind，刷新多個(gè)榜單

目前的 VL 預(yù)訓(xùn)練方法通常僅適用于視覺(jué)和語(yǔ)言模態(tài)，而現(xiàn)實(shí)世界中的應(yīng)用場(chǎng)景往往包含更多的模態(tài)信息，如深度圖、熱圖像等。如何整合和分析不同模態(tài)的信息，并且能夠在多個(gè)模態(tài)之間建立準(zhǔn)確的語(yǔ)義對(duì)應(yīng)關(guān)系，成為了多模態(tài)領(lǐng)域的一個(gè)新的挑戰(zhàn)。

2023-11-23 15:46:30

1616

任意文本、視覺(jué)、音頻混合生成，多模態(tài)有了強(qiáng)大的基礎(chǔ)引擎CoDi-2

研究者表示，CoDi-2 標(biāo)志著在開(kāi)發(fā)全面的多模態(tài)基礎(chǔ)模型領(lǐng)域取得了重大突破。今年 5 月，北卡羅來(lái)納大學(xué)教堂山分校、微軟提出一種可組合擴(kuò)散（Composable Diffusion，簡(jiǎn)稱

2023-12-03 20:20:02

1089

大模型+多模態(tài)的3種實(shí)現(xiàn)方法

我們知道，預(yù)訓(xùn)練LLM已經(jīng)取得了諸多驚人的成就，然而其明顯的劣勢(shì)是不支持其他模態(tài)（包括圖像、語(yǔ)音、視頻模態(tài)）的輸入和輸出，那么如何在預(yù)訓(xùn)練LLM的基礎(chǔ)上引入跨模態(tài)的信息，讓其變得更強(qiáng)大、更通用呢？本節(jié)將介紹“大模型+多模態(tài)”的3種實(shí)現(xiàn)方法。

2023-12-13 13:55:04

3106

人工智能領(lǐng)域多模態(tài)的概念和應(yīng)用場(chǎng)景

隨著人工智能技術(shù)的不斷發(fā)展，多模態(tài)成為了一個(gè)備受關(guān)注的研究方向。多模態(tài)技術(shù)旨在將不同類(lèi)型的數(shù)據(jù)和信息進(jìn)行融合，以實(shí)現(xiàn)更加準(zhǔn)確、高效的人工智能應(yīng)用。本文將詳細(xì)介紹多模態(tài)的概念、研究?jī)?nèi)容和應(yīng)用場(chǎng)景，并探討人工智能領(lǐng)域多模態(tài)的未來(lái)發(fā)展趨勢(shì)。

2023-12-15 14:28:44

13423

機(jī)器人基于開(kāi)源的多模態(tài)語(yǔ)言視覺(jué)大模型

ByteDance Research 基于開(kāi)源的多模態(tài)語(yǔ)言視覺(jué)大模型 OpenFlamingo 開(kāi)發(fā)了開(kāi)源、易用的 RoboFlamingo 機(jī)器人操作模型，只用單機(jī)就可以訓(xùn)練。

2024-01-19 11:43:08

944

阿里巴巴推出自主多模態(tài)AI代理MobileAgent

阿里巴巴最近推出了一款名為MobileAgent的自主多模態(tài)AI代理，這款產(chǎn)品模擬人類(lèi)操作手機(jī)，并采用純視覺(jué)解決方案，無(wú)需任何系統(tǒng)代碼。

2024-02-04 10:34:17

1730

用于機(jī)器人觸覺(jué)和非接觸距離感知的柔性雙模態(tài)傳感器設(shè)計(jì)

具有非接觸式傳感功能的柔性傳感器的開(kāi)發(fā)仍然是觸覺(jué)感知的技術(shù)挑戰(zhàn)。

2024-02-28 09:58:43

2185

銀牛微電子3D視覺(jué)感知方案賦能小米CyberDog系列仿生四足機(jī)器人

2024年3月21日，合肥銀牛微電子宣布小米CyberDog系列仿生四足機(jī)器人的AI多模態(tài)融合感知決策系統(tǒng)正式采用銀牛的雙目立體視覺(jué)產(chǎn)品解決方案。

2024-03-21 13:55:15

1720

NVIDIA Edify多模態(tài)架構(gòu)升級(jí)，引領(lǐng)視覺(jué)生成式AI新紀(jì)元

NVIDIA近日宣布，其用于視覺(jué)生成式AI的多模態(tài)架構(gòu)Edify迎來(lái)重大更新，為開(kāi)發(fā)者和視覺(jué)內(nèi)容提供商帶來(lái)前所未有的新功能。其中，3D資產(chǎn)生成功能的引入，極大地提升了AI圖像生成的創(chuàng)意自由度，讓創(chuàng)作者能夠以前所未有的方式展現(xiàn)他們的想象力。

2024-03-27 10:22:15

961

李未可科技正式推出WAKE-AI多模態(tài)AI大模型

文本生成、語(yǔ)言理解、圖像識(shí)別及視頻生成等多模態(tài)交互能力。 ? 該大模型圍繞 GPS 軌跡+視覺(jué)+語(yǔ)音打造新一代 LLM-Based的自然交互，同時(shí)多模態(tài)問(wèn)答技術(shù)的加持，能實(shí)現(xiàn)所見(jiàn)即所問(wèn)、所問(wèn)即所得的精準(zhǔn)服務(wù)。此外，融合了人類(lèi)意圖理解、長(zhǎng)期記憶機(jī)制、情感大模型及TTS 克

2024-04-18 17:01:29

1091

華中科技大學(xué)研發(fā)微型傳感器，索尼預(yù)測(cè)其圖像傳感器市場(chǎng)份額明年將突破 60%

傳感新品【清華大學(xué)：研發(fā)基于光纖傳感技術(shù)的多模態(tài)觸覺(jué)感知的仿生機(jī)械手】隨著軟體機(jī)器人技術(shù)的發(fā)展，觸覺(jué)感知在人機(jī)安全交互、可穿戴設(shè)備和醫(yī)療器械領(lǐng)域發(fā)揮著重要作用。如何用簡(jiǎn)單的系統(tǒng)集成更多的觸覺(jué)感知

2024-06-07 08:41:23

930

慕尼黑電子展回顧：?jiǎn)⒚髦秋@多模態(tài)硬件智能體引領(lǐng)科技潮流

在剛剛落幕的慕尼黑電子展上，啟明云端攜啟明智顯與觸覺(jué)智能兩家子公司，共同為全球觀眾呈現(xiàn)了一場(chǎng)科技盛宴。本次展會(huì)，啟明智顯憑借其創(chuàng)新的多模態(tài)硬件智能體及一系列前沿產(chǎn)品，贏得了廣泛關(guān)注與好評(píng)，展位現(xiàn)場(chǎng)

2024-07-10 16:17:30

950

利用OpenVINO部署Qwen2多模態(tài)模型

多模態(tài)大模型的核心思想是將不同媒體數(shù)據(jù)（如文本、圖像、音頻和視頻等）進(jìn)行融合，通過(guò)學(xué)習(xí)不同模態(tài)之間的關(guān)聯(lián)，實(shí)現(xiàn)更加智能化的信息處理。簡(jiǎn)單來(lái)說(shuō)，多模態(tài)大模型可以可以理解多種不同模態(tài)的輸入數(shù)據(jù)，并輸出相應(yīng)反饋結(jié)果，例如圖像理解，語(yǔ)音識(shí)別，視覺(jué)問(wèn)題等。

2024-10-18 09:39:38

2710

超聲界“內(nèi)卷終結(jié)者”！ZRT智銳通提供全新引擎打造多模態(tài)影像融合系統(tǒng)

多模態(tài)影像融合超聲系統(tǒng)的市場(chǎng)規(guī)模也在不斷擴(kuò)大，國(guó)內(nèi)眾多超聲系統(tǒng)廠家也在不斷尋找合適的硬件平臺(tái)，用以承載旗下的多模態(tài)影像融合超聲系統(tǒng)。

2024-11-11 10:52:22

1650

超越人類(lèi)視覺(jué)！昱感微“多維像素”多模態(tài)超級(jí)攝像頭方案產(chǎn)品賦能超凡感知力

視覺(jué)——人眼只能感知所見(jiàn)目標(biāo)大概的距離/位置/速度以及外觀信息，并且受到天氣、光線等因素影響較大；昱感微“多維像素”多模態(tài)感知方案的超級(jí)攝像頭每秒可輸出30幀（甚至更高頻率）多模態(tài)融合感知數(shù)據(jù)，每一幀不僅有高清圖像數(shù)

2024-12-12 17:17:31

1341

商湯日日新多模態(tài)大模型權(quán)威評(píng)測(cè)第一

剛剛，商湯科技日日新SenseNova多模態(tài)大模型，在權(quán)威綜合評(píng)測(cè)權(quán)威平臺(tái)OpenCompass的多模態(tài)評(píng)測(cè)中取得榜單第一。

2024-12-20 10:39:31

1573

昱感微創(chuàng)始人&CEO蔣宏受邀出席“聚焦多模態(tài)雷視融合感知技術(shù)”學(xué)術(shù)沙龍，共探AI機(jī)器視覺(jué)未來(lái)

微創(chuàng)始人&CEO蔣宏受邀出席演講，與廣研院師生分享了《?“多維像素”多模態(tài)雷視融合感知技術(shù)——賦能AI機(jī)器視覺(jué)超級(jí)感知能力》主旨報(bào)告。昱感微采用最前沿的多維像素多模態(tài)前融合技術(shù)，將可見(jiàn)光攝像頭、紅外攝像頭、4D毫米波雷達(dá)/激

2025-01-09 10:35:17

1525

廣西大學(xué)：用于高溫應(yīng)用中的壓力和溫度傳感的摩擦電觸覺(jué)傳感器

? 具有同時(shí)檢測(cè)多種刺激能力的類(lèi)皮膚傳感器在前沿人機(jī)交互中具有巨大的潛力。然而，實(shí)現(xiàn)超越人類(lèi)觸覺(jué)感知的多模態(tài)觸覺(jué)識(shí)別仍面臨重大挑戰(zhàn)。在此，來(lái)自廣西大學(xué)的聶雙喜研究團(tuán)隊(duì)于國(guó)際著名學(xué)術(shù)期刊Nature

2025-03-04 18:27:25

904

?多模態(tài)交互技術(shù)解析

多模態(tài)交互多模態(tài)交互（ Multimodal Interaction ）是指通過(guò)多種感官通道（如視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)等）或多種交互方式（如語(yǔ)音、手勢(shì)、觸控、眼動(dòng)等）與計(jì)算機(jī)系統(tǒng)進(jìn)行自然、協(xié)同的信息交互

2025-03-17 15:12:44

3942

研究基于多功能離子纖維傳感器系統(tǒng)的物體識(shí)別和抓取的人工觸覺(jué)感知

人類(lèi)觸覺(jué)感知是一種復(fù)雜的感覺(jué)系統(tǒng)，它依賴于皮膚中的感覺(jué)受體來(lái)接收外部刺激，轉(zhuǎn)換信號(hào)，隨后通過(guò)神經(jīng)系統(tǒng)分析和識(shí)別這些信號(hào)。傳遞到大腦皮層的觸覺(jué)信息在特定區(qū)域經(jīng)歷復(fù)雜的處理。例如，體感皮層感知身體

2025-03-24 18:22:14

814

昆蟲(chóng)觸角啟發(fā)研發(fā)雙模觸覺(jué)傳感器

【文章亮點(diǎn)】多模態(tài)感知能力：通過(guò)接觸高度、接觸面積和壓力大小，傳感器（BITS）能夠感知物體的軟硬程度。材料類(lèi)型識(shí)別：利用材料獲取或失去電子的能力差異，BITS陣列生成獨(dú)特的靜電信號(hào)，從而

2025-03-27 15:34:09

849

安霸在ISC West上推出下一代前端多模態(tài)AI技術(shù)

近日，Ambarella (下稱“安霸”，納斯達(dá)克股票代碼：AMBA， AI 視覺(jué)感知芯片公司）在美國(guó)拉斯維加斯西部安防展（ISC West）上宣布，將持續(xù)推動(dòng)前端多模態(tài) AI 技術(shù)的創(chuàng)新與突破

2025-04-03 09:57:37

775

NVIDIA技術(shù)驅(qū)動(dòng)帕西尼觸覺(jué)感知與人形機(jī)器人智能突破

感知科技實(shí)現(xiàn)了從接觸仿真、觸覺(jué)信號(hào)產(chǎn)生、仿真數(shù)據(jù)生成，再到觸覺(jué)模態(tài)模型訓(xùn)練的全流程 GPU 加速，提升標(biāo)定和訓(xùn)練效率 100 倍，完成觸覺(jué)傳感器的批量標(biāo)定和觸覺(jué)模態(tài)規(guī)?；瘜?shí)機(jī)部署。

2025-04-21 09:15:02

1281

中國(guó)科學(xué)院：電鰻啟發(fā)離子電子人造皮膚，具有多模態(tài)感知和傳感器內(nèi)儲(chǔ)層計(jì)算功能

無(wú)法同時(shí)實(shí)現(xiàn)多模態(tài)感知和記憶（即觸覺(jué)、熱學(xué)和電學(xué)刺激），難以檢測(cè)超低電流，以及在高效傳感器內(nèi)儲(chǔ)層計(jì)算所必需的豐富突觸行為方面存在局限性。受電鰻的啟發(fā)，本研究開(kāi)發(fā)了一種基于離子電子p-n結(jié)的人工皮膚，該p-n結(jié)由PolyAT和

2025-05-11 17:24:24

836

XMOS為普及AI應(yīng)用推出基于軟件定義SoC的多模態(tài)AI傳感器融合接口

多模態(tài)傳感信號(hào)AI處理為智算中心和邊緣智能開(kāi)啟感知智能的新篇章

2025-05-12 17:51:54

429

NVIDIA助力圖靈新訊美推出企業(yè)級(jí)多模態(tài)視覺(jué)大模型融合解決方案

中國(guó)推出企業(yè)級(jí)多模態(tài)視覺(jué)大模型融合解決方案，推動(dòng)先進(jìn) AI 模型在交通治理、工業(yè)質(zhì)檢、金融風(fēng)控等領(lǐng)域?qū)崿F(xiàn)高效識(shí)別、精準(zhǔn)預(yù)警和穩(wěn)定交付。

2025-06-26 09:17:31

1133

具身智能機(jī)器人在檢驗(yàn)檢測(cè)實(shí)驗(yàn)室應(yīng)用的技術(shù)路徑探討

具身智能機(jī)器人在檢驗(yàn)檢測(cè)實(shí)驗(yàn)室的應(yīng)用需突破多模態(tài)感知、靈巧操作、認(rèn)知決策等核心技術(shù)，并通過(guò)仿真訓(xùn)練、大模型微調(diào)等路徑實(shí)現(xiàn)落地。一、核心技術(shù)瓶頸1.多模態(tài)感知融合觸覺(jué)與視覺(jué)協(xié)同：實(shí)驗(yàn)室操作需識(shí)別微米級(jí)

2025-07-28 17:32:48

1040

多模態(tài)大模型驅(qū)動(dòng)的復(fù)雜環(huán)境精準(zhǔn)導(dǎo)航避障系統(tǒng)平臺(tái)的應(yīng)用

多模態(tài)大模型驅(qū)動(dòng)的復(fù)雜環(huán)境精準(zhǔn)導(dǎo)航避障系統(tǒng)平臺(tái)的應(yīng)用

2025-12-22 13:15:45

139

多模態(tài)感知大模型驅(qū)動(dòng)的密閉空間自主勘探系統(tǒng)的應(yīng)用與未來(lái)發(fā)展

? ? 多模態(tài)感知大模型驅(qū)動(dòng)的密閉空間自主勘探系統(tǒng) ? ?北京華盛恒輝多模態(tài)感知大模型驅(qū)動(dòng)的密閉空間自主勘探系統(tǒng)，是融合多模態(tài)大模型與自主機(jī)器人技術(shù)的創(chuàng)新型方案。該系統(tǒng)整合視覺(jué)、激光雷達(dá)、聲學(xué)等多源

2025-12-29 11:27:56

118

2026電子皮膚賦能具身智能機(jī)器人專題論壇即將召開(kāi)，共同探索觸覺(jué)感知新未來(lái)

、空間分辨率及多功能集成方面取得了顯著突破。電子皮膚通過(guò)模仿生物皮膚的多模態(tài)感知能力，賦予機(jī)器人觸覺(jué)、溫感乃至痛覺(jué)，是機(jī)器人邁向真正‘智能’的關(guān)鍵一步。 “第二屆機(jī)器人靈巧手國(guó)際創(chuàng)新大會(huì)”將于2026年3月19-20日在上

2025-12-29 18:49:33

938

已全部加載完成

91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲日韩欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

搜索歷史

基于視覺(jué)的多模態(tài)觸覺(jué)感知系統(tǒng)

評(píng)論