多模態(tài)融合的識(shí)別方式更安全抗偽造能力更強(qiáng)

“人工智能技術(shù)能夠?qū)⒑Ａ康闹讣y數(shù)據(jù)作為‘原材料’，學(xué)習(xí)到他們的結(jié)構(gòu)特征和細(xì)節(jié)信息，并且根據(jù)一定的規(guī)則進(jìn)行重組，生成仿真度極高的偽造數(shù)據(jù)。”人工智能行業(yè)資深人士孫立斌說。

最近，美國紐約大學(xué)和密歇根州立大學(xué)發(fā)表的一篇論文詳細(xì)介紹了深度學(xué)習(xí)技術(shù)如何削弱指紋識(shí)別的安全系統(tǒng)。

AI能偽造指紋，指紋解鎖還安全嗎？

生成對(duì)抗網(wǎng)絡(luò)可偽造指紋

“指紋識(shí)別，即通過識(shí)別手指紋路確認(rèn)身份。指紋識(shí)別雖應(yīng)用廣泛但存在一定的弊端。因?yàn)橛|摸式的驗(yàn)證方式對(duì)環(huán)境要求高，對(duì)手指的濕度和清潔度更有要求，指紋磨損也會(huì)造成識(shí)別困難；另外一些人天生沒有指紋，或者指紋特征少導(dǎo)致無法成像；不容忽視的是，指紋痕跡容易留存，存在被復(fù)制的可能性，造假成本低?！睍缫暱萍佳芯吭貉芯咳藛T范浩強(qiáng)告訴科技日?qǐng)?bào)記者。

此次論文顯示，研究人員使用神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)訓(xùn)練基礎(chǔ)軟件，創(chuàng)建出令人信服的偽造指紋，其圖像甚至優(yōu)于原始指紋素材。“團(tuán)隊(duì)使用神經(jīng)網(wǎng)絡(luò)技術(shù)變體，即生成對(duì)抗網(wǎng)絡(luò)偽造指紋。”論文作者之一、紐約大學(xué)副教授朱利安·托吉留斯說。

“生成對(duì)抗網(wǎng)絡(luò)是當(dāng)下非常火爆的一種深度學(xué)習(xí)算法，它本質(zhì)是一種生成式模型，通過對(duì)抗式訓(xùn)練，制造帶有數(shù)據(jù)噪音的深度偽造的圖片，可用于數(shù)據(jù)增強(qiáng)，也可用于攻破特定的識(shí)別系統(tǒng)?！狈逗茝?qiáng)說。

孫立斌解釋，人工智能技術(shù)還能夠利用人眼和計(jì)算機(jī)認(rèn)知方式的不同，在指紋圖像中嵌入某些隱藏屬性，雖然肉眼看不出來，但計(jì)算機(jī)可抓取這些信息，達(dá)到利用偽造指紋圖像進(jìn)行身份識(shí)別的目的。并且很多系統(tǒng)沒有活體檢測模塊，無法判定獲取的圖像是否來自于真實(shí)的人體，這一漏洞使得偽造的指紋圖像可以通過系統(tǒng)驗(yàn)證。

指紋、人臉、虹膜識(shí)別各有特色

范浩強(qiáng)介紹，就生物識(shí)別來說，目前常見的應(yīng)用有指紋識(shí)別、人臉識(shí)別、虹膜識(shí)別等。

虹膜識(shí)別，目前主要見于部分高端智能手機(jī)的虹膜識(shí)別解鎖。相較于指紋識(shí)別，虹膜識(shí)別技術(shù)通過人體獨(dú)一無二的眼睛虹膜特征來識(shí)別身份，虹膜識(shí)別的準(zhǔn)確性是各種生物識(shí)別中較高的，但相較于其它生物識(shí)別技術(shù)，虹膜識(shí)別硬件造價(jià)高，識(shí)別過程需配合，大范圍推廣較為困難，鏡頭可能產(chǎn)生圖像畸變而使可靠性降低。因此，虹膜識(shí)別的圖像獲取和模式匹配都相對(duì)不便，實(shí)現(xiàn)大規(guī)模商用還有許多技術(shù)難關(guān)亟待攻克。

“人臉識(shí)別，以計(jì)算機(jī)圖像處理技術(shù)從人的面部提取關(guān)鍵特征點(diǎn)，利用已建成的人臉特征模板與被驗(yàn)證者的特征進(jìn)行對(duì)比分析，根據(jù)分析的結(jié)果給出相似值。通過這個(gè)值即可確定是否為同一人。相較于指紋需要接觸、虹膜需要配合的識(shí)別特性，人臉識(shí)別可自動(dòng)抓取驗(yàn)證，非配合式的識(shí)別更加便捷，適用場景更加豐富?！狈逗茝?qiáng)說。

多模態(tài)融合的識(shí)別方式更安全

范浩強(qiáng)分析，人臉識(shí)別在評(píng)估安全性上有兩個(gè)維度不可忽略。

“是否易獲取。這包括獲取應(yīng)用場景的人臉數(shù)據(jù)和底庫數(shù)據(jù)，僅擁有任何單一數(shù)據(jù)都無法完成識(shí)別比對(duì)。目前人臉識(shí)別商業(yè)應(yīng)用場景中不管是數(shù)據(jù)采集、調(diào)用還是比對(duì)等任一環(huán)節(jié)都需要在用戶知情、并且同意的情況下進(jìn)行。而人臉生物樣本的核心數(shù)據(jù)庫是由公安、央行等核心機(jī)構(gòu)掌握，并非一般商業(yè)運(yùn)營商能夠有權(quán)獲得的?！狈逗茝?qiáng)說，其次是，是否易攻破。這不僅考驗(yàn)算法實(shí)力，更重要的是抗攻擊能力。

“綜合來看，人臉識(shí)別是目前生物識(shí)別領(lǐng)域安全性較高的，當(dāng)然也并非萬無一失，想要實(shí)現(xiàn)人臉識(shí)別安全、規(guī)?；涞匦枰夹g(shù)水平、法律法規(guī)和行業(yè)標(biāo)準(zhǔn)逐步完善。”范浩強(qiáng)表示。

孫立斌認(rèn)為，生物特征識(shí)別迅猛發(fā)展，不同模態(tài)的生物特征有其自身的特性，抗偽造能力也不同。若要更高級(jí)別抗擊假體攻擊的風(fēng)險(xiǎn)，可以采取多模態(tài)融合的識(shí)別方式，例如步態(tài)和人臉一體化識(shí)別，能夠大幅度增加偽造數(shù)據(jù)的難度，提升識(shí)別系統(tǒng)的安全性。

閱讀全文

指紋識(shí)別(104518) 指紋識(shí)別(104518)
生物識(shí)別(53977) 生物識(shí)別(53977)
人工智能(263002) 人工智能(263002)

評(píng)論

自動(dòng)駕駛多傳感器數(shù)據(jù)融合方法

文章來源：雅名特自動(dòng)駕駛近年來，深度學(xué)習(xí)技術(shù)在涉及高維非結(jié)構(gòu)化數(shù)據(jù)領(lǐng)域展現(xiàn)出了最先進(jìn)的性能，如計(jì)算機(jī)視覺、語音、自然語言處理等方面，并且開始涉及更大、更復(fù)雜的多模態(tài)信息問題。不同傳感器在進(jìn)行

2023-10-09 16:23:19

3664

語音識(shí)別技術(shù)最新進(jìn)展：視聽融合的多模態(tài)交互成為主要演進(jìn)方向

多種模態(tài)（聲學(xué)、語言模型、視覺特征等）進(jìn)行聯(lián)合建模，基于深度學(xué)習(xí)的多模態(tài)語音識(shí)別取得了新進(jìn)展。 ? 多模態(tài)交互的原理及優(yōu)勢 ? 多模態(tài)交互技術(shù)融合了多種輸入方式，包括語音、手勢、觸摸和眼動(dòng)等，使用戶可以根據(jù)自己的喜好和習(xí)慣

2023-12-28 09:06:45

6613

抗混淆濾波器怎么實(shí)現(xiàn)混合信號(hào)和多模態(tài)傳感器調(diào)節(jié)？

一些傳感器信號(hào)調(diào)節(jié)器用于處理多個(gè)傳感元件的輸出。這種處理過程通常由多模態(tài)、混合信號(hào)調(diào)節(jié)器完成，它可以同時(shí)處理數(shù)個(gè)傳感元件的輸出。本文對(duì)這類傳感器信號(hào)調(diào)節(jié)器中抗混淆濾波器的工作情況進(jìn)行詳細(xì)分析。

2020-04-21 06:59:01

RK3576驅(qū)動(dòng)高端顯控系統(tǒng)升級(jí)：多屏拼控與AI視覺融合解決方案

下達(dá)任務(wù)指令，副屏監(jiān)測 AI 分析結(jié)果，大屏實(shí)時(shí)展示各區(qū)域畫面與運(yùn)行狀態(tài)，真正實(shí)現(xiàn) “一屏決策，多屏聯(lián)動(dòng)”。八路攝像頭輸入：實(shí)現(xiàn)多源視頻融合與 AI 識(shí)別RK3576 原生支持八路攝像頭輸入

2025-11-21 17:51:45

SCDN的抗CC攻擊和抗DDoS攻擊防護(hù)是什么？

合法的訪問，占用服務(wù)器的服務(wù)資源，從而使真正的用戶的請(qǐng)求無法得到服務(wù)的響應(yīng)。SCDN的抗CC攻擊和抗DDoS攻擊防護(hù)：阿里云SCDN基于阿里云飛天平臺(tái)的計(jì)算能力，使用深度學(xué)習(xí)的算法，可以快速地產(chǎn)生安全

2018-01-05 14:45:29

STM32F4和TMSF2812哪個(gè)浮點(diǎn)數(shù)運(yùn)算能力更強(qiáng)？

STM32F4和TMSF2812哪個(gè)浮點(diǎn)數(shù)運(yùn)算能力更強(qiáng)

2023-10-15 11:28:05

WCDMA的關(guān)鍵技術(shù)是什么？

更大的系統(tǒng)容量，更優(yōu)的話音質(zhì)量，更高的頻譜效率，更快的數(shù)據(jù)速率，更強(qiáng)的抗衰落能力，更好的抗多徑性，適應(yīng)高達(dá)500km/h的移動(dòng)速度。

2019-10-18 09:00:05

【戰(zhàn)疫專題】第六期：突破口罩+護(hù)目鏡挑戰(zhàn)，多模態(tài)生物識(shí)別技術(shù)成趨勢

2020年，新型冠狀病毒席卷了整個(gè)中國，同時(shí)也在促進(jìn)著產(chǎn)業(yè)的變革與生活變化。電子發(fā)燒友在此期間推出【戰(zhàn)疫專題】活動(dòng)，持續(xù)為大家分享每期不同主題的相關(guān)資料。本期主題：突破口罩+護(hù)目鏡挑戰(zhàn)，多模態(tài)

2020-03-25 10:37:16

三招提高手機(jī)人臉識(shí)別的安全性

如此不安全？小七認(rèn)為，這最根本的原因是人臉識(shí)別技術(shù)至今仍未成熟。硬件水平低、識(shí)別能力差，導(dǎo)致消費(fèi)者要么直接不用，要么在一個(gè)絕對(duì)安全的環(huán)境下使用。久而久之，人臉識(shí)別技術(shù)的移動(dòng)端應(yīng)用被忽視，久而久之

2018-08-22 16:22:25

如何利用信號(hào)調(diào)節(jié)器的抗混淆濾波器來實(shí)現(xiàn)混合信號(hào)多模態(tài)傳感器調(diào)節(jié)

2020-04-22 06:35:34

如何讓邊緣計(jì)算更安全？

邊緣計(jì)算中的安全挑戰(zhàn)如何讓邊緣計(jì)算更安全？可擴(kuò)展的邊緣安全方案

2021-02-26 06:36:45

實(shí)現(xiàn)更強(qiáng)大IoT設(shè)備安全性的步驟

本文將討論實(shí)現(xiàn)更強(qiáng)大IoT設(shè)備安全性的步驟，并解釋嵌入式安全性背后的不同概念，以及如何針對(duì)嵌入式設(shè)備安全性實(shí)施一致且包羅萬象的方法。發(fā)現(xiàn)設(shè)備漏洞

2021-02-22 06:26:20

小米機(jī)器狗二代來了，比上一代更瘦、更快、更強(qiáng)！NVIDIA主控+全志MR813+全志R329協(xié)處理器

識(shí)別，AIoT 聯(lián)動(dòng)，融合跟隨避障。還包含 12 個(gè) CyberGear 微電機(jī)，AI 自研平衡動(dòng)態(tài)算法，AI 多模態(tài)融合感知決策系統(tǒng)。 CyberDog2不僅保留了NVIDIA主控+全志MR813協(xié)

2023-09-06 09:39:54

手機(jī)語音識(shí)別應(yīng)用中DSP該怎么選擇？

　　隨著DSP技術(shù)的進(jìn)步，計(jì)算能力更強(qiáng)、功耗更低和體積更小的DSP已經(jīng)出現(xiàn)，使3G手機(jī)上植入更精確更復(fù)雜的自動(dòng)語音識(shí)別(ASR)功能成為可能。目前，基本ASR應(yīng)用可以分成三大類：1. 語音-文本轉(zhuǎn)換(語音輸入)；2. 講者識(shí)別；3. 語音命令控制(語音控制)。　

2019-09-02 07:03:35

未來已來，多傳感器融合感知是自動(dòng)駕駛破局的關(guān)鍵

駕駛的關(guān)鍵的是具備人類的感知能力，多傳感器融合感知正是自動(dòng)駕駛破局的關(guān)鍵。昱感微的雷視一體多傳感器融合方案就好像一雙比人眼更敏銳的眼睛，可以為自動(dòng)駕駛系統(tǒng)提供更豐富更精準(zhǔn)的視覺語言——目標(biāo)與環(huán)境的多

2024-04-11 10:26:51

松靈新品丨全球首款多模態(tài)?ROS開發(fā)平臺(tái)LIMO來了，將聯(lián)合古月居打造精品課程精選資料分享

多地形通過性和多場景的適應(yīng)性一直是無人駕駛、機(jī)器人等場景化所需要突破的難題。通過多模態(tài)運(yùn)動(dòng)融合，提高跨維度運(yùn)動(dòng)的柔性適應(yīng)能力是一種理想的解決方式，這決定了機(jī)器人和移動(dòng)平臺(tái)未來應(yīng)用場景開拓的深度和廣度

2021-08-30 08:39:33

米爾RK3576部署端側(cè)多模態(tài)多輪對(duì)話,6TOPS算力驅(qū)動(dòng)30億參數(shù)LLM

配合，三者各司其職、無縫銜接，共同構(gòu)建起完整的多模態(tài)對(duì)話能力。多輪對(duì)話系統(tǒng)架構(gòu) 1. 圖像視覺編碼器（Vision Encoder）模型選擇：采用

2025-09-05 17:25:10

芯源半導(dǎo)體安全芯片技術(shù)原理

（橢圓曲線加密算法）等。與軟件加密相比，硬件加密引擎具有加密速度快、抗攻擊能力強(qiáng)的特點(diǎn)，能夠快速對(duì)數(shù)據(jù)進(jìn)行加密和解密操作，保障數(shù)據(jù)在存儲(chǔ)和傳輸過程中的機(jī)密性。? 安全存儲(chǔ)區(qū)域：芯片內(nèi)部設(shè)有獨(dú)立的安全存儲(chǔ)

2025-11-13 07:29:27

生物特征識(shí)別的關(guān)鍵技術(shù)與安全性思考

簡要的介紹生物特征識(shí)別系統(tǒng)的工作模式,闡述多模態(tài)生物特征識(shí)別系統(tǒng)的模型和各種數(shù)據(jù)融合技術(shù),分析了生物識(shí)別系統(tǒng)被易于攻擊的環(huán)節(jié)，提出了一種綜合提高系統(tǒng)安全性能的

2009-08-31 09:43:28

系統(tǒng)抗攻擊能力評(píng)估技術(shù)研究

本文從評(píng)估系統(tǒng)抗攻擊能力的角度來研究系統(tǒng)的安全性問題，本文從選取影響抗攻擊能力的指標(biāo)入手，借助網(wǎng)絡(luò)熵差法，構(gòu)建了抗攻擊能力評(píng)

2009-09-05 10:57:45

SVM與歸一化方法結(jié)合的人臉和指紋融合識(shí)別

基于歸一化的融合識(shí)別方法與基于分類器的融合識(shí)別方法是多模態(tài)生物特征識(shí)別中的兩類基本匹配層融合識(shí)別方法。前者把來自不同的生物特征識(shí)別系統(tǒng)的匹配打分轉(zhuǎn)化到可以比

2009-12-16 12:48:24

基于自適應(yīng)并行結(jié)構(gòu)的多模態(tài)生物特征識(shí)別

傳統(tǒng)多模態(tài)生物特征識(shí)別方法當(dāng)出現(xiàn)生物特征缺失時(shí)，識(shí)別性能會(huì)明顯下降。針對(duì)此問題，提出一種融合人臉、虹膜和掌紋的自適應(yīng)并行結(jié)構(gòu)多模態(tài)生物識(shí)別方法。該方法在設(shè)計(jì)融合策

2012-11-09 16:12:19

lABCIWQmultyWindows多模態(tài)窗口2010

lABCIWQmultyWindows多模態(tài)窗口2010。

2016-05-17 17:47:59

撓性航天器LMI抗飽和控制及模態(tài)振動(dòng)抑制

撓性航天器LMI抗飽和控制及模態(tài)振動(dòng)抑制_劉金琨

2017-01-07 18:12:51

基于多特征融合的跌倒行為識(shí)別與研究_彭玉青

基于多特征融合的跌倒行為識(shí)別與研究_彭玉青

2017-01-08 11:13:29

體驗(yàn)MiniCPM-V 2.6 多模態(tài)能力

多模態(tài)組網(wǎng)

jf_23871869發(fā)布于 2025-01-20 13:40:48

自適應(yīng)并行結(jié)構(gòu)的多模態(tài)生物特征識(shí)別

自適應(yīng)并行結(jié)構(gòu)的多模態(tài)生物特征識(shí)別

2017-10-16 11:06:04

卷積神經(jīng)網(wǎng)絡(luò)的振動(dòng)信號(hào)模態(tài)參數(shù)識(shí)別

針對(duì)現(xiàn)有的時(shí)域模態(tài)參數(shù)識(shí)別方法大多存在難定階和抗噪性差的問題，提出一種無監(jiān)督學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)（CNN）的振動(dòng)信號(hào)模態(tài)識(shí)別方法。該算法在卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上進(jìn)行改進(jìn)。首先，將應(yīng)用于二維圖像處理的卷積

2017-12-05 14:39:13

多文化場景下的多模態(tài)情感識(shí)別

學(xué)習(xí)的特征，并通過多模態(tài)融合方法結(jié)合不同的模態(tài)。比較不同單模態(tài)特征和多模態(tài)特征融合的情感識(shí)別性能．我們?cè)贑HEAVD中文多模態(tài)情感數(shù)據(jù)集和AFEW英文多模態(tài)情感數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)，通過跨文化情感識(shí)別研究，我們驗(yàn)證了文化因素

2017-12-18 14:47:31

多模態(tài)生物特征識(shí)別系統(tǒng)框架

針對(duì)多模態(tài)生物特征識(shí)別系統(tǒng)并行融合模式中使用方便性和使用效率方面的問題，在現(xiàn)有序列化多模態(tài)生物特征識(shí)別系統(tǒng)的基礎(chǔ)上，提出了一種結(jié)合并行融合和序列化融合的多生物特征識(shí)別系統(tǒng)框架。框架中首先采用步態(tài)

2018-01-02 18:47:31

基于超圖的多模態(tài)關(guān)聯(lián)特征處理方法

傳統(tǒng)的模式識(shí)別方法認(rèn)為特征是相互獨(dú)立的，容易忽略多模態(tài)特征之間多元的關(guān)聯(lián)性，從而造成識(shí)別的誤差。為此，基于超圖模型，提出一種新的特征整合方法。定義共享熵的計(jì)算方法用以表示多個(gè)特征之間的關(guān)聯(lián)程度，以

2018-03-07 11:01:41

康佳發(fā)布了全新的AI人臉識(shí)別電視主打數(shù)據(jù)精準(zhǔn)分析與多模態(tài)識(shí)別系統(tǒng)

近日，康佳發(fā)布了全新的AI人臉識(shí)別電視，主打數(shù)據(jù)精準(zhǔn)分析與多模態(tài)識(shí)別系統(tǒng)。相關(guān)產(chǎn)品可以結(jié)合人臉識(shí)別的個(gè)人ID以及性別、年齡等屬性，可以為用戶提供個(gè)性化的內(nèi)容推送和更加便利的操控體驗(yàn)。

2019-01-02 10:14:54

1640

蘋果解決無人車安全新專利,專為夜間自動(dòng)駕駛研發(fā)的多模態(tài)傳感系統(tǒng)

這是一個(gè)利用紅外線設(shè)備解決自動(dòng)駕駛夜間識(shí)別率低問題的多模態(tài)傳感系統(tǒng)。

2019-07-06 11:41:27

3512

多模態(tài)生物識(shí)別成趨勢

多模態(tài)生物識(shí)別是指整合或融合兩種及兩種以上生物識(shí)別技術(shù)，利用其多重生物識(shí)別技術(shù)的獨(dú)特優(yōu)勢，并結(jié)合數(shù)據(jù)融合技術(shù)，使得認(rèn)證和識(shí)別過程更加精準(zhǔn)、安全。

2020-03-11 14:26:40

3880

多模態(tài)成AI行業(yè)發(fā)展新風(fēng)向新基建行業(yè)進(jìn)入快車道

近日，由螞蟻金服牽頭制定的“生物特征識(shí)別多模態(tài)融合國際標(biāo)準(zhǔn)”正式立項(xiàng)，這一標(biāo)準(zhǔn)的制定，對(duì)于多模態(tài)領(lǐng)域發(fā)展與技術(shù)規(guī)范產(chǎn)生了重大影響。

2020-03-31 11:46:47

3127

5G云端智能機(jī)器人擁有多模態(tài)AI能力

云端機(jī)器人由云端大腦、神經(jīng)網(wǎng)絡(luò)VBN和及機(jī)器人本體等組成。其中，云端大腦提供機(jī)器人所需要的智能視覺、智能聽覺、智能運(yùn)動(dòng)等多模態(tài)AI能力，通過遍布全球的移動(dòng)通信安全高速網(wǎng)絡(luò)，將能力傳輸給遠(yuǎn)端的機(jī)器人控制器和各種機(jī)器人、智能設(shè)備本體上。

2020-07-01 09:50:46

3618

生物識(shí)別技術(shù)的多模態(tài)融合方式成為了發(fā)展趨勢之一

國內(nèi)市場方面，中國在生物特征識(shí)別領(lǐng)域技術(shù)已處于世界先進(jìn)水平，2016 年世界人臉識(shí)別的最高準(zhǔn)確率 99.5%即由我國團(tuán)隊(duì)創(chuàng)造。技術(shù)的不斷突破、應(yīng)用場景的持續(xù)擴(kuò)容，國內(nèi)的生物特征識(shí)別市場未來有較大的發(fā)展空間。

2020-07-16 08:50:03

1854

多模態(tài)生物識(shí)別系統(tǒng)的原理及局限性

隨著技術(shù)的發(fā)展，使用生物識(shí)別技術(shù)實(shí)施安全個(gè)人識(shí)別協(xié)議的挑戰(zhàn)正在增加，并且在世界上幾乎每個(gè)市場中對(duì)于準(zhǔn)確的人類識(shí)別的需求都比以往更高。生物識(shí)別管理市場的并行發(fā)展已經(jīng)確定，用于識(shí)別目的的單個(gè)硬件模態(tài)的使用可能不再是許多行業(yè)的最明智的選擇，那多模態(tài)生物識(shí)別系統(tǒng)有哪些優(yōu)勢？

2020-10-09 15:30:39

3707

一文解析多模態(tài)生物識(shí)別技術(shù)的安全性

多模態(tài)生物特征識(shí)別是指在識(shí)別系統(tǒng)中使用兩種或更多種生物特征的組合，例如，結(jié)合人臉識(shí)別和虹膜識(shí)別的系統(tǒng)可以被認(rèn)為是多模態(tài)生物識(shí)別系統(tǒng)，那多模態(tài)生物識(shí)別技術(shù)安全嗎？

2020-10-13 09:45:56

1243

指紋、人臉識(shí)別是最好的生物識(shí)別嗎？多模態(tài)多傳感器融合是生物識(shí)別的未來

應(yīng)用場景使用過人臉識(shí)別，根據(jù)調(diào)查，90%的人都使用過相關(guān)技術(shù)，雖然便利性很高，但是人臉識(shí)別的安全問題從技術(shù)誕生到現(xiàn)在一直都存在質(zhì)疑，不僅僅是人臉識(shí)別，包括指紋識(shí)別、語音識(shí)別、虹膜識(shí)別以及靜脈識(shí)別等生物識(shí)別技術(shù)一直以來都是AI領(lǐng)域所

2020-11-05 14:22:33

2573

多模態(tài)生物識(shí)別技術(shù)有何優(yōu)勢?

在當(dāng)今信息化時(shí)代，如何準(zhǔn)確鑒定一個(gè)人的身份、保護(hù)信息安全，已成為引起社會(huì)各界人士普遍關(guān)注的熱點(diǎn)話題。傳統(tǒng)的身份認(rèn)證由于容易偽造和丟失，越來越難以滿足實(shí)際需求，目前較為便捷與安全的解決方案無疑就是生物識(shí)別技術(shù)。

2020-12-09 14:09:31

2926

指紋識(shí)別與刷臉識(shí)別誰更安全?

現(xiàn)如今手機(jī)中的密碼已經(jīng)被指紋、刷臉或虹膜識(shí)別的方式代替了，很重要的一個(gè)原因就是這些識(shí)別方式更快、更方便；至于說哪個(gè)更為安全呢？先不要下結(jié)論，一起來看看就一目了然了。虹膜識(shí)別主要用于三星手機(jī)，而指紋與刷臉的應(yīng)用較為廣泛，因此今天就來著重分析一下指紋與刷臉識(shí)別。

2020-12-21 14:30:32

5322

多模態(tài)中NLP與CV融合的方式有哪些？

test 看文本部分在其中起到的作用為0... ( ) ? 現(xiàn)在看來還是wide and deep這種方式太粗暴了（對(duì)于復(fù)雜信息的融合），本文寫寫多模態(tài)掃盲基礎(chǔ)和最近大家精巧的一些圖像文本融合的模型設(shè)計(jì)，主要是在VQA（視覺問答）領(lǐng)域，也有一個(gè)多模態(tài)QA，因?yàn)樵谕扑]領(lǐng)域，你

2020-12-31 10:12:37

5828

人臉識(shí)別和指紋驗(yàn)證哪個(gè)更安全

“人臉識(shí)別”和“指紋驗(yàn)證”哪個(gè)更安全？80%的人可能都搞錯(cuò)了！

2021-01-25 09:04:17

7454

人臉識(shí)別和指紋解鎖哪種方式更安全?

現(xiàn)如今，手機(jī)的解鎖方式主要是以指紋和面部識(shí)別來解鎖屏幕的，但這兩種解鎖方式并不僅僅存在于手機(jī)解鎖，手機(jī)支付中也經(jīng)常用到它倆，這不僅僅為我們的生活帶來了便利，也會(huì)讓我們不禁思考，這兩種解鎖方式哪種更安全呢？

2021-01-26 11:06:45

12037

Transformer模型的多模態(tài)學(xué)習(xí)應(yīng)用

隨著Transformer在視覺中的崛起，Transformer在多模態(tài)中應(yīng)用也是合情合理的事情，甚至以后可能會(huì)有更多的類似的paper。

2021-03-25 09:29:59

11785

如何在多模態(tài)的語境中利用Transformer強(qiáng)大的表達(dá)能力？

NLPer在跨界上忙活的不亦樂乎，提取視覺特征后和文本詞向量一同輸入到萬能的Transformer中，加大力度預(yù)訓(xùn)練，總有意想不到的SOTA。如何在多模態(tài)的語境中更細(xì)致準(zhǔn)確地利用Transformer

2021-03-29 16:47:03

4418

基于層次注意力機(jī)制的多模態(tài)圍堵情感識(shí)別模型

在連續(xù)維度情感識(shí)別任務(wù)中，每個(gè)模態(tài)內(nèi)部凸顯情感表達(dá)的部分并不相同，不同模態(tài)對(duì)于情感狀態(tài)的影響程度也有差別。為此，通過學(xué)習(xí)各個(gè)模態(tài)特征并采用合理的融合方式，提出一種基于層次注意力機(jī)制的多模態(tài)維度情感

2021-04-01 11:20:51

基于雙殘差超密集網(wǎng)絡(luò)的多模態(tài)醫(yī)學(xué)圖像融合方法

Networks， DRHDNS）的多模態(tài)醫(yī)學(xué)圖像融合方法。 DRHDNS分為特征提取和特征融合兩部分。特征提取部分通過將超密集連接與殘差學(xué)習(xí)相結(jié)合，構(gòu)造出雙殘差超密集塊，用于提取特征，其中超密集連接不僅發(fā)生在同一路徑的層之間，還發(fā)生在不同路徑的層之間，這種連接使特征提取更充分，細(xì)節(jié)

2021-04-14 11:18:30

利用應(yīng)變模態(tài)差識(shí)別彎管內(nèi)部損傷的研究

為研究利用應(yīng)變模態(tài)差識(shí)別彎管內(nèi)部損傷的方法，以損傷前、后的應(yīng)變模態(tài)差作為彎管損傷識(shí)別的損傷指標(biāo)對(duì)其展開研究。首先，基于位移模態(tài)和應(yīng)變模態(tài)的模態(tài)疊加特性和正交性推導(dǎo)了應(yīng)變模態(tài)差公式;其次，利用有限元

2021-04-15 15:25:36

融合多尺度HOG特征和語義屬性的合成素描人臉識(shí)別

，單純依賴局部細(xì)節(jié)特征識(shí)別率較低的問題，文中提出一種融合多尺度HOG特征并加以語義屬性約束的合成素描人臉識(shí)別的算法。首先提取出合成素描人臉的全局HoG特征以及五官等關(guān)鍵部位的局部HOG特征來表征人臉的整體結(jié)構(gòu)特征和細(xì)節(jié)特

2021-04-21 11:32:32

基于聯(lián)合壓縮感知的多模態(tài)目標(biāo)統(tǒng)一跟蹤方法

針對(duì)多模態(tài)目標(biāo)跟蹤中大多僅考慮單個(gè)圖像的異種特征融合或不同模態(tài)圖像的同種特征融合，為了使得這兩者間能自然集成，提出基于聯(lián)合壓縮感知的多模態(tài)目標(biāo)統(tǒng)一跟蹤方法。通過將多模態(tài)跟蹤問題轉(zhuǎn)化為多重2-范數(shù)

2021-04-27 15:59:29

基于注意力神經(jīng)網(wǎng)絡(luò)的多模態(tài)情感分析方法

情感。對(duì)這些海量多模態(tài)數(shù)據(jù)的情感進(jìn)行分析有助于更妤地理解人們的態(tài)度和觀點(diǎn)，具有廣泛的應(yīng)用場景。為了解決多模態(tài)情感分類任務(wù)中的信息冗余的問題，在張量融合方案的基礎(chǔ)上，提出了一種基于注意力神經(jīng)網(wǎng)絡(luò)的多模態(tài)情感分

2021-04-28 14:41:41

可提高跨模態(tài)行人重識(shí)別算法精度的特征學(xué)習(xí)框架

化的問題，設(shè)計(jì)了模態(tài)間三元組損失及模態(tài)內(nèi)三元組損失，以配合全局三元組損失進(jìn)行模型訓(xùn)練。在改進(jìn)困難三元組損失的基礎(chǔ)上，首次在跨模態(tài)行人重識(shí)別模型中設(shè)計(jì)屬性特征來提高模型的特征提取能力。最后，針對(duì)跨模態(tài)行亼重

2021-05-10 11:06:14

多模態(tài)MR和多特征融合的GBM自動(dòng)分割算法

多模態(tài)MR和多特征融合的GBM自動(dòng)分割算法

2021-06-27 11:45:54

簡述文本與圖像領(lǐng)域的多模態(tài)學(xué)習(xí)有關(guān)問題

來自：哈工大SCIR 本期導(dǎo)讀：近年來研究人員在計(jì)算機(jī)視覺和自然語言處理方向均取得了很大進(jìn)展，因此融合了二者的多模態(tài)深度學(xué)習(xí)也越來越受到關(guān)注。本期主要討論結(jié)合文本和圖像的多模態(tài)任務(wù)，將從多模態(tài)預(yù)訓(xùn)練

2021-08-26 16:29:52

7520

如何使用多模態(tài)信息做prompt

Multimodal Conditionality for Natural Language Generation 研究的任務(wù)場景則是以多模態(tài)信息作為條件做 conditional 的 NLG任務(wù)。這種任務(wù)設(shè)置有

2021-11-03 09:39:18

2418

多模態(tài)生物識(shí)別龍頭熵基科技發(fā)布消費(fèi)級(jí)屏下指紋技術(shù)

近日，多模態(tài)生物識(shí)別領(lǐng)域的龍頭企業(yè)熵基科技股份有限公司（以下簡稱：熵基科技），正式發(fā)布了旗下新一代指紋識(shí)別技術(shù)——屏下指紋識(shí)別技術(shù)。相比傳統(tǒng)指紋識(shí)別技術(shù)，該技術(shù)在識(shí)別過程中可以最大程度上避免環(huán)境光

2022-09-28 13:41:05

1069

面向社交媒體的多模態(tài)屬性級(jí)情感分析

另一方面，相比于單一的文本數(shù)據(jù)，多模態(tài)數(shù)據(jù)包含了多種不同信息，這些信息之間往往一一對(duì)應(yīng)、互為補(bǔ)充，如何對(duì)齊不同模態(tài)的內(nèi)容并提出有效的多模態(tài)融合機(jī)制是一個(gè)十分棘手的問題。

2022-10-19 10:10:11

3025

基于多模態(tài)智慧感知決策的S230芯片

提到多模態(tài)融合感知，我們難免會(huì)覺得有些困惑 “模態(tài)”，可理解為“感官” 多模態(tài)即將多種感官融合不夠直觀？那今天我們就以一道競猜題開場請(qǐng)根據(jù)以下線索猜猜這是什么物品？

2022-11-03 11:59:06

1058

中文多模態(tài)對(duì)話數(shù)據(jù)集

隨著大量預(yù)訓(xùn)練語言模型在文本對(duì)話任務(wù)中的出色表現(xiàn)，以及多模態(tài)的發(fā)展，在對(duì)話中引入多模態(tài)信息已經(jīng)引起了大量學(xué)者的關(guān)注。目前已經(jīng)提出了各種各樣的多模態(tài)對(duì)話數(shù)據(jù)集，主要來自電影、電視劇、社交媒體平臺(tái)等

2023-02-22 11:03:01

2185

MAE再發(fā)力，跨模態(tài)交互式自編碼器PiMAE席卷3D目標(biāo)檢測領(lǐng)域

MAE以其簡單的實(shí)現(xiàn)方式、強(qiáng)大的視覺表示能力，可以在很多基礎(chǔ)視覺任務(wù)中展現(xiàn)出良好的性能。但是目前的工作大多是在單一視覺模態(tài)中進(jìn)行，那MAE在多模態(tài)數(shù)據(jù)融合方面表現(xiàn)如何呢？本文

2023-04-21 09:36:52

2294

ImageBind：跨模態(tài)之王，將6種模態(tài)全部綁定！

最近，很多方法學(xué)習(xí)與文本、音頻等對(duì)齊的圖像特征。這些方法使用單對(duì)模態(tài)或者最多幾種視覺模態(tài)。最終嵌入僅限于用于訓(xùn)練的模態(tài)對(duì)。因此，視頻 - 音頻嵌入無法直接用于圖像 - 文本任務(wù)，反之亦然。學(xué)習(xí)真正的聯(lián)合嵌入面臨的一個(gè)主要障礙是缺乏所有模態(tài)融合在一起的大量多模態(tài)數(shù)據(jù)。

2023-05-11 09:30:44

1973

如何利用LLM做多模態(tài)任務(wù)？

大型語言模型LLM（Large Language Model）具有很強(qiáng)的通用知識(shí)理解以及較強(qiáng)的邏輯推理能力，但其只能處理文本數(shù)據(jù)。雖然已經(jīng)發(fā)布的GPT4具備圖片理解能力，但目前還未開放多模態(tài)輸入接口并且不會(huì)透露任何模型上技術(shù)細(xì)節(jié)。因此，現(xiàn)階段，如何利用LLM做一些多模態(tài)任務(wù)還是有一定的研究價(jià)值的。

2023-05-11 17:09:16

1571

邱錫鵬團(tuán)隊(duì)提出具有內(nèi)生跨模態(tài)能力的SpeechGPT，為多模態(tài)LLM指明方向

大型語言模型（LLM）在各種自然語言處理任務(wù)上表現(xiàn)出驚人的能力。與此同時(shí)，多模態(tài)大型語言模型，如 GPT-4、PALM-E 和 LLaVA，已經(jīng)探索了 LLM 理解多模態(tài)信息的能力。然而，當(dāng)前

2023-05-22 14:38:06

1333

VisCPM：邁向多語言多模態(tài)大模型時(shí)代

隨著 GPT-4 和 Stable Diffusion 等模型多模態(tài)能力的突飛猛進(jìn)，多模態(tài)大模型已經(jīng)成為大模型邁向通用人工智能（AGI）目標(biāo)的下一個(gè)前沿焦點(diǎn)?？傮w而言，面向圖像和文本的多模態(tài)生成能力

2023-07-10 10:05:01

1255

更強(qiáng)更通用：智源「悟道3.0」Emu多模態(tài)大模型開源，在多模態(tài)序列中「補(bǔ)全一切」

熱度。Flamingo 具備強(qiáng)大的多模態(tài)上下文少樣本學(xué)習(xí)能力。 Flamingo 走的技術(shù)路線是將大語言模型與一個(gè)預(yù)訓(xùn)練視覺編碼器結(jié)合，并插入可學(xué)習(xí)的層來捕捉跨模態(tài)依賴，其采用圖文對(duì)、圖文交錯(cuò)文檔、視頻文本對(duì)組成的多模態(tài)數(shù)據(jù)訓(xùn)練，在少樣本上下文學(xué)習(xí)方面表現(xiàn)出強(qiáng)大能力。

2023-07-16 20:45:02

1370

UniVL-DR: 多模態(tài)稠密向量檢索模型

for Multi-Modal Retrieval 背景介紹盡管當(dāng)前主流搜索引擎主要面向文本數(shù)據(jù)，然而多媒體內(nèi)容的增長一直是互聯(lián)網(wǎng)上最顯著趨勢之一，各種研究表明用戶更喜歡搜索結(jié)果中出現(xiàn)生動(dòng)的多模態(tài)內(nèi)容。因而，針對(duì)于多

2023-08-06 22:00:03

1797

基于Transformer多模態(tài)先導(dǎo)性工作

多模態(tài)（Multimodality）是指在信息處理、傳遞和表達(dá)中涉及多種不同的感知模態(tài)或信息來源。這些感知模態(tài)可以包括語言、視覺、聽覺、觸覺等，它們共同作用來傳遞更豐富、更全面的信息。在多模態(tài)系統(tǒng)中

2023-08-21 09:49:52

1519

中科大&字節(jié)提出UniDoc：統(tǒng)一的面向文字場景的多模態(tài)大模型

如上圖所示，UniDoc基于預(yù)訓(xùn)練的視覺大模型及大語言模型，將文字的檢測、識(shí)別、spotting(圖中未畫出)、多模態(tài)理解等四個(gè)任務(wù)，通過多模態(tài)指令微調(diào)的方式，統(tǒng)一到一個(gè)框架中。具體地，輸入一張圖像以及一條指令（可以是檢測、識(shí)別、spotting、語義理解）

2023-08-31 15:29:19

2395

DreamLLM：多功能多模態(tài)大型語言模型，你的DreamLLM~

由于固有的模態(tài)缺口，如CLIP語義主要關(guān)注模態(tài)共享信息，往往忽略了可以增強(qiáng)多模態(tài)理解的模態(tài)特定知識(shí)。因此，這些研究并沒有充分認(rèn)識(shí)到多模式創(chuàng)造和理解之間潛在的學(xué)習(xí)協(xié)同作用，只顯示出創(chuàng)造力的微小提高，并且在多模式理解方面仍然存在不足。

2023-09-25 17:26:43

1532

多模態(tài)大模型最全綜述來了！

其中最后一個(gè)表示監(jiān)督信號(hào)是從圖像本身中挖掘出來的，流行的方法包括對(duì)比學(xué)習(xí)、非對(duì)比學(xué)習(xí)和masked image建模。在這些方法之外，文章也進(jìn)一步討論了多模態(tài)融合、區(qū)域級(jí)和像素級(jí)圖像理解等類別的預(yù)訓(xùn)練方法。

2023-09-26 16:42:17

3525

基于視覺的多模態(tài)觸覺感知系統(tǒng)

傳統(tǒng)的多模態(tài)/多任務(wù)觸覺感知系統(tǒng)通過集成多種傳感單元來達(dá)到多模態(tài)觸覺信息的解耦，但其往往導(dǎo)致系統(tǒng)結(jié)構(gòu)的復(fù)雜性，以及需要應(yīng)對(duì)來自不同刺激間的干擾。

2023-10-18 11:24:48

2013

探究編輯多模態(tài)大語言模型的可行性

不同于單模態(tài)模型編輯，多模態(tài)模型編輯需要考慮更多的模態(tài)信息。文章出發(fā)點(diǎn)依然從單模態(tài)模型編輯入手，將單模態(tài)模型編輯拓展到多模態(tài)模型編輯，主要從以下三個(gè)方面：可靠性（Reliability），穩(wěn)定性（Locality）和泛化性（Generality）。

2023-11-09 14:53:22

1018

大模型+多模態(tài)的3種實(shí)現(xiàn)方法

我們知道，預(yù)訓(xùn)練LLM已經(jīng)取得了諸多驚人的成就，然而其明顯的劣勢是不支持其他模態(tài)（包括圖像、語音、視頻模態(tài)）的輸入和輸出，那么如何在預(yù)訓(xùn)練LLM的基礎(chǔ)上引入跨模態(tài)的信息，讓其變得更強(qiáng)大、更通用呢？本節(jié)將介紹“大模型+多模態(tài)”的3種實(shí)現(xiàn)方法。

2023-12-13 13:55:04

3110

人工智能領(lǐng)域多模態(tài)的概念和應(yīng)用場景

隨著人工智能技術(shù)的不斷發(fā)展，多模態(tài)成為了一個(gè)備受關(guān)注的研究方向。多模態(tài)技術(shù)旨在將不同類型的數(shù)據(jù)和信息進(jìn)行融合，以實(shí)現(xiàn)更加準(zhǔn)確、高效的人工智能應(yīng)用。本文將詳細(xì)介紹多模態(tài)的概念、研究內(nèi)容和應(yīng)用場景，并探討人工智能領(lǐng)域多模態(tài)的未來發(fā)展趨勢。

2023-12-15 14:28:44

13429

從Google多模態(tài)大模型看后續(xù)大模型應(yīng)該具備哪些能力

前段時(shí)間Google推出Gemini多模態(tài)大模型，展示了不凡的對(duì)話能力和多模態(tài)能力，其表現(xiàn)究竟如何呢？

2023-12-28 11:19:52

2300

自動(dòng)駕駛和多模態(tài)大語言模型的發(fā)展歷程

多模態(tài)大語言模型(MLLM) 最近引起了廣泛的關(guān)注，其將 LLM 的推理能力與圖像、視頻和音頻數(shù)據(jù)相結(jié)合，通過多模態(tài)對(duì)齊使它們能夠更高效地執(zhí)行各種任務(wù)，包括圖像分類、將文本與相應(yīng)的視頻對(duì)齊以及語音檢測。

2023-12-28 11:45:21

1381

李未可科技正式推出WAKE-AI多模態(tài)AI大模型

文本生成、語言理解、圖像識(shí)別及視頻生成等多模態(tài)交互能力。 ? 該大模型圍繞 GPS 軌跡+視覺+語音打造新一代 LLM-Based的自然交互，同時(shí)多模態(tài)問答技術(shù)的加持，能實(shí)現(xiàn)所見即所問、所問即所得的精準(zhǔn)服務(wù)。此外，融合了人類意圖理解、長期記憶機(jī)制、情感大模型及TTS 克

2024-04-18 17:01:29

1092

商湯科技發(fā)布5.0多模態(tài)大模型，綜合能力全面對(duì)標(biāo)GPT-4 Turbo

商湯科技發(fā)布5.0多模態(tài)大模型，綜合能力全面對(duì)標(biāo)GPT-4 Turbo 4月23日，商湯科技董事長兼CEO徐立在2024商湯技術(shù)交流日上發(fā)布了行業(yè)首個(gè)云、端、邊全棧大模型產(chǎn)品矩陣，能夠滿足不同規(guī)模

2024-04-24 16:49:55

1827

阿里云通義大模型助力“小愛同學(xué)”強(qiáng)化多模態(tài)AI生成能力

小米的人工智能助手“小愛同學(xué)”近期與阿里云通義大模型達(dá)成戰(zhàn)略合作，共同提升其多模態(tài)AI生成能力，特別是在圖片生成與理解方面。這次合作不僅將強(qiáng)化“小愛同學(xué)”的功能，還將在小米的多個(gè)產(chǎn)品線，包括小米汽車和手機(jī)等設(shè)備上得到實(shí)際應(yīng)用。

2024-05-13 09:19:08

1897

云知聲山海多模態(tài)大模型UniGPT-mMed登頂MMMU測評(píng)榜首

近日，多模態(tài)人工智能模型基準(zhǔn)評(píng)測集MMMU更新榜單，云知聲山海多模態(tài)大模型UniGPT-mMed以通用能力、醫(yī)療專業(yè)能力雙雙排名第一的優(yōu)異成績登頂榜首，力壓GPT-4V，充分彰顯其硬核實(shí)力。

2024-10-12 14:09:10

1080

利用OpenVINO部署Qwen2多模態(tài)模型

多模態(tài)大模型的核心思想是將不同媒體數(shù)據(jù)（如文本、圖像、音頻和視頻等）進(jìn)行融合，通過學(xué)習(xí)不同模態(tài)之間的關(guān)聯(lián)，實(shí)現(xiàn)更加智能化的信息處理。簡單來說，多模態(tài)大模型可以可以理解多種不同模態(tài)的輸入數(shù)據(jù)，并輸出相應(yīng)反饋結(jié)果，例如圖像理解，語音識(shí)別，視覺問題等。

2024-10-18 09:39:38

2713

超聲界“內(nèi)卷終結(jié)者”！ZRT智銳通提供全新引擎打造多模態(tài)影像融合系統(tǒng)

多模態(tài)影像融合超聲系統(tǒng)的市場規(guī)模也在不斷擴(kuò)大，國內(nèi)眾多超聲系統(tǒng)廠家也在不斷尋找合適的硬件平臺(tái)，用以承載旗下的多模態(tài)影像融合超聲系統(tǒng)。

2024-11-11 10:52:22

1653

一文理解多模態(tài)大語言模型——下

/understanding-multimodal-llms ? 《一文理解多模態(tài)大語言模型 - 上》介紹了什么是多模態(tài)大語言模型，以及構(gòu)建多模態(tài) LLM 有兩種主要方式之一：統(tǒng)一嵌入解碼器架構(gòu)(Unified Embedding Decoder Architecture)。本

2024-12-03 15:18:04

1110

商湯日日新多模態(tài)大模型權(quán)威評(píng)測第一

剛剛，商湯科技日日新SenseNova多模態(tài)大模型，在權(quán)威綜合評(píng)測權(quán)威平臺(tái)OpenCompass的多模態(tài)評(píng)測中取得榜單第一。

2024-12-20 10:39:31

1574

商湯科技推出“日日新”融合大模型

剛剛，商湯正式推出“日日新”融合大模型，領(lǐng)先實(shí)現(xiàn)原生融合模態(tài)，深度推理能力與多模態(tài)信息處理能力均大幅提升，并在兩大權(quán)威評(píng)測榜單奪得第一，成為“雙冠王”。

2025-01-10 15:59:31

1503

?？低暟l(fā)布多模態(tài)大模型文搜存儲(chǔ)系列產(chǎn)品

多模態(tài)大模型為安防行業(yè)帶來重大技術(shù)革新，基于觀瀾大模型技術(shù)體系，?？低晫⒋髤?shù)量、大樣本量的圖文多模態(tài)大模型與嵌入式智能硬件深度融合，發(fā)布多模態(tài)大模型文搜存儲(chǔ)系列產(chǎn)品——文搜NVR、文搜CVR。

2025-02-18 10:33:56

1126

?多模態(tài)交互技術(shù)解析

多模態(tài)交互多模態(tài)交互（ Multimodal Interaction ）是指通過多種感官通道（如視覺、聽覺、觸覺等）或多種交互方式（如語音、手勢、觸控、眼動(dòng)等）與計(jì)算機(jī)系統(tǒng)進(jìn)行自然、協(xié)同的信息交互

2025-03-17 15:12:44

3955

商湯“日日新”融合大模型登頂大語言與多模態(tài)雙榜單

據(jù)弗若斯特沙利文(Frost & Sullivan, 簡稱“沙利文”)聯(lián)合頭豹研究院發(fā)布的《2025年中國大模型年度評(píng)測》結(jié)果顯示：在語言和多模態(tài)核心能力測評(píng)中，商湯“日日新”融合大模型斬獲國內(nèi)第一梯隊(duì)成績。

2025-03-18 10:35:04

1028

移遠(yuǎn)通信智能模組全面接入多模態(tài)AI大模型，重塑智能交互新體驗(yàn)

隨著千行百業(yè)數(shù)智化進(jìn)程的不斷加速，多模態(tài)AI大模型的應(yīng)用需求不斷攀升，圖像、語音、視頻等多樣化的交互方式正逐漸成為推動(dòng)行業(yè)變革的新動(dòng)力。3月20日，全球物聯(lián)網(wǎng)整體解決方案供應(yīng)商移遠(yuǎn)通信宣布，其全系

2025-03-20 19:03:54

707

移遠(yuǎn)通信智能模組全面接入多模態(tài)AI大模型，重塑智能交互新體驗(yàn)

全系智能模組產(chǎn)品已全面接入火山引擎豆包VLM（視覺語言）多模態(tài)AI大模型。這一突破性進(jìn)展表明，搭載移遠(yuǎn)任意智能模組的終端設(shè)備，均可無縫融合多模態(tài)AI大模型的強(qiáng)大功能，為用戶帶來更智能、便捷、人性化的產(chǎn)品體驗(yàn)。 ? ? ? 一鍵接入

2025-03-21 14:12:14

457

?？低暟l(fā)布多模態(tài)大模型AI融合巡檢超腦

基于海康觀瀾大模型技術(shù)體系，?？低曂瞥鲂乱淮?b class="flag-6" style="color: red">多模態(tài)大模型AI融合巡檢超腦，全面升級(jí)人、車、行為、事件等算法，為行業(yè)帶來全新的多模態(tài)大模型巡檢體驗(yàn)，以更準(zhǔn)確、更高效的智慧巡檢，為各行各業(yè)的安全運(yùn)行和發(fā)展保駕護(hù)航。

2025-04-17 17:12:21

1438

XMOS為普及AI應(yīng)用推出基于軟件定義SoC的多模態(tài)AI傳感器融合接口

多模態(tài)傳感信號(hào)AI處理為智算中心和邊緣智能開啟感知智能的新篇章

2025-05-12 17:51:54

431

商湯日日新SenseNova融合模態(tài)大模型國內(nèi)首家獲得最高評(píng)級(jí)的大模型

近日，中國信息通信研究院（以下簡稱“中國信通院”）完成可信AI多模態(tài)大模型首輪評(píng)估。商湯日日新SenseNova融合模態(tài)大模型在所有模型中，獲得當(dāng)前最高評(píng)級(jí)——4+級(jí)，并成為國內(nèi)首家獲得最高評(píng)級(jí)

2025-06-11 11:57:47

1248

多模態(tài)+空間智能：盾華以AI+智慧路燈桿，點(diǎn)亮城市治理新方式

多模態(tài)+空間智能：盾華以AI+智慧路燈桿，點(diǎn)亮城市治理新方式

2025-06-12 10:17:08

475

NVIDIA助力圖靈新訊美推出企業(yè)級(jí)多模態(tài)視覺大模型融合解決方案

中國推出企業(yè)級(jí)多模態(tài)視覺大模型融合解決方案，推動(dòng)先進(jìn) AI 模型在交通治理、工業(yè)質(zhì)檢、金融風(fēng)控等領(lǐng)域?qū)崿F(xiàn)高效識(shí)別、精準(zhǔn)預(yù)警和穩(wěn)定交付。

2025-06-26 09:17:31

1138

研華科技攜手創(chuàng)新奇智推出多模態(tài)大模型AI一體機(jī)

這是一款基于研華高性能邊緣計(jì)算平臺(tái)MIC-733，深度集成創(chuàng)新奇智視覺小模型與多模態(tài)大模型的邊緣智能終端，通過創(chuàng)新的“視覺識(shí)別 + 深度語義理解”融合分析路徑，具備強(qiáng)大的本地視頻智能分析及大模型深度研判能力。

2025-07-17 17:14:01

839

已全部加載完成

91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲日韩欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

搜索歷史

多模態(tài)融合的識(shí)別方式更安全抗偽造能力更強(qiáng)

評(píng)論

搜索歷史

多模態(tài)融合的識(shí)別方式更安全 抗偽造能力更強(qiáng)

評(píng)論

多模態(tài)融合的識(shí)別方式更安全抗偽造能力更強(qiáng)