日前,加州大學(xué)的研究人員攜手英偉達(dá),共同推出了一款創(chuàng)新的視覺(jué)語(yǔ)言模型——NaVILA。該模型在機(jī)器人導(dǎo)航領(lǐng)域展現(xiàn)出了獨(dú)特的應(yīng)用潛力,為智能機(jī)器人的自主導(dǎo)航提供了一種全新的解決方案。
視覺(jué)語(yǔ)言模型(VLM)是一種具備多模態(tài)生成能力的先進(jìn)AI模型。它能夠智能地處理文本、圖像以及視頻等多種提示,并通過(guò)復(fù)雜的推理過(guò)程,實(shí)現(xiàn)對(duì)這些信息的準(zhǔn)確理解和應(yīng)用。NaVILA正是基于這一原理,通過(guò)將大型語(yǔ)言模型(LLM)與視覺(jué)編碼器進(jìn)行巧妙的結(jié)合,從而賦予了LLM“視覺(jué)感知”的神奇能力。
這一創(chuàng)新性的結(jié)合,使得NaVILA在機(jī)器人導(dǎo)航領(lǐng)域展現(xiàn)出了卓越的性能。它能夠根據(jù)環(huán)境中的視覺(jué)信息,結(jié)合文本指令或描述,為機(jī)器人提供精確的定位和導(dǎo)航服務(wù)。這一特性不僅提高了機(jī)器人的自主性和智能化水平,還為機(jī)器人在復(fù)雜環(huán)境中的應(yīng)用提供了更加廣闊的空間。
NaVILA的發(fā)布,標(biāo)志著視覺(jué)語(yǔ)言模型在機(jī)器人導(dǎo)航領(lǐng)域取得了重要的突破。未來(lái),隨著技術(shù)的不斷發(fā)展和完善,相信NaVILA將在更多領(lǐng)域展現(xiàn)出其獨(dú)特的價(jià)值和潛力,為人工智能技術(shù)的發(fā)展和應(yīng)用貢獻(xiàn)更多的力量。
-
機(jī)器人
+關(guān)注
關(guān)注
213文章
31092瀏覽量
222354 -
語(yǔ)言模型
+關(guān)注
關(guān)注
0文章
571瀏覽量
11322 -
英偉達(dá)
+關(guān)注
關(guān)注
23文章
4087瀏覽量
99229
發(fā)布評(píng)論請(qǐng)先 登錄
沐曦股份聯(lián)合清華大學(xué)發(fā)布磁性材料AI原子基座模型
美對(duì)華芯片出口“松綁”:英偉達(dá)H200獲準(zhǔn)進(jìn)入中國(guó)市場(chǎng)#AI芯片#英偉達(dá)#H200芯片
黃仁勛:未來(lái)十年很多汽車是自動(dòng)駕駛 英偉達(dá)發(fā)布Alpamayo汽車大模型平臺(tái)
英偉達(dá)發(fā)布專注于自動(dòng)駕駛的視覺(jué)語(yǔ)言動(dòng)作模型
今日看點(diǎn):象帝先推出首款量產(chǎn)Imagination DXD GPU顯卡;小米汽車?yán)塾?jì)交付突破 50 萬(wàn)臺(tái)
華為聯(lián)合發(fā)布園區(qū)自智網(wǎng)絡(luò)技術(shù)白皮書
英偉達(dá)發(fā)布 NVQLink 開(kāi)放系統(tǒng)架構(gòu);國(guó)內(nèi)首個(gè)汽車芯片標(biāo)準(zhǔn)驗(yàn)證平臺(tái)投入使用
天合儲(chǔ)能聯(lián)合發(fā)布大規(guī)模儲(chǔ)能技術(shù)應(yīng)用及產(chǎn)業(yè)發(fā)展白皮書
中科創(chuàng)達(dá)與吉利汽車、NVIDIA聯(lián)合發(fā)布創(chuàng)新產(chǎn)品AIBOX
英偉達(dá):CUDA 已經(jīng)開(kāi)始移植到 RISC-V 架構(gòu)上
特朗普要叫停英偉達(dá)對(duì)華特供版 英偉達(dá)H20出口限制 或損失55億美元
英偉達(dá)Cosmos-Reason1 模型深度解讀
英偉達(dá)GROOT N1 全球首個(gè)開(kāi)源人形機(jī)器人基礎(chǔ)模型
?VLM(視覺(jué)語(yǔ)言模型)?詳細(xì)解析
NaVILA:加州大學(xué)與英偉達(dá)聯(lián)合發(fā)布新型視覺(jué)語(yǔ)言模型
評(píng)論