91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用自然語(yǔ)言語(yǔ)音指令創(chuàng)建 XR 體驗(yàn):Project Mellon 應(yīng)用測(cè)試

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:未知 ? 2023-04-08 00:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Project Mellon 是一個(gè)輕量級(jí)的 Python 軟件包,能夠利用強(qiáng)大的語(yǔ)音 AI(NVIDIA Riva)和大型語(yǔ)言模型(LLMs)(NVIDIA NeMo 服務(wù)),簡(jiǎn)化沉浸式環(huán)境中的用戶交互。NVIDIA 在 GTC 2023 上宣布,Project Mellon 現(xiàn)已支持開(kāi)發(fā)者進(jìn)行測(cè)試?;诖?,開(kāi)發(fā)者可開(kāi)始探索如何創(chuàng)建由自然語(yǔ)言語(yǔ)音指令控制的、解放雙手的擴(kuò)展現(xiàn)實(shí)(XR)體驗(yàn)。

正如 J·R·R·托爾金(J.R.R.Tolkien)在《都林之門(mén)(Doors of Durin)》中的謎語(yǔ)—“請(qǐng)說(shuō),朋友,而后進(jìn)入”所示,文字可以移山倒海。Project Mellon 背后蘊(yùn)含著一個(gè)基本理念,即以更實(shí)用有效的方式來(lái)利用語(yǔ)音 AI 和 LLM 之力打開(kāi)虛擬世界的大門(mén),并在其中完成更多的事情。

在 XR 中,用戶界面可能非常復(fù)雜且難以使用,會(huì)破壞虛擬、混合和增強(qiáng)現(xiàn)實(shí)的本質(zhì)—即沉浸式體驗(yàn)的自然感。Project Mellon 可賦能多類應(yīng)用程序(無(wú)論是 XR 還是平板生態(tài))開(kāi)發(fā)者,輕松地將自然語(yǔ)言理解作為以人為本且可解放雙手的新型用戶界面,添加至其開(kāi)發(fā)的軟件之中。

Project Mellon 平臺(tái)包含以下組成部分:

  • Project Mellon SDK(軟件開(kāi)發(fā)套件)

  • NVIDIA Riva(ASR 、TTS 、NMT)

  • NeMo 服務(wù)(其他 LLM 也可獲取支持)

Project Mellon 1.0 發(fā)布的主要功能包括:

  • 輕量且易于集成的 Python 庫(kù)

  • 保持自然語(yǔ)言理解準(zhǔn)確性的 LLM

  • 無(wú)需特定指令進(jìn)行訓(xùn)練的零樣本語(yǔ)言模型

  • 具有對(duì)話和視覺(jué)上下文的自然語(yǔ)言指令支持

  • 支持詢問(wèn)有關(guān)指令和情境的問(wèn)題,并提供自然語(yǔ)言回答

  • 用于理解和執(zhí)行指令的簡(jiǎn)單 Python API

  • 基于 Web 的測(cè)試應(yīng)用程序

  • 可以在本地或遠(yuǎn)程托管 ASR、TTS、LLM 和神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯(NMT),以實(shí)現(xiàn)低延遲響應(yīng)

ESI 集團(tuán)解決方案和技術(shù)專家 Jan Wurster 在 GTC 主題演講—“在虛擬現(xiàn)實(shí)中與 AI 協(xié)作:沉浸式數(shù)字助手(會(huì)議代碼:[S51355])中表示:“我們發(fā)現(xiàn),通過(guò)集成對(duì)話式 AI 與 NVIDIA Project Mellon,可以降低使用 XR 展開(kāi)協(xié)作的技術(shù)門(mén)檻,并為 IC.IDO Weave 用戶提供更加人性化的體驗(yàn)。通過(guò)輸入自然語(yǔ)音,我們的虛擬 AI 助手可以幫助團(tuán)隊(duì)完成復(fù)核任務(wù)、查詢可用情況或發(fā)現(xiàn)相關(guān)問(wèn)題,這些功能無(wú)需記住特定指令、僅需輸入自然語(yǔ)言就可使用?!?/p>

(2023 年 4 月 10 日前登錄 GTC 官網(wǎng),即可觀看演講回放,了解其團(tuán)隊(duì)如何在動(dòng)態(tài)、協(xié)作的 XR 環(huán)境中,在使用對(duì)話式 AI 的過(guò)程中受益)

Project Mellon 現(xiàn)已可供開(kāi)發(fā)人員使用。觀看 Project Mellon 相關(guān)演示,了解如何利用自然語(yǔ)音指令,驅(qū)動(dòng)設(shè)計(jì)審查、更改實(shí)時(shí)配置、控制機(jī)器人以及操縱相機(jī)和場(chǎng)景元素。

了解如何啟用 Project Mellon 進(jìn)行開(kāi)發(fā)

人工智能正在改變?nèi)祟惻c工作及工具進(jìn)行交互的方式。開(kāi)發(fā)人員可以通過(guò)語(yǔ)音 AI 和 Project Mellon,簡(jiǎn)化并提升用戶體驗(yàn)的人性化水平,且不再需要培訓(xùn)用戶操作虛擬現(xiàn)實(shí)(VR)中的每一項(xiàng)功能。用戶可以在虛擬現(xiàn)實(shí)應(yīng)用程序中,用自己的語(yǔ)言來(lái)控制 XR 體驗(yàn)。

點(diǎn)擊“閱讀原文”,申請(qǐng)?jiān)囉?Project Mellon。

0f42f7e0-d561-11ed-bfe3-dac502259ad0.png ?

掃描海報(bào)二維碼,即可觀看 NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛 GTC23 主題演講重播!

0f48be1e-d561-11ed-bfe3-dac502259ad0.jpg


原文標(biāo)題:使用自然語(yǔ)言語(yǔ)音指令創(chuàng)建 XR 體驗(yàn):Project Mellon 應(yīng)用測(cè)試

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4086

    瀏覽量

    99169

原文標(biāo)題:使用自然語(yǔ)言語(yǔ)音指令創(chuàng)建 XR 體驗(yàn):Project Mellon 應(yīng)用測(cè)試

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    自然語(yǔ)言處理NLP的概念和工作原理

    自然語(yǔ)言處理 (NLP) 是人工智能 (AI) 的一個(gè)分支,它會(huì)教計(jì)算機(jī)如何理解口頭和書(shū)面形式的人類語(yǔ)言。自然語(yǔ)言處理將計(jì)算語(yǔ)言學(xué)與機(jī)器學(xué)習(xí)和深度學(xué)習(xí)相結(jié)合來(lái)處理
    的頭像 發(fā)表于 01-29 14:01 ?357次閱讀
    <b class='flag-5'>自然語(yǔ)言</b>處理NLP的概念和工作原理

    語(yǔ)音識(shí)別IC分類,語(yǔ)音識(shí)別芯片的工作原理

    語(yǔ)音識(shí)別芯片,也叫語(yǔ)音識(shí)別集成電路,是一種集聲音存儲(chǔ)、播放、錄音及語(yǔ)音識(shí)別功能于一體的專用芯片。語(yǔ)音識(shí)別IC的核心功能在于實(shí)現(xiàn)語(yǔ)音識(shí)別,即讓
    的頭像 發(fā)表于 01-14 15:22 ?238次閱讀
    <b class='flag-5'>語(yǔ)音</b>識(shí)別IC分類,<b class='flag-5'>語(yǔ)音</b>識(shí)別芯片的工作原理

    谷歌XR生態(tài)加速落地:Galaxy XR上線月入60+應(yīng)用,Project Aura明年發(fā)售

    了其在XR領(lǐng)域的最新進(jìn)展,包括Galaxy XR功能的更新、Project Aura的更新、AI智能眼鏡的更新,以及為開(kāi)發(fā)者帶來(lái)的Android XR SDK。 ? ? ?
    的頭像 發(fā)表于 12-11 10:18 ?1.3w次閱讀
    谷歌<b class='flag-5'>XR</b>生態(tài)加速落地:Galaxy <b class='flag-5'>XR</b>上線月入60+應(yīng)用,<b class='flag-5'>Project</b> Aura明年發(fā)售

    智能語(yǔ)音識(shí)別控制器是什么?圖形中文編程,多路設(shè)備控制

    智能語(yǔ)音識(shí)別控制器是一種融合語(yǔ)音識(shí)別技術(shù)、物聯(lián)網(wǎng)通信技術(shù)與設(shè)備控制模塊的智能終端設(shè)備,核心功能是將人類自然語(yǔ)言指令轉(zhuǎn)化為設(shè)備可執(zhí)行的電信號(hào),實(shí)現(xiàn)對(duì)各類終端設(shè)備的
    的頭像 發(fā)表于 12-03 16:35 ?680次閱讀

    AI人工智能語(yǔ)音識(shí)別控制模塊:自定義命令詞,全維度落地應(yīng)用場(chǎng)景

    AI人工智能語(yǔ)音識(shí)別控制模塊是一種集成了語(yǔ)音識(shí)別、自然語(yǔ)言處理和智能控制功能的電子設(shè)備或系統(tǒng)。用戶通過(guò)語(yǔ)音指令來(lái)操作、管理或控制其他設(shè)備、系統(tǒng)或應(yīng)用,無(wú)需物理接觸或傳統(tǒng)交互界面(如按鈕
    的頭像 發(fā)表于 12-03 16:34 ?950次閱讀

    云知聲論文入選自然語(yǔ)言處理頂會(huì)EMNLP 2025

    近日,自然語(yǔ)言處理(NLP)領(lǐng)域國(guó)際權(quán)威會(huì)議 ——2025 年計(jì)算語(yǔ)言學(xué)與自然語(yǔ)言處理國(guó)際會(huì)議(EMNLP 2025)公布論文錄用結(jié)果,云知聲提交的《面向門(mén)診病歷生成的高質(zhì)量醫(yī)患對(duì)話合成技術(shù)
    的頭像 發(fā)表于 11-10 17:30 ?800次閱讀
    云知聲論文入選<b class='flag-5'>自然語(yǔ)言</b>處理頂會(huì)EMNLP 2025

    什么是語(yǔ)音芯片串口AT指令?實(shí)現(xiàn)智能語(yǔ)音交互的核心技術(shù)詳解

    一、語(yǔ)音芯片串口AT指令的基本概念在現(xiàn)代智能電子產(chǎn)品中,語(yǔ)音芯片已成為實(shí)現(xiàn)人機(jī)交互的關(guān)鍵組件。作為語(yǔ)音IC廠家與設(shè)備開(kāi)發(fā)者之間的通信橋梁,串口通訊協(xié)議標(biāo)準(zhǔn)(AT)
    的頭像 發(fā)表于 11-10 12:53 ?440次閱讀
    什么是<b class='flag-5'>語(yǔ)音</b>芯片串口AT<b class='flag-5'>指令</b>?實(shí)現(xiàn)智能<b class='flag-5'>語(yǔ)音</b>交互的核心技術(shù)詳解

    如何使用語(yǔ)音指令控制串口輸出

    在上兩篇文章中, 我們實(shí)現(xiàn)了GPIO輸出, 和PWM輸出(組件介紹在前文中已經(jīng)介紹過(guò) ),在本章節(jié)我們將繼續(xù)進(jìn)行使用語(yǔ)音指令控制串口輸出。
    的頭像 發(fā)表于 09-25 15:47 ?2102次閱讀
    如何使用<b class='flag-5'>語(yǔ)音指令</b>控制串口輸出

    HarmonyOSAI編程自然語(yǔ)言代碼生成

    安裝CodeGenie后,在下方對(duì)話框內(nèi),輸入代碼需求描述,將根據(jù)描述智能生成代碼,生成內(nèi)容可一鍵復(fù)制或一鍵插入至編輯區(qū)當(dāng)前光標(biāo)位置。 提問(wèn)示例 使用ArkTs語(yǔ)言寫(xiě)一段代碼,在頁(yè)面中間部分
    發(fā)表于 09-05 16:58

    【HZ-T536開(kāi)發(fā)板免費(fèi)體驗(yàn)】5- 無(wú)需死記 Linux 命令!用 CangjieMagic 在 HZ-T536 開(kāi)發(fā)板上搭建 MCP 服務(wù)器,自然語(yǔ)言輕松控板

    )進(jìn)行調(diào)試或控制,不僅門(mén)檻高,還容易記錯(cuò)命令。 解決方案 :MCP(Machine Control Protocol)服務(wù)器可將自然語(yǔ)言指令轉(zhuǎn)換為底層操作,結(jié)合 Cangjie Magic 的自然語(yǔ)言
    發(fā)表于 08-23 13:10

    UTP測(cè)試系統(tǒng)如何對(duì)智能家居進(jìn)行自動(dòng)化測(cè)試

    設(shè)計(jì),確保用戶在無(wú)網(wǎng)絡(luò)或特殊場(chǎng)景下仍能直接、可靠地完成基礎(chǔ)操作,兼顧穩(wěn)定性與易用性。 ?智能語(yǔ)音控制兼容主流智能音箱(如天貓精靈、小愛(ài)同學(xué)、小美音箱、ROKI先生等),用戶可通過(guò)自然語(yǔ)言指令遠(yuǎn)程操控設(shè)備,大幅提升交互便捷性
    的頭像 發(fā)表于 07-03 10:44 ?960次閱讀
    UTP<b class='flag-5'>測(cè)試</b>系統(tǒng)如何對(duì)智能家居進(jìn)行自動(dòng)化<b class='flag-5'>測(cè)試</b>

    語(yǔ)音控制模塊工作原理

    ,才能夠發(fā)出正確的指令。 語(yǔ)音芯片控制模塊是實(shí)現(xiàn) “語(yǔ)音指令 - 設(shè)備響應(yīng)” 的核心組件,其工作原理可拆解為信號(hào)采集、處理、識(shí)別及指令執(zhí)行的完整鏈路,下面將以WTK69000為例給大家
    的頭像 發(fā)表于 06-17 11:49 ?1366次閱讀
    <b class='flag-5'>語(yǔ)音</b>控制模塊工作原理

    智能座艙:車(chē)載語(yǔ)音交互測(cè)試內(nèi)容

    隨著汽車(chē)智能化的飛速發(fā)展,車(chē)載語(yǔ)音交互系統(tǒng)已從早期的輔助功能逐漸演變?yōu)橹悄茏摰暮诵慕换シ绞街?。駕駛者通過(guò)語(yǔ)音指令即可輕松完成導(dǎo)航設(shè)置、音樂(lè)播放、電話撥打,甚至車(chē)輛部分功能的控制,這種便捷性不僅
    的頭像 發(fā)表于 04-24 15:29 ?2163次閱讀
    智能座艙:車(chē)載<b class='flag-5'>語(yǔ)音</b>交互<b class='flag-5'>測(cè)試</b>內(nèi)容

    自然語(yǔ)言提示原型在英特爾Vision大會(huì)上首次亮相

    在英特爾Vision大會(huì)上,Network Optix首次展示了自然語(yǔ)言提示原型,該方案將重新定義視頻管理,為各行各業(yè)由AI驅(qū)動(dòng)的洞察和效率提速。
    的頭像 發(fā)表于 04-09 09:30 ?959次閱讀

    零知開(kāi)源——ESP32語(yǔ)音交互系統(tǒng)(AI小智)開(kāi)發(fā)教程

    小智AI聊天機(jī)器人是一個(gè)基于嵌入式硬件與人工智能技術(shù)深度融合的智能交互系統(tǒng)。該項(xiàng)目以ESP32開(kāi)發(fā)板為核心,結(jié)合語(yǔ)音喚醒、自然語(yǔ)言處理、音頻解碼播放及圖形化交互界面四大核心模塊,實(shí)現(xiàn)人機(jī)交互功能
    的頭像 發(fā)表于 03-29 15:33 ?1.2w次閱讀
    零知開(kāi)源——ESP32<b class='flag-5'>語(yǔ)音</b>交互系統(tǒng)(AI小智)開(kāi)發(fā)教程