91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA Riva用于AI應(yīng)用程序的GPU加速SDK

星星科技指導(dǎo)員 ? 來(lái)源:NVIDIA ? 作者:NVIDIA ? 2022-04-02 10:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

語(yǔ)音人工智能用于各種應(yīng)用,包括授權(quán)人工智能的呼叫中心、虛擬助理的語(yǔ)音接口以及視頻會(huì)議中的實(shí)時(shí)字幕。語(yǔ)音人工智能包括自動(dòng)語(yǔ)音識(shí)別( ASR )和文本語(yǔ)音轉(zhuǎn)換( TTS )。 ASR 管道接收原始音頻并將其轉(zhuǎn)換為文本, TTS 管道接收文本并將其轉(zhuǎn)換為音頻。

開(kāi)發(fā)和運(yùn)行這些實(shí)時(shí)語(yǔ)音人工智能服務(wù)是一項(xiàng)復(fù)雜而艱巨的任務(wù)。構(gòu)建語(yǔ)音 AI 應(yīng)用程序需要數(shù)十萬(wàn)小時(shí)的音頻數(shù)據(jù)、基于特定用例構(gòu)建和自定義模型的工具,以及可擴(kuò)展的部署支持。它還意味著實(shí)時(shí)運(yùn)行,與用戶進(jìn)行自然交互的時(shí)間遠(yuǎn)低于 300 毫秒。 NVIDIA Riva 簡(jiǎn)化了開(kāi)發(fā)語(yǔ)音 AI 服務(wù)的端到端流程,并為類人交互提供實(shí)時(shí)性能。

Riva SDK

NVIDIA Riva 是用于開(kāi)發(fā)語(yǔ)音 AI 應(yīng)用程序的 GPU 加速 SDK 。 Riva 旨在幫助您輕松快速地訪問(wèn)對(duì)話 AI 功能。只需幾個(gè)命令,您就可以通過(guò) API 操作訪問(wèn)高性能服務(wù)并嘗試演示。

Diagram shows workflow starting from pretrained models in NGC, TAO toolkit for retraining the models and Riva for optimized speech AI skills to generate high-performance inference.

圖 1 . Riva 構(gòu)建語(yǔ)音應(yīng)用程序的工作流

Riva SDK 包括 pretrained speech and language models 、 NVIDIA TAO Toolkit ,用于在自定義數(shù)據(jù)集上微調(diào)這些模型,以及用于語(yǔ)音識(shí)別、語(yǔ)言理解和語(yǔ)音合成的優(yōu)化端到端技能。

使用 Riva ,您可以輕松地對(duì)數(shù)據(jù)上的最新模型進(jìn)行微調(diào),以更深入地了解其特定上下文。優(yōu)化推理以提供運(yùn)行時(shí)間為 150 毫秒( ms )的實(shí)時(shí)服務(wù),而在 CPU 純平臺(tái)上需要 25 秒。

特定于任務(wù)的 AI 服務(wù)和 gRPC 端點(diǎn)提供現(xiàn)成的高性能 ASR 、 NLP 和 TTS 。所有這些人工智能服務(wù)都經(jīng)過(guò)數(shù)千小時(shí)的公共和內(nèi)部數(shù)據(jù)集培訓(xùn),以達(dá)到高精度。您可以開(kāi)始使用預(yù)訓(xùn)練的模型,或者使用自己的數(shù)據(jù)集對(duì)其進(jìn)行微調(diào),以進(jìn)一步提高模型性能。

Riva 使用 NVIDIA Triton Inference Server 為多個(gè)模型提供服務(wù),以實(shí)現(xiàn)高效、穩(wěn)健的資源分配,并在高吞吐量、低延遲和高精度方面實(shí)現(xiàn)高性能。

Riva 技能概述

Riva 為實(shí)時(shí)轉(zhuǎn)錄和虛擬助理等用例提供高度優(yōu)化的語(yǔ)音識(shí)別和語(yǔ)音合成服務(wù)。語(yǔ)音識(shí)別技能在各種真實(shí)世界、特定領(lǐng)域的數(shù)據(jù)集上進(jìn)行培訓(xùn)和評(píng)估。它包括來(lái)自電信、播客和醫(yī)療保健的詞匯,以在生產(chǎn)用例中提供世界級(jí)的準(zhǔn)確性。

與 NVIDIA V100 GPU 上的 Tacotron 2 和 WaveGlow 模型相比, Riva 文本到語(yǔ)音或語(yǔ)音合成技能可生成類似人類的語(yǔ)音,并使用非自回歸模型在 NVIDIA A100 GPU 上提供 12 倍的性能。此外,該服務(wù)使您能夠?yàn)槊總€(gè)品牌和虛擬助理創(chuàng)建一個(gè)自然定制的聲音,每天 30 分鐘的演員數(shù)據(jù)。

Diagram shows capabilities in Riva Speech Recognition and Speech Synthesis services such as support for both batch and streaming mode, multiple sampling rates (8,16,22,32, 44, 48 kHz), and models such as Jasper, QuartzNet, CitriNet, Tacotron2, WaveGlow, Fastpitch, and HiFiGAN.

圖 2 . Riva 服務(wù)能力

為了充分利用 GPU 的計(jì)算能力, Riva 基于 NVIDIA Triton 推理服務(wù)器,為神經(jīng)網(wǎng)絡(luò)和集成管道提供服務(wù),以便與 NVIDIA TensorRT 高效運(yùn)行。

Riva 服務(wù)通過(guò) gRPC 端點(diǎn)可訪問(wèn)的 API 操作公開(kāi),這些操作隱藏了所有復(fù)雜性。圖 3 顯示了系統(tǒng)的服務(wù)器端。 gRPC API 操作由運(yùn)行在 Docker 容器中的 API 服務(wù)器公開(kāi)。他們負(fù)責(zé)處理所有語(yǔ)音和 NLP 傳入和傳出數(shù)據(jù)。

Diagram shows the Riva client applications such as desktop, mobile, and laptop interactions with Riva speech recognition and speech synthesis pipelines.

圖 3 . Riva 服務(wù)管線

API 服務(wù)器向 NVIDIA Triton 發(fā)送推斷請(qǐng)求并接收結(jié)果。

NVIDIA Triton 是后端服務(wù)器,可同時(shí)處理多個(gè) GPU 上的多個(gè)神經(jīng)網(wǎng)絡(luò)或集成管道的多個(gè)推理請(qǐng)求。

對(duì)于會(huì)話 AI 應(yīng)用程序,將延遲保持在給定閾值以下至關(guān)重要。這種延遲要求轉(zhuǎn)化為推斷請(qǐng)求一到達(dá)就執(zhí)行。要使 GPU 飽和并提高性能,必須增加批大小并延遲推理執(zhí)行,直到收到更多請(qǐng)求并形成更大的批。

NVIDIA Triton 還負(fù)責(zé)在一個(gè)請(qǐng)求和另一個(gè)請(qǐng)求之間切換網(wǎng)絡(luò)的上下文。

Riva 可以通過(guò)從 NGC 下載適當(dāng)?shù)哪P秃腿萜鞯暮?jiǎn)單腳本直接安裝在裸機(jī)上,也可以通過(guò) Helm chart 將其部署在 Kubernetes 上。

下面簡(jiǎn)要介紹一下如何與 Python 交互。 Riva 接口通過(guò)簡(jiǎn)單的 Python API 操作,使客戶端與 Riva 服務(wù)器的通信更加容易。例如,下面介紹如何通過(guò)三個(gè)步驟創(chuàng)建對(duì)現(xiàn)有 TTS Riva 服務(wù)的請(qǐng)求。

首先,導(dǎo)入 Riva API :

import src.riva_proto.riva_tts_pb2 as rtts
import src.riva_proto.riva_tts_pb2_grpc as rtts_srv
import src.riva_proto.riva_audio_pb2 as ri

接下來(lái),創(chuàng)建到 Riva 端點(diǎn)的 gRPC 通道:

channel = grpc.insecure_channel('localhost:50051')
riva_tts = rtts_srv.RivaSpeechSynthesisStub(channel)

然后,創(chuàng)建一個(gè) TTS 請(qǐng)求:

req = rtts.SynthesizeSpeechRequest()
req.text = "We know what we are, but not what we may be?"
req.language_code = "en-US" req.encoding = ri.AudioEncoding.LINEAR_PCM req.sample_rate_hz = 22050 req.voice_name = "ljspeech" resp = riva_tts.Synthesize(req)
audio_samples = np.frombuffer(resp.audio, dtype=np.float32)

使用數(shù)據(jù)自定義模型

使用 NVIDIA TAO Toolkit ,您可以在 Riva 中使用定制的訓(xùn)練模型(圖 4 )。 NVIDIA TAO Toolkit 是一種無(wú)編碼工具,用于在特定于域的數(shù)據(jù)集上微調(diào)模型。

圖 4 。 NVIDIA TAO 工具包管道

例如,要進(jìn)一步提高 ASR 轉(zhuǎn)錄文本的易讀性和準(zhǔn)確性,請(qǐng)向 ASR 系統(tǒng)添加自定義標(biāo)點(diǎn)符號(hào)和大小寫模型,以生成沒(méi)有這些特征的文本。

從預(yù)訓(xùn)練的 BERT 模型開(kāi)始,第一步是準(zhǔn)備數(shù)據(jù)集。對(duì)于培訓(xùn)數(shù)據(jù)集中的每個(gè)單詞,目標(biāo)是預(yù)測(cè)以下內(nèi)容:

單詞后面的標(biāo)點(diǎn)符號(hào)。

這個(gè)詞是否應(yīng)該大寫。

數(shù)據(jù)集準(zhǔn)備就緒后,下一步是通過(guò)運(yùn)行先前提供的腳本進(jìn)行培訓(xùn)。完成培訓(xùn)并達(dá)到所需的最終精度后,使用附帶的腳本為 NVIDIA Triton 創(chuàng)建模型存儲(chǔ)庫(kù)。

NVIDIA Riva Speech Skills 文檔包含有關(guān)如何訓(xùn)練或微調(diào)其他模型的更多詳細(xì)信息。這篇文章只展示了使用 TAO 工具包進(jìn)行定制的眾多可能性中的一種。

在 Riva 中部署模型

Riva 是為大規(guī)模對(duì)話 AI 而設(shè)計(jì)的。為了幫助您在不同的服務(wù)器上高效、可靠地為模型提供服務(wù), NVIDIA 使用 Helm 圖表提供了按鈕式模型部署(圖 5 )。

Diagram shows the workflow for deploying TAO model as a Riva skill and highlights the TensorRT optimizations and Triton Inference Server under the hood.

圖 5 。通過(guò)修改可用的舵圖,可以在 Riva 中部署模型

NGC catalog 中提供的舵圖配置可以針對(duì)自定義用例進(jìn)行修改。您可以更改與要部署的模型、存儲(chǔ)它們的位置以及如何公開(kāi)服務(wù)相關(guān)的設(shè)置。

結(jié)論

Riva 是 NVIDIA Developer Program 成員的公開(kāi)測(cè)試版。對(duì)于您的實(shí)時(shí)轉(zhuǎn)錄、虛擬助理或自定義語(yǔ)音實(shí)現(xiàn), Riva 將支持您的開(kāi)發(fā)。如果您正在大規(guī)模部署, Riva Enterprise 將為您大規(guī)模部署,并包括 AI 專家的支持。

關(guān)于作者

Davide Onofrio 是 NVIDIA 的高級(jí)深度學(xué)習(xí)軟件技術(shù)營(yíng)銷工程師。他在 NVIDIA 專注于深度學(xué)習(xí)技術(shù)開(kāi)發(fā)人員關(guān)注內(nèi)容的開(kāi)發(fā)和演示。戴維德在生物特征識(shí)別、虛擬現(xiàn)實(shí)和汽車行業(yè)擔(dān)任計(jì)算機(jī)視覺(jué)機(jī)器學(xué)習(xí)工程師已有多年經(jīng)驗(yàn)。他的教育背景包括米蘭理工學(xué)院的信號(hào)處理博士學(xué)位。

Vinh Nguyen 是一位深度學(xué)習(xí)的工程師和數(shù)據(jù)科學(xué)家,發(fā)表了 50 多篇科學(xué)文章,引文超過(guò) 2500 篇。在 NVIDIA ,他的工作涉及廣泛的深度學(xué)習(xí)和人工智能應(yīng)用,包括語(yǔ)音、語(yǔ)言和視覺(jué)處理以及推薦系統(tǒng)。

Siddharth Sharma 是NVIDIA 加速計(jì)算的高級(jí)技術(shù)營(yíng)銷經(jīng)理。在加入NVIDIA 之前, Siddharth 是 Mathworks Simulink 和 Stateflow 的產(chǎn)品營(yíng)銷經(jīng)理,與汽車和航空航天公司密切合作,采用基于模型的設(shè)計(jì)來(lái)創(chuàng)建控制軟件。

Alex Qi 是英偉達(dá) AI 軟件集團(tuán)的產(chǎn)品經(jīng)理。她的重點(diǎn)是對(duì)話 AI 框架( Riva )和多媒體流 AI / ML ( Maxine )的 AI 軟件和應(yīng)用程序。在加入 NVIDIA 之前,她在領(lǐng)導(dǎo)技術(shù)和工程組織中各種角色的具有挑戰(zhàn)性的技術(shù)項(xiàng)目方面擁有豐富的經(jīng)驗(yàn),如數(shù)據(jù)科學(xué)家、計(jì)算建模和設(shè)計(jì)工程。 Alex 擁有麻省理工學(xué)院的雙學(xué)位碩士學(xué)位:麻省理工學(xué)院斯隆管理學(xué)院的 MBA 學(xué)位,以及工程機(jī)械工程學(xué)院的理學(xué)碩士學(xué)位,她在該學(xué)院主要研究機(jī)器人技術(shù)和人工智能。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5614

    瀏覽量

    109864
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    14

    文章

    10274

    瀏覽量

    91564
  • 人工智能
    +關(guān)注

    關(guān)注

    1819

    文章

    50134

    瀏覽量

    265756
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA RTX PRO 5000 Blackwell GPU的深度評(píng)測(cè)

    NVIDIA RTX PRO 5000 Blackwell 是 NVIDIA RTX 5000 Ada Generation 的升級(jí)迭代產(chǎn)品,其各項(xiàng)核心指標(biāo)均針對(duì) GPU 加速工作流的
    的頭像 發(fā)表于 01-06 09:51 ?2657次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 Blackwell <b class='flag-5'>GPU</b>的深度評(píng)測(cè)

    利用NVIDIA Cosmos開(kāi)放世界基礎(chǔ)模型加速物理AI開(kāi)發(fā)

    NVIDIA 最近發(fā)布了 NVIDIA Cosmos 開(kāi)放世界基礎(chǔ)模型(WFM)的更新,旨在加速物理 AI 模型的測(cè)試與驗(yàn)證數(shù)據(jù)生成。借助 NVID
    的頭像 發(fā)表于 12-01 09:25 ?1186次閱讀

    NVIDIA RTX PRO 2000 Blackwell GPU性能測(cè)試

    越來(lái)越多的應(yīng)用正在使用 AI 加速,而無(wú)論工作站的大小或形態(tài)如何,都有越來(lái)越多的用戶需要 AI 性能。NVIDIA RTX PRO 2000 Blackwell 是全新
    的頭像 發(fā)表于 11-28 09:39 ?6449次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 2000 Blackwell <b class='flag-5'>GPU</b>性能測(cè)試

    NVIDIA Isaac Lab多GPU多節(jié)點(diǎn)訓(xùn)練指南

    NVIDIA Isaac Lab 是一個(gè)適用于機(jī)器人學(xué)習(xí)的開(kāi)源統(tǒng)一框架,基于 NVIDIA Isaac Sim 開(kāi)發(fā),其模塊化高保真仿真適用于各種訓(xùn)練環(huán)境,可提供各種物理
    的頭像 發(fā)表于 09-23 17:15 ?2449次閱讀
    <b class='flag-5'>NVIDIA</b> Isaac Lab多<b class='flag-5'>GPU</b>多節(jié)點(diǎn)訓(xùn)練指南

    NVIDIA桌面GPU系列擴(kuò)展新產(chǎn)品

    NVIDIA 桌面 GPU 系列擴(kuò)展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell
    的頭像 發(fā)表于 08-18 11:50 ?1466次閱讀

    NVIDIA Jetson + Isaac SDK 在人形機(jī)器人領(lǐng)域的方案詳解

    組件 描述 硬件平臺(tái)(Jetson系列) 面向邊緣AI和機(jī)器人開(kāi)發(fā)的SoC模塊,搭載GPU + ARM CPU,支持多種傳感器和AI模型部署 軟件平臺(tái)(Isaac SDK / Isa
    的頭像 發(fā)表于 07-30 16:05 ?3661次閱讀

    NVIDIA全棧加速代理式AI應(yīng)用落地

    在近期舉辦的 AWS 中國(guó)峰會(huì)上,NVIDIA 聚焦于“NVIDIA 全棧加速代理式 AI 應(yīng)用落地”,深入探討了代理式 AI (Agent
    的頭像 發(fā)表于 07-14 11:41 ?1342次閱讀

    NVIDIA計(jì)劃打造全球首個(gè)工業(yè)AI云平臺(tái)

    NVIDIA 宣布,其正在為歐洲制造商構(gòu)建全球首個(gè)工業(yè) AI 云。這家總部位于德國(guó)的 AI 工廠將配備 1 萬(wàn)個(gè) GPU,包括通過(guò) NVIDIA
    的頭像 發(fā)表于 06-16 14:17 ?1463次閱讀

    NVIDIA攜手諾和諾德借助AI加速藥物研發(fā)

    NVIDIA 宣布與諾和諾德開(kāi)展合作,借助創(chuàng)新 AI 應(yīng)用加速藥物研發(fā)。此次合作也將支持諾和諾德與丹麥 AI 創(chuàng)新中心 (DCAI) 關(guān)于使用 Gefion
    的頭像 發(fā)表于 06-12 15:49 ?1312次閱讀

    NVIDIA攜手微軟加速代理式AI發(fā)展

    代理式 AI 正在重新定義科學(xué)探索,推動(dòng)各行各業(yè)的研究突破和創(chuàng)新發(fā)展。NVIDIA 和微軟正通過(guò)深化合作提供先進(jìn)的技術(shù),從云到 PC 加速代理式 AI 應(yīng)用的發(fā)展。
    的頭像 發(fā)表于 05-27 14:03 ?1081次閱讀

    NVIDIA虛擬GPU 18.0版本的亮點(diǎn)

    NVIDIA 虛擬 GPU(vGPU)技術(shù)可在虛擬桌面基礎(chǔ)設(shè)施(VDI)中解鎖 AI 功能,使其比以往更加強(qiáng)大、用途更加廣泛。vGPU 通過(guò)為各種虛擬化環(huán)境中的 AI 驅(qū)動(dòng)工作負(fù)載提供
    的頭像 發(fā)表于 04-07 11:28 ?1471次閱讀

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI開(kāi)發(fā)

    NVIDIA GTC 推出新一代專業(yè)級(jí) GPUAI 賦能的開(kāi)發(fā)者工具—同時(shí),ChatRTX 更新現(xiàn)已支持 NVIDIA NIM,RTX Remix 正式結(jié)束測(cè)試階段,本月的
    的頭像 發(fā)表于 03-28 09:59 ?1325次閱讀

    英偉達(dá)GTC2025亮點(diǎn):Oracle與NVIDIA合作助力企業(yè)加速代理式AI推理

    Oracle 數(shù)據(jù)庫(kù)與 NVIDIA AI 相集成,使企業(yè)能夠更輕松、快捷地采用代理式 AI Oracle 和 NVIDIA 宣布,NVIDIA
    的頭像 發(fā)表于 03-21 12:01 ?1474次閱讀
    英偉達(dá)GTC2025亮點(diǎn):Oracle與<b class='flag-5'>NVIDIA</b>合作助力企業(yè)<b class='flag-5'>加速</b>代理式<b class='flag-5'>AI</b>推理

    英偉達(dá)GTC25亮點(diǎn):NVIDIA Dynamo開(kāi)源庫(kù)加速并擴(kuò)展AI推理模型

    Triton 推理服務(wù)器的后續(xù)產(chǎn)品,NVIDIA Dynamo 是一款全新的 AI 推理服務(wù)軟件,旨在為部署推理 AI 模型的 AI 工廠最大化其 token 收益。它協(xié)調(diào)并
    的頭像 發(fā)表于 03-20 15:03 ?1318次閱讀

    Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理

    ——Oracle 和 NVIDIA 今日宣布,NVIDIA 加速計(jì)算和推理軟件與 Oracle 的 AI 基礎(chǔ)設(shè)施以及生成式 AI 服務(wù)首
    發(fā)表于 03-19 15:24 ?586次閱讀
    Oracle 與 <b class='flag-5'>NVIDIA</b> 合作助力企業(yè)<b class='flag-5'>加速</b>代理式 <b class='flag-5'>AI</b> 推理