99在线播放免费成人,竹菊AV一区二区三区四区

每天，電信、金融和統(tǒng)一通信即服務（ UCaaS ）等行業(yè)都會產生數(shù)百萬分鐘的音頻。這些音頻會議記錄可以轉錄，以便為呼叫中心代理提供實時建議，從客戶呼叫記錄中提取見解，或在視頻會議中生成實時字幕。

Industries that commonly use AI include telco, financial services, healthcare, unified communication as a service, and retail.

圖 1 。人工智能在工業(yè)中的應用

自動語音識別使您能夠將語音轉錄成文本。生成高質量的文字記錄是一項挑戰(zhàn)，因為這些技能需要理解特定于行業(yè)的術語、數(shù)百到數(shù)千分鐘特定于領域的培訓音頻以及實時運行的管道。 NVIDIA Riva 語音識別是一項技術，可為跨行業(yè)的幾個常見用例提供世界級的實時準確度。

在這篇文章中，我們討論 Riva 語音識別。后續(xù)文章將討論如何定制語音識別模型，并將其作為優(yōu)化技能進行部署：

Customizing Speech Recognition Models to Your Domain Using TAO Toolkit

Deploying Speech Recognition Models to Production Using Riva

Riva 語音識別

Riva 是 GPU 加速的 AI 語音 SDK ，用于實時轉錄和虛擬助理等對話 AI 應用程序。 Riva 具有以下優(yōu)點：

NGC 中經過預訓練的最先進的語音模型

沒有編碼工具，例如TAO Toolkit，用于在自定義數(shù)據(jù)集上微調這些模型

用于高性能推理的優(yōu)化語音識別和語音合成管道

Riva 下面的模型是基于數(shù)百到數(shù)千小時的開放和真實世界數(shù)據(jù)進行訓練的，這些數(shù)據(jù)來自電信、金融、醫(yī)療保健和 NVIDIA 超級計算機上的教育等行業(yè)。數(shù)據(jù)集樣本還來自嘈雜的環(huán)境、自發(fā)的語音對話、多種英語口音和不同的采樣率。所有這些屬性都有助于生成噪聲魯棒、高質量的轉錄。

Riva 語音識別技能在各種真實世界的用例數(shù)據(jù)集上進行評估，包括視頻會議、聯(lián)絡中心、播客和技術視頻。您可以在云中、數(shù)據(jù)中心和邊緣部署這些技能。

Riva 語音識別管道在保持準確性的同時，為新的最先進的體系結構提供支持。圖 2 顯示了在過去 3 年中，通過新的模型體系結構、訓練方法以及最新的基于 TensorRT 和 GPU 的優(yōu)化，語音準確性的提高。

Riva ASR accuracy improved by 50% in 3 years.

圖 2 。 Riva ASR 精度改進

使用 Riva ，您可以在流式或批處理模式下以實時延遲快速部署和擴展到數(shù)百和數(shù)千個并發(fā)流。

關于作者

About Sirisha Rella

Sirisha Rella 是 NVIDIA 的技術產品營銷經理，專注于計算機視覺、語音和基于語言的深度學習應用。 Sirisha 獲得了密蘇里大學堪薩斯城分校的計算機科學碩士學位，是國家科學基金會大學習中心的研究生助理。

About Tanay Varshney

Tanay Varshney 是 NVIDIA 的一名深入學習的技術營銷工程師，負責廣泛的 DL 軟件產品。他擁有紐約大學計算機科學碩士學位，專注于計算機視覺、數(shù)據(jù)可視化和城市分析的橫斷面。

審核編輯：郭婷

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

NVIDIA

NVIDIA

+關注

關注
14

文章
5653

瀏覽量
109935
語音識別

語音識別

+關注

關注
39

文章
1812

瀏覽量
116134

91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲日韩欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

搜索歷史

使用NVIDIA Riva實現(xiàn)將語音轉錄成文本

評論