91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌宣布開源Android語音識(shí)別轉(zhuǎn)錄工具 —— Live Transcribe的語音引擎

SwM2_ChinaAET ? 來源:lq ? 2019-10-01 17:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

谷歌在其開源博客中宣布開源 Android 語音識(shí)別轉(zhuǎn)錄工具 —— Live Transcribe 的語音引擎(Live Transcribe Speech Engine),它旨在將語音或?qū)υ拰?shí)時(shí)轉(zhuǎn)錄為文字,還能夠?yàn)槁犝先耸刻峁椭?/p>

Live Transcribe 是谷歌于今年 2 月推出的一款 Android 應(yīng)用程序,它的語音識(shí)別由谷歌最先進(jìn)的 Cloud Speech API 提供。但是,依賴于云引入了一些復(fù)雜性,不斷變化的網(wǎng)絡(luò)連接、數(shù)據(jù)成本和延遲的魯棒性等等都帶來一些考驗(yàn)。因此,谷歌把它開源出來, 希望開發(fā)人員在已有的基礎(chǔ)上進(jìn)一步構(gòu)建和開發(fā)。

Cloud Speech API 目前無法支持無限的音頻流,團(tuán)隊(duì)目前采取了一些措施來解決這一難題,例如在達(dá)到超時(shí)之前關(guān)閉并重新啟動(dòng)流式傳輸請求,這將有效減少會(huì)話中丟失的文本量。

無限流媒體音頻帶來了一大挑戰(zhàn)。在許多國家,網(wǎng)絡(luò)數(shù)據(jù)非常昂貴,并且在互聯(lián)網(wǎng)較差的地方,帶寬可能有限。Live Transcribe Speech Engine 的團(tuán)隊(duì)對音頻編解碼器進(jìn)行了大量實(shí)驗(yàn),并最終在不影響精度的情況下將數(shù)據(jù)使用量減少了 10 倍。

另外,由于是提供實(shí)時(shí)語音轉(zhuǎn)錄,轉(zhuǎn)錄出來的文本會(huì)隨著語音的輸入不斷發(fā)生變化,降低延遲自然十分必要。該引擎能夠大大降低延遲率,這都要?dú)w功于它的自定義 Opus 編碼器。

此外,值得一提的是,Live Transcribe 支持超過 70 種語言,并能夠根據(jù)語音自動(dòng)識(shí)別語種,其中也包括中文。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 解碼器
    +關(guān)注

    關(guān)注

    9

    文章

    1221

    瀏覽量

    43467
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6254

    瀏覽量

    111519
  • 語音識(shí)別
    +關(guān)注

    關(guān)注

    39

    文章

    1812

    瀏覽量

    116085

原文標(biāo)題:【業(yè)內(nèi)熱點(diǎn)】谷歌開源實(shí)時(shí)語音轉(zhuǎn)錄引擎 Live Transcribe Speech Engine

文章出處:【微信號(hào):ChinaAET,微信公眾號(hào):電子技術(shù)應(yīng)用ChinaAET】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    語音識(shí)別IC分類,語音識(shí)別芯片的工作原理

    語音識(shí)別芯片,也叫語音識(shí)別集成電路,是一種集聲音存儲(chǔ)、播放、錄音及語音識(shí)別功能于一體的專用芯片。
    的頭像 發(fā)表于 01-14 15:22 ?262次閱讀
    <b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>IC分類,<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>芯片的工作原理

    語音識(shí)別芯片有哪些(語音識(shí)別芯片AT680系列)

    在人工智能技術(shù)飛速發(fā)展的今天,語音識(shí)別芯片作為人機(jī)交互的重要橋梁,正逐漸成為各類智能設(shè)備不可或缺的核心部件。與傳統(tǒng)的語音芯片不同,語音識(shí)別
    的頭像 發(fā)表于 11-14 17:11 ?1398次閱讀

    廣州唯創(chuàng)電子WTK6900H-24SS語音識(shí)別芯片:智能語音控制賦能臺(tái)燈創(chuàng)新應(yīng)用 | 語音IC廠家

    在智能家居快速發(fā)展的今天,語音交互技術(shù)正在深刻改變?nèi)藗兣c家居設(shè)備的互動(dòng)方式。臺(tái)燈作為日常生活中不可或缺的照明工具,其智能化升級(jí)已成為行業(yè)發(fā)展的重要趨勢。廣州唯創(chuàng)電子作為國內(nèi)領(lǐng)先的語音IC廠家,推出
    的頭像 發(fā)表于 11-05 09:20 ?808次閱讀
    廣州唯創(chuàng)電子WTK6900H-24SS<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>芯片:智能<b class='flag-5'>語音</b>控制賦能臺(tái)燈創(chuàng)新應(yīng)用 | <b class='flag-5'>語音</b>IC廠家

    廣州唯創(chuàng)電子WTK6900H-32N語音識(shí)別芯片:智能語音控制賦能LED燈帶創(chuàng)新應(yīng)用 | 語音IC廠家

    芯片,憑借其卓越的性能和精準(zhǔn)的識(shí)別能力,在LED燈帶控制領(lǐng)域展現(xiàn)出強(qiáng)大的應(yīng)用價(jià)值,為智能照明系統(tǒng)帶來了革命性的創(chuàng)新突破。一、核心技術(shù)優(yōu)勢1.1高性能語音識(shí)別引擎WT
    的頭像 發(fā)表于 11-04 08:53 ?697次閱讀
    廣州唯創(chuàng)電子WTK6900H-32N<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>芯片:智能<b class='flag-5'>語音</b>控制賦能LED燈帶創(chuàng)新應(yīng)用 | <b class='flag-5'>語音</b>IC廠家

    什么是離線語音識(shí)別芯片(離線語音識(shí)別芯片有哪些優(yōu)點(diǎn))

    離線語音識(shí)別芯片,是一種集成了語音信號(hào)采集、前端處理和本地識(shí)別功能的專用集成電路,無須聯(lián)網(wǎng)也可以進(jìn)行語音控制。它內(nèi)設(shè)先進(jìn)的數(shù)字信號(hào)處理模塊及
    的頭像 發(fā)表于 10-31 15:27 ?533次閱讀

    如何選擇合適的語音識(shí)別芯片型號(hào)

    語音識(shí)別芯片(又稱語音識(shí)別IC)是現(xiàn)代智能設(shè)備的核心組件,與傳統(tǒng)語音芯片相比,其最大特點(diǎn)是能夠主動(dòng)識(shí)別
    的頭像 發(fā)表于 10-30 16:32 ?635次閱讀

    基于開源鴻蒙的語音識(shí)別語音合成應(yīng)用開發(fā)樣例

    本期內(nèi)容由AI Model SIG提供,介紹了在開源鴻蒙中,利用sherpa_onnx開源三方庫進(jìn)行ASR語音識(shí)別與TTS語音合成應(yīng)用開發(fā)的
    的頭像 發(fā)表于 08-25 14:26 ?4148次閱讀
    基于<b class='flag-5'>開源</b>鴻蒙的<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>及<b class='flag-5'>語音</b>合成應(yīng)用開發(fā)樣例

    瑞芯微RK3576語音識(shí)別算法

    1.語音識(shí)別簡介語音識(shí)別技術(shù),也被稱為自動(dòng)語音識(shí)別(AutomaticSpeechRecogni
    的頭像 發(fā)表于 08-15 15:13 ?2204次閱讀
    瑞芯微RK3576<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>算法

    語音識(shí)別---大家怎么看呢?

    語音識(shí)別是一門交叉學(xué)科。近二十年來,語音識(shí)別技術(shù)取得顯著進(jìn)步,開始從實(shí)驗(yàn)室走向市場。人們預(yù)計(jì),未來10年內(nèi),語音
    發(fā)表于 08-09 10:54

    廣和通發(fā)布自研端側(cè)語音識(shí)別大模型FiboASR

    7月,全球領(lǐng)先的無線通信模組及AI解決方案提供商廣和通,發(fā)布其自主研發(fā)的語音識(shí)別大模型FiboASR。該模型專為端側(cè)設(shè)備上面臨的面對面實(shí)時(shí)對話及多人會(huì)議場景深度優(yōu)化,在低延遲語音交互、實(shí)時(shí)語音
    的頭像 發(fā)表于 08-04 11:43 ?1631次閱讀

    EASY EAl Orin Nano(RK3576) whisper語音識(shí)別訓(xùn)練部署教程

    1Whisper簡介Whisper是OpenAI開源的,識(shí)別語音識(shí)別能力已達(dá)到人類水準(zhǔn)自動(dòng)語音識(shí)別
    的頭像 發(fā)表于 07-25 15:21 ?871次閱讀
    EASY EAl Orin Nano(RK3576) whisper<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>訓(xùn)練部署教程

    EASY EAl Orin Nano(RK3576) whisper語音識(shí)別訓(xùn)練部署教程

    Whisper是OpenAI開源的,識(shí)別語音識(shí)別能力已達(dá)到人類水準(zhǔn)自動(dòng)語音識(shí)別系統(tǒng)。Whispe
    的頭像 發(fā)表于 07-17 14:55 ?1803次閱讀
    EASY EAl Orin Nano(RK3576) whisper<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>訓(xùn)練部署教程

    明遠(yuǎn)智睿SSD2351開發(fā)板:語音機(jī)器人領(lǐng)域的變革力量

    。 開發(fā)板支持浮點(diǎn)運(yùn)算,這對于語音信號(hào)處理中的精確計(jì)算至關(guān)重要。在語音識(shí)別過程中,需要對語音信號(hào)的頻率、幅度等參數(shù)進(jìn)行精確計(jì)算和分析,浮點(diǎn)運(yùn)算能夠確保計(jì)算結(jié)果的準(zhǔn)確性,從而提高
    發(fā)表于 05-28 11:36

    芯資訊|廣州唯創(chuàng)電子WTK6900P語音識(shí)別芯片:離線語音交互的革新者

    在智能設(shè)備全面普及的浪潮中,語音交互技術(shù)正逐步從“云端依賴”向“本地化高效處理”演進(jìn)。廣州唯創(chuàng)電子推出的WTK6900P語音識(shí)別芯片,憑借其本地化離線語音
    的頭像 發(fā)表于 05-22 09:22 ?837次閱讀
    芯資訊|廣州唯創(chuàng)電子WTK6900P<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>芯片:離線<b class='flag-5'>語音</b>交互的革新者