91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

傳音AI技術(shù)部在ASRU 2023 MADASR低資源語音識(shí)別比賽斬獲多項(xiàng)佳績(jī)

傳音控股 ? 來源:傳音控股 ? 2023-12-21 16:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

國(guó)際頂級(jí)語音會(huì)議ASRU 2023(IEEE Workshop on Automatic Speech Recognition and Understanding,簡(jiǎn)稱ASRU)于12月16日-20日順利舉辦。傳音AI技術(shù)部在ASRU 2023 MADASR(Model ADaptation for ASR in low-resource Indian languages,簡(jiǎn)稱MADASR)關(guān)于孟加拉語和博杰普爾語的低資源語音識(shí)別比賽中斬獲多項(xiàng)佳績(jī),在受限和非受限的4個(gè)賽道、2個(gè)語種與WER、CER 2個(gè)評(píng)價(jià)指標(biāo)共16個(gè)細(xì)分子賽道上獲得2個(gè)第一名、6個(gè)第二名和5個(gè)第三名。

ASRU研討會(huì)是語音與語言處理學(xué)術(shù)圈的頂級(jí)會(huì)議,由IEEE語音和語言處理技術(shù)委員會(huì)主辦,每?jī)赡昱e行一次,歷史悠久,影響廣泛。此次MADASR比賽是ASRU 2023的重要賽事,由IBM、布爾諾理工大學(xué)、微軟研究院、愛丁堡大學(xué)和印度科學(xué)研究所舉辦,旨在以孟加拉語和博杰普爾語為例,探索低資源語言的語音識(shí)別難題。比賽吸引了中科院自動(dòng)化所、愛沙尼亞塔林理工大學(xué)、印度坎普爾理工學(xué)院、印度科學(xué)研究所-馬德拉斯語音實(shí)驗(yàn)室、印度科學(xué)研究所-孟買數(shù)字音頻處理實(shí)驗(yàn)室、印度浦那高級(jí)計(jì)算發(fā)展中心等多家國(guó)內(nèi)外知名高校和研究機(jī)構(gòu)參賽。

自動(dòng)語音識(shí)別(Automatic Speech Recognition,簡(jiǎn)稱ASR)主要用于將人類語音轉(zhuǎn)換為計(jì)算機(jī)可讀的文本或命令,實(shí)現(xiàn)人機(jī)交互和自然語言處理。近年來,得益于基于自監(jiān)督學(xué)習(xí)的聲學(xué)模型(如 wav2vec2)和大規(guī)模多語言訓(xùn)練(如 Whisper),自動(dòng)語音識(shí)別性能大幅提高,然而低資源語言由于音頻和文本數(shù)據(jù)有限,仍面臨巨大的挑戰(zhàn)。

在ASRU 2023 MADASR比賽中,傳音AI技術(shù)部開發(fā)的語音識(shí)別系統(tǒng),在算法層面使用了兩種方案,一種是基于U2(Unified-2 pass)框架的編碼器和解碼器結(jié)構(gòu),使用短時(shí)連接分類(Connectionist Temporal Classification)和注意力重打分(Attention Rescore);另一種是基于Whisper的改進(jìn)和微調(diào)的結(jié)構(gòu)。該系統(tǒng)顯著提升了低資源語言語音識(shí)別的準(zhǔn)確性和效率,克服了語音數(shù)據(jù)的稀缺難題,其解決方案將為其他低資源語言提供參考。

b69609e2-9faf-11ee-8b88-92fbcf53809c.jpg

b6ad96a2-9faf-11ee-8b88-92fbcf53809c.jpg

據(jù)Ethnologue網(wǎng)站統(tǒng)計(jì),世界上有7000多種語言,其中90%的語種使用人數(shù)少于10萬人,不同語種尤其是小語種之間的溝通交流仍面臨極大挑戰(zhàn)。傳音長(zhǎng)期深耕新興市場(chǎng),面對(duì)新興市場(chǎng)智能語音技術(shù)空白,不斷加強(qiáng)多語種數(shù)據(jù)建設(shè),開發(fā)小語種語音識(shí)別、語義理解、知識(shí)圖譜、語音合成等算法模型,除了提供多語種語音轉(zhuǎn)寫的服務(wù)能力,未來還將提供大語言模型生成式交互和跨語種翻譯能力,使不同語種之間的交流更順暢,讓更多的小語種使用群體受益。

傳音始終以新興市場(chǎng)的消費(fèi)者為中心,重視新興市場(chǎng)用戶的需求。未來,傳音將繼續(xù)結(jié)合行業(yè)技術(shù)發(fā)展趨勢(shì)和本地消費(fèi)者洞察,在AI技術(shù)研究和智能終端應(yīng)用領(lǐng)域發(fā)力,通過技術(shù)為用戶、為社會(huì)創(chuàng)造更多價(jià)值,讓盡可能多的人盡早享受科技和創(chuàng)新帶來的美好生活。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 語音識(shí)別
    +關(guān)注

    關(guān)注

    39

    文章

    1812

    瀏覽量

    116071
  • ai技術(shù)
    +關(guān)注

    關(guān)注

    1

    文章

    1313

    瀏覽量

    25755
  • 傳音
    +關(guān)注

    關(guān)注

    0

    文章

    87

    瀏覽量

    6591

原文標(biāo)題:傳音AI技術(shù)部在ASRU 2023 MADASR低資源語音識(shí)別比賽斬獲多項(xiàng)佳績(jī)

文章出處:【微信號(hào):TranssionHoldings,微信公眾號(hào):傳音控股】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    芯導(dǎo)科技榮獲控股2025年度鼎立支持獎(jiǎng)

    近日,“千里 聲聲不息”控股2025年度供應(yīng)商頒獎(jiǎng)典禮深圳隆重舉行。作為長(zhǎng)期戰(zhàn)略合作伙伴,芯導(dǎo)科技(股票代碼:688230.SH)
    的頭像 發(fā)表于 01-27 17:52 ?1104次閱讀

    語音識(shí)別IC分類,語音識(shí)別芯片的工作原理

    語音識(shí)別芯片,也叫語音識(shí)別集成電路,是一種集聲音存儲(chǔ)、播放、錄音及語音識(shí)別功能于一體的專用芯片。
    的頭像 發(fā)表于 01-14 15:22 ?252次閱讀
    <b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>IC分類,<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>芯片的工作原理

    控股榮獲CES 2026微軟AI創(chuàng)新獎(jiǎng)

    近日, CES 2026 國(guó)際消費(fèi)類電子產(chǎn)品展覽會(huì)期間,微軟大中華區(qū)舉辦了以“駕馭前沿,共贏全球”為主題的專場(chǎng)活動(dòng),聚焦中國(guó)企業(yè)的創(chuàng)新實(shí)踐與技術(shù)應(yīng)用成果。作為深耕全球新興市場(chǎng)的科技企業(yè),
    的頭像 發(fā)表于 01-12 10:38 ?374次閱讀

    TEX AI團(tuán)隊(duì)斬獲ICCV 2025大型視頻目標(biāo)分割挑戰(zhàn)賽雙料亞軍

    近日,國(guó)際計(jì)算機(jī)視覺大會(huì)(ICCV 2025)舉辦了第七屆大型視頻目標(biāo)分割挑戰(zhàn)賽(LSVOS Challenge),TEX AI團(tuán)隊(duì)?wèi){借自主研發(fā)的創(chuàng)新技術(shù)方案,
    的頭像 發(fā)表于 10-31 09:42 ?571次閱讀
    <b class='flag-5'>傳</b><b class='flag-5'>音</b>TEX <b class='flag-5'>AI</b>團(tuán)隊(duì)<b class='flag-5'>斬獲</b>ICCV 2025大型視頻目標(biāo)分割挑戰(zhàn)賽雙料亞軍

    從超薄曲面屏到全場(chǎng)景AI,手機(jī)推動(dòng)前沿科技落地新興市場(chǎng)

    非洲之王到全球技術(shù)創(chuàng)新者,正通過高端技術(shù)的深度本地化,讓前沿科技從炫技的“嘗鮮”工具,轉(zhuǎn)變?yōu)樾屡d市場(chǎng)用戶日常生活中的“實(shí)用”伴侶。從超薄手機(jī)到場(chǎng)景
    的頭像 發(fā)表于 09-18 11:46 ?1590次閱讀
    從超薄曲面屏到全場(chǎng)景<b class='flag-5'>AI</b>,<b class='flag-5'>傳</b><b class='flag-5'>音</b>手機(jī)推動(dòng)前沿科技落地新興市場(chǎng)

    攜手Google Cloud打造下一代AI智能生態(tài)

    近日,備受矚目的谷歌開發(fā)者大會(huì)上,TEX AI總經(jīng)理史團(tuán)委受邀發(fā)表主題演講,深入分享了
    的頭像 發(fā)表于 09-02 10:47 ?1182次閱讀

    語音識(shí)別---大家怎么看呢?

    語音識(shí)別是一門交叉學(xué)科。近二十年來,語音識(shí)別技術(shù)取得顯著進(jìn)步,開始從實(shí)驗(yàn)室走向市場(chǎng)。人們預(yù)計(jì),未來10年內(nèi),
    發(fā)表于 08-09 10:54

    斬獲WMT 2025國(guó)際機(jī)器翻譯大賽四項(xiàng)冠軍

    近日,由國(guó)際計(jì)算語言學(xué)協(xié)會(huì)(ACL)主辦的WMT 2025國(guó)際機(jī)器翻譯大賽中,資源印度
    的頭像 發(fā)表于 08-06 18:21 ?1240次閱讀

    最新人工智能硬件培訓(xùn)AI基礎(chǔ)入門學(xué)習(xí)課程參考2025版(離線AI語音視覺識(shí)別篇)

    端側(cè)離線 AI 智能硬件作為 AI 技術(shù)的重要載體之一,憑借其無需依賴網(wǎng)絡(luò)即可實(shí)現(xiàn)智能功能的特性,一些網(wǎng)絡(luò)條件受限或?qū)?shù)據(jù)隱私有較高要求的場(chǎng)景中,發(fā)揮著不可或缺的作用。本章基于CSK
    發(fā)表于 07-04 11:14

    影像黑科技:讓不同膚色的你看見真實(shí)的自己!

    Canalys(現(xiàn)并入Omdia)的最新數(shù)據(jù)顯示,2025年第一季度,全球可穿戴腕帶設(shè)備市場(chǎng)同比增長(zhǎng)13%,出貨量達(dá)4660萬臺(tái)。其中,非洲TWS、可穿戴腕帶設(shè)備的市場(chǎng)份額持續(xù)第一。而這只是
    的頭像 發(fā)表于 06-27 09:26 ?1068次閱讀
    <b class='flag-5'>傳</b><b class='flag-5'>音</b>影像黑科技:讓不同膚色的你看見真實(shí)的自己!

    “破壁者”:以中國(guó)AI技術(shù)賦能非洲數(shù)字化轉(zhuǎn)型

    當(dāng)前,人工智能技術(shù)非洲國(guó)家加快運(yùn)用,而中國(guó)科技出海企業(yè)控股在這其中扮演著關(guān)鍵角色。作為占據(jù)非洲智能手機(jī)市場(chǎng)超過40%份額的“非洲之王”,
    的頭像 發(fā)表于 04-29 16:30 ?1219次閱讀
    “破壁者”<b class='flag-5'>傳</b><b class='flag-5'>音</b>:以中國(guó)<b class='flag-5'>AI</b><b class='flag-5'>技術(shù)</b>賦能非洲數(shù)字化轉(zhuǎn)型

    普強(qiáng)信息入選2024語音識(shí)別技術(shù)公司TOP30榜單

    普強(qiáng)憑借語音識(shí)別領(lǐng)域多年的技術(shù)積淀與持續(xù)的創(chuàng)新突破,成功入選“2024語音識(shí)別
    的頭像 發(fā)表于 04-18 17:25 ?1226次閱讀

    從非洲到新興市場(chǎng),開創(chuàng)全膚色影像技術(shù) ?

    高校合作后,“全膚色影像技術(shù)”領(lǐng)域的又一重要布局。此次合作不僅將推動(dòng)其標(biāo)志性技術(shù)UniversalTone的迭代升級(jí),更標(biāo)志著
    的頭像 發(fā)表于 03-28 15:42 ?931次閱讀
    從非洲到新興市場(chǎng),<b class='flag-5'>傳</b><b class='flag-5'>音</b>開創(chuàng)全膚色影像<b class='flag-5'>技術(shù)</b> ?

    接入 DeepSeek、聯(lián)合阿里云,AI戰(zhàn)略玩出新高度!

    近日,全球移動(dòng)通信大會(huì)(MWC)上,控股旗下手機(jī)品牌TECNO以“CreatetheAIFuture”為主題,展示了智能眼鏡、三折疊屏手機(jī)、太陽能充電、AI變色屏等多項(xiàng)黑科技,引發(fā)
    的頭像 發(fā)表于 03-19 15:20 ?1400次閱讀
    接入 DeepSeek、聯(lián)合阿里云,<b class='flag-5'>傳</b><b class='flag-5'>音</b><b class='flag-5'>AI</b>戰(zhàn)略玩出新高度!

    聚焦AI、影像技術(shù)與折疊屏三大賽道,控股2024年?duì)I收687.43億

    非洲、東南亞、拉美等新興市場(chǎng)的智能機(jī)出貨量均實(shí)現(xiàn)雙位數(shù)增長(zhǎng)。這不僅彰顯了作為中國(guó)科技出海企業(yè)的韌性,更揭示了其“本地化深耕+技術(shù)突圍”戰(zhàn)略的前瞻性。本地化破
    的頭像 發(fā)表于 03-12 14:37 ?1304次閱讀
    聚焦<b class='flag-5'>AI</b>、影像<b class='flag-5'>技術(shù)</b>與折疊屏三大賽道,<b class='flag-5'>傳</b><b class='flag-5'>音</b>控股2024年?duì)I收687.43億