91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

科大訊飛引領(lǐng)語音識(shí)別技術(shù)新篇章

訊飛開放平臺(tái) ? 來源:訊飛開放平臺(tái) ? 2024-10-14 10:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

無論是《2011太空漫游》中的 HAL 還是《星球大戰(zhàn)》中的 C-3PO,人們長(zhǎng)期以來一直幻想著能夠與機(jī)器對(duì)話。

智能手機(jī)助手到智能家居系統(tǒng),再到車載語音控制系統(tǒng),語音識(shí)別技術(shù)如今似乎已成為生活中不可或缺的一部分。但在某些場(chǎng)景,表現(xiàn)得并不如人意。“肌肉”和“雞肉”、“北麓”和“北路”,語言的歧義性、語境的依賴性,以及溝通雙方所需的共同知識(shí)背景,都是當(dāng)前需要克服的難題。

美國(guó)學(xué)者愛德華·霍爾在1976年的著作《超越文化》中,提出了“高語境文化”與“低語境文化”的概念。高語境文化,被認(rèn)為是一種注重細(xì)節(jié)、強(qiáng)調(diào)推斷和推理、強(qiáng)調(diào)群體認(rèn)同和文化多樣性的文化。中文,是其中典型的代表。因此,在電影《流浪地球》中我們可以看到這樣的場(chǎng)景,MOSS與劉培強(qiáng)的交流中,多次強(qiáng)調(diào)避免使用比喻、反問和暗示,以減少理解上的誤差。

不僅是中文,不同語言之間在語音、語法、詞匯上的差異,以及個(gè)體獨(dú)特的口音和發(fā)音習(xí)慣,都為語音識(shí)別技術(shù)帶來了額外的挑戰(zhàn)。

在語音識(shí)別技術(shù)的應(yīng)用已相當(dāng)成熟、跨文化交流增多的今天,如何進(jìn)一步提高語音識(shí)別的準(zhǔn)確率,改善人機(jī)交互體驗(yàn),為人與人之間交流打破國(guó)界、地域的阻礙?

深耕語音技術(shù)領(lǐng)域25年,在AI技術(shù)飛速躍遷的今天,科大訊飛發(fā)布了語音識(shí)別大模型,將語音識(shí)別的準(zhǔn)確率和多語種識(shí)別的效果,提升到了一個(gè)新的高度。

01無處不在,語音識(shí)別持續(xù)進(jìn)化

技術(shù)角度來看,語音識(shí)別是一項(xiàng)融合多學(xué)科知識(shí)的前沿技術(shù),覆蓋了數(shù)學(xué)與統(tǒng)計(jì)學(xué)、聲學(xué)與語言學(xué)、計(jì)算機(jī)與人工智能等基礎(chǔ)學(xué)科和前沿學(xué)科。簡(jiǎn)而言之,它的核心任務(wù)是將輸入的語音信號(hào)轉(zhuǎn)換為與之匹配度最高的文字序列。

1952年,貝爾實(shí)驗(yàn)室研制出世界上第一個(gè)能識(shí)別10個(gè)英文數(shù)字發(fā)音的實(shí)驗(yàn)系統(tǒng),揭開了人類使用計(jì)算機(jī)識(shí)別語音的序幕。進(jìn)入90年代,伴隨個(gè)人電腦和互聯(lián)網(wǎng)普及,語音識(shí)別逐漸走出實(shí)驗(yàn)室,走進(jìn)公眾視野。2009年之后,深度神經(jīng)網(wǎng)絡(luò)(DNN)的引入,使得語音識(shí)別的準(zhǔn)確率顯著提升,相關(guān)產(chǎn)品開始大規(guī)模普及,技術(shù)進(jìn)入新的發(fā)展階段,深入到我們?nèi)粘I畹姆椒矫婷妗?/p>

大模型技術(shù)引爆的人工智能新一輪應(yīng)用熱潮,其感知能力、認(rèn)知能力、生成能力正重構(gòu)人機(jī)交互方式,不斷刷新用戶期待,在千行百業(yè)落地應(yīng)用。語音識(shí)別作為最早落地的人工智能技術(shù)之一,也悄然發(fā)生著變革。

經(jīng)過海量數(shù)據(jù)訓(xùn)練、擁有強(qiáng)大自然語言理解能力的大模型,給語音研究帶來了新的技術(shù)邏輯,創(chuàng)造了語音技術(shù)發(fā)展的全新機(jī)會(huì)。

通過學(xué)習(xí)更多的語言知識(shí)和上下文信息,大模型能實(shí)現(xiàn)更精準(zhǔn)的語義理解,準(zhǔn)確識(shí)別出語音內(nèi)容;同時(shí),基于更統(tǒng)一的多任務(wù)建模能力,通過在中文、英文和其他語種的語料上進(jìn)行訓(xùn)練,有助于提升語料稀缺小語種的效果。

科大訊飛作為語音領(lǐng)域的佼佼者,如今正在引領(lǐng)著語音識(shí)別技術(shù)的未來發(fā)展。

02語音行業(yè)翹楚,首發(fā)星火語音大模型

智能語音是萬物互聯(lián)機(jī)器溝通的入口,也是人工智能賦能千行萬業(yè)、浸潤(rùn)千家萬戶的秘鑰。

25年前創(chuàng)業(yè)之初,科大訊飛的夢(mèng)想和使命就是要實(shí)現(xiàn)人機(jī)信息溝通無障礙,并始終保持初心,長(zhǎng)期致力于智能語音技術(shù)的源頭創(chuàng)新及產(chǎn)業(yè)化應(yīng)用。

從2010年國(guó)內(nèi)首批開展深度神經(jīng)網(wǎng)絡(luò)語音識(shí)別研究,到全球首個(gè)中文語音識(shí)別深度神經(jīng)網(wǎng)絡(luò)(DNN)上線、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)語音識(shí)別全面升級(jí)、全球首創(chuàng)基于全序列卷積神經(jīng)網(wǎng)絡(luò)(DFCNN)的語音識(shí)別,再到近幾年持續(xù)探索無監(jiān)督預(yù)訓(xùn)練、多模態(tài)在語音識(shí)別上的應(yīng)用,訊飛不斷挑戰(zhàn)語音識(shí)別實(shí)際應(yīng)用中的技術(shù)難題。

2023年,在有“最難語音識(shí)別任務(wù)”之稱的語音領(lǐng)域權(quán)威賽事——國(guó)際多通道語音分離和識(shí)別大賽CHiME中,訊飛在大牛如云的參賽隊(duì)伍中,力壓群雄,第四次拿下冠軍。

除中英以外,科大訊飛已具備其他69種語言的語音識(shí)別能力,其中有35個(gè)語種準(zhǔn)確率超過90%(數(shù)據(jù)來源于實(shí)際應(yīng)用)。同時(shí),訊飛開放平臺(tái)還在新加坡、俄羅斯、印度、日本等國(guó)家部署了海外站點(diǎn),將語音識(shí)別、語音合成等技術(shù),開放給海內(nèi)外開發(fā)者。

大模型時(shí)代浪潮下,科大訊飛基于深厚的技術(shù)積累,2024年1月31日正式推出星火語音大模型,引領(lǐng)萬物互聯(lián)時(shí)代的人機(jī)交互革命。在語音識(shí)別方面,中文、英語、法語、俄語等首批37個(gè)主流語種的語音識(shí)別效果超過OpenAI Whisper V3。其中,13個(gè)重點(diǎn)語種識(shí)別率達(dá)94%,24個(gè)主要語種識(shí)別率達(dá)90%。

03高準(zhǔn)確率+高識(shí)別率 語音識(shí)別大模型上線

讓更多人能享受到新技術(shù)帶來的便利,近期,基于星火語音大模型的語音識(shí)別大模型已在訊飛開放平臺(tái)上線,面向開發(fā)者開放調(diào)用,可以將短音頻(≤60秒)精準(zhǔn)識(shí)別成文字,除中文普通話和英文外,支持37個(gè)語種自動(dòng)判別,說話過程中可以無縫切換語種,實(shí)時(shí)返回對(duì)應(yīng)語種的文字結(jié)果,并提供公有云接口及私有化部署方案。

與傳統(tǒng)的語音識(shí)別產(chǎn)品相比,語音識(shí)別大模型有著獨(dú)特的優(yōu)勢(shì):

高識(shí)別率,高準(zhǔn)確率

基于統(tǒng)一建模的星火多語種語音識(shí)別大模型,極大提升了語音識(shí)別準(zhǔn)確度,真實(shí)還原語音內(nèi)容,提高信息獲取效率

多語種自動(dòng)判別

支持中文、英語、日語、韓語、俄語、法語等37個(gè)語種的自動(dòng)判別,在說話過程中可以無縫切換語種,助力跨文化交流更自由

指定語種準(zhǔn)確率更高

對(duì)于已明確語種的場(chǎng)景,也可以指定語種進(jìn)行識(shí)別,進(jìn)一步提升正確率

智能標(biāo)點(diǎn)

數(shù)字、標(biāo)點(diǎn)、大小寫和識(shí)別結(jié)果同步預(yù)測(cè),使口語表達(dá)變規(guī)整,帶來更流暢的閱讀體驗(yàn)

在開發(fā)者資源方面,除了基礎(chǔ)的WebAPI,訊飛開放平臺(tái)還提供了不同平臺(tái)的SDK,包括Android、Linux、iOS、Windows,幫助開發(fā)者將語音識(shí)別大模型能力快速集成到產(chǎn)品中。

目前,語音識(shí)別大模型能力已搭載在訊飛星火APP和訊飛翻譯機(jī)等產(chǎn)品中。

打開訊飛星火APP,用語音與星火進(jìn)行對(duì)話,你所說的語音會(huì)快速被識(shí)別為精準(zhǔn)的文字,讓你直觀感受到語音識(shí)別大模型帶來的高準(zhǔn)確率和高識(shí)別率。

持續(xù)進(jìn)步的語音識(shí)別技術(shù)正進(jìn)一步拓展人機(jī)交互的場(chǎng)景邊界,在客戶服務(wù)、語音搜索、游戲娛樂、會(huì)議記錄、教育培訓(xùn)等領(lǐng)域,為人類帶來更加便捷、高效和智能的生活方式。

正如梅拉妮·米歇爾在《AI 3.0》書中強(qiáng)調(diào),自動(dòng)語音識(shí)別是深度學(xué)習(xí)在自然語言處理中的第一個(gè)重大成就,也是迄今為止人工智能在所有領(lǐng)域中取得的最重要的成就。這不僅是對(duì)語音識(shí)別技術(shù)的認(rèn)可,更是對(duì)未來人機(jī)交互無限可能的預(yù)示。

點(diǎn)擊閱讀原文,免費(fèi)領(lǐng)取語音識(shí)別大模型試用包,至高20萬次服務(wù)量(中文)。

文末彩蛋

2023年,科大訊飛與統(tǒng)信軟件宣布達(dá)成戰(zhàn)略合作,充分發(fā)揮各自技術(shù)和產(chǎn)品優(yōu)勢(shì),共同探索新的商業(yè)模式,推動(dòng)AI技術(shù)在各行各業(yè)的深度應(yīng)用。

統(tǒng)信軟件是全球主流操作系統(tǒng)產(chǎn)品與服務(wù)提供商,統(tǒng)信UOS桌面版發(fā)貨量累計(jì)超過600萬,服務(wù)器版發(fā)貨量增速更是位列行業(yè)前列。

近日,訊飛星火、訊飛智文已正式上架統(tǒng)信應(yīng)用商店,讓全球用戶可通過統(tǒng)信應(yīng)用商店一鍵輕松暢享AI樂趣,感受前所未有的便捷應(yīng)用與服務(wù)體驗(yàn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39866

    瀏覽量

    301510
  • 語音識(shí)別
    +關(guān)注

    關(guān)注

    39

    文章

    1812

    瀏覽量

    116067
  • 科大訊飛
    +關(guān)注

    關(guān)注

    19

    文章

    860

    瀏覽量

    63742

原文標(biāo)題:對(duì)標(biāo)Open AI Whisper,語音識(shí)別進(jìn)入下一個(gè) level

文章出處:【微信號(hào):訊飛開放平臺(tái),微信公眾號(hào):訊飛開放平臺(tái)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    國(guó)資入主聯(lián)創(chuàng)電子開啟企業(yè)發(fā)展嶄新篇章

    冬日暖陽耀贛江,聯(lián)創(chuàng)電子譜新章。2025年12月25日,聯(lián)創(chuàng)電子科技股份有限公司(證券簡(jiǎn)稱:聯(lián)創(chuàng)電子,股票代碼:002036)股票復(fù)牌,正式書寫企業(yè)發(fā)展歷程中的嶄新篇章。
    的頭像 發(fā)表于 01-09 14:47 ?568次閱讀

    科大設(shè)立子公司:加碼AI與集成電路業(yè)務(wù)布局

    ,經(jīng)營(yíng)范圍涵蓋人工智能公共服務(wù)平臺(tái)技術(shù)咨詢服務(wù)、集成電路設(shè)計(jì)、人工智能基礎(chǔ)軟件開發(fā)等業(yè)務(wù),由科大全資持股。此次新設(shè)子公司是科大
    發(fā)表于 12-29 08:53 ?986次閱讀

    迅為Hi3403開發(fā)板驅(qū)動(dòng)教程全面上線,開啟嵌入式Linux開發(fā)新篇章

    迅為iTOP-Hi3403開發(fā)板linux驅(qū)動(dòng)教程全面上線,開啟嵌入式Linux開發(fā)新篇章!
    的頭像 發(fā)表于 12-18 14:23 ?693次閱讀
    迅為Hi3403開發(fā)板驅(qū)動(dòng)教程全面上線,開啟嵌入式Linux開發(fā)<b class='flag-5'>新篇章</b>!

    2025科大全球1024開發(fā)者節(jié)精彩回顧

    當(dāng)全球產(chǎn)業(yè)格局和競(jìng)爭(zhēng)形態(tài)重塑之時(shí),AI將如何發(fā)展?11月6日,在第八屆世界聲博會(huì)暨2025科大全球1024開發(fā)者節(jié)發(fā)布會(huì)上,科大
    的頭像 發(fā)表于 11-10 11:51 ?909次閱讀
    2025<b class='flag-5'>科大</b><b class='flag-5'>訊</b><b class='flag-5'>飛</b>全球1024開發(fā)者節(jié)精彩回顧

    科大發(fā)布星火X1.5及系列AI產(chǎn)品

    11月6日,第八屆世界聲博會(huì)暨2025科大全球1024開發(fā)者節(jié)發(fā)布會(huì)上,科大以《更懂你的
    的頭像 發(fā)表于 11-10 11:49 ?947次閱讀

    西班牙工程與技術(shù)公司攜手FLIR開啟高溫檢測(cè)新篇章

    在鋼鐵制造這一傳統(tǒng)而充滿挑戰(zhàn)的領(lǐng)域,高溫與惡劣環(huán)境如同兩道難以逾越的鴻溝,橫亙?cè)谔嵘a(chǎn)效率與質(zhì)量的道路上。然而,西班牙工程與技術(shù)先鋒BcB Informatica y Control攜手Flir公司,構(gòu)建了創(chuàng)新的技術(shù)解決方案,正為這一行業(yè)注入智能化升級(jí)的新動(dòng)力,開啟高溫
    的頭像 發(fā)表于 11-02 11:37 ?931次閱讀

    云臺(tái)電機(jī)驅(qū)動(dòng):開啟智能化時(shí)代的新篇章

    在科技飛速發(fā)展的今天,智能化已經(jīng)滲透到我們生活的方方面面。而在眾多科技領(lǐng)域中,云臺(tái)電機(jī)驅(qū)動(dòng)技術(shù)正以其獨(dú)特的魅力,開啟著智能化時(shí)代的新篇章
    的頭像 發(fā)表于 07-23 18:16 ?981次閱讀

    編碼器線:精準(zhǔn)連接,高效傳動(dòng),引領(lǐng)科技新篇章

    在日新月異的科技時(shí)代,每一個(gè)微小的進(jìn)步都可能成為推動(dòng)行業(yè)變革的關(guān)鍵。編碼器線,這一看似不起眼的組件,卻在自動(dòng)化、智能制造、機(jī)器人技術(shù)等眾多高科技領(lǐng)域中扮演著至關(guān)重要的角色。今天,就讓我們一起走進(jìn)編碼器線的世界,探索它如何以精準(zhǔn)連接和高效傳動(dòng),引領(lǐng)科技
    的頭像 發(fā)表于 06-27 16:57 ?982次閱讀

    打破交互困局:科大這樣出手

    十年深耕,科大智能交互如何引領(lǐng)未來
    的頭像 發(fā)表于 06-17 11:50 ?1187次閱讀
    打破交互困局:<b class='flag-5'>科大</b><b class='flag-5'>訊</b><b class='flag-5'>飛</b>這樣出手

    回顧科大26周年慶精彩瞬間

    近日,科大26周年司慶上,董事長(zhǎng)劉慶峰對(duì)這個(gè)作文題感觸很深:“從1999年創(chuàng)業(yè)時(shí)在“中國(guó)被人扼住了咽喉”背景下以語音合成系統(tǒng)破局,到這些年智能
    的頭像 發(fā)表于 06-13 14:08 ?1007次閱讀

    科大加速東南亞企業(yè)的人工智能應(yīng)用

    日前,科大飛在新加坡成功舉辦合作伙伴峰會(huì)暨創(chuàng)新產(chǎn)品發(fā)布會(huì)。這場(chǎng)匯聚關(guān)鍵合作伙伴、行業(yè)先驅(qū)和技術(shù)領(lǐng)袖的盛會(huì),不僅集中展示了科大
    的頭像 發(fā)表于 05-06 09:39 ?918次閱讀

    科大亮相第137屆廣交會(huì)

    今天,第137屆中國(guó)進(jìn)出口商品交易會(huì)(廣交會(huì))在廣州開幕。科大又一年參展,集中展示了星火大模型的最新
    的頭像 發(fā)表于 04-17 09:30 ?1144次閱讀

    國(guó)產(chǎn)首款量產(chǎn)型七位半萬用表!青島漢泰開啟國(guó)產(chǎn)高精度測(cè)量新篇章

    國(guó)產(chǎn)首款量產(chǎn)型七位半萬用表!青島漢泰開啟國(guó)產(chǎn)高精度測(cè)量新篇章。 2025年3月18日,青島漢泰推出全新HDM3075系列7位半數(shù)字萬用表。HDM3075系列是國(guó)產(chǎn)首款實(shí)現(xiàn)量產(chǎn)的七位半萬用表產(chǎn)品,它
    發(fā)表于 04-01 13:15

    智造未來,工業(yè)互聯(lián)網(wǎng)mes系統(tǒng)開啟“工業(yè)4.0”新篇章

    的生產(chǎn)方式,更開啟了“工業(yè)4.0”的新篇章引領(lǐng)制造業(yè)邁向更加智能化、高效化的未來?!I(yè)互聯(lián)網(wǎng)mes系統(tǒng):智能制造的超級(jí)大腦工業(yè)互聯(lián)網(wǎng)mes系統(tǒng),作為連接企業(yè)資
    的頭像 發(fā)表于 03-21 10:32 ?898次閱讀
    智造未來,工業(yè)互聯(lián)網(wǎng)mes系統(tǒng)開啟“工業(yè)4.0”<b class='flag-5'>新篇章</b>

    科大攜手西安鐵路局打造人工智能平臺(tái)

    近日,科大攜手中國(guó)鐵路西安局集團(tuán)有限公司(以下簡(jiǎn)稱“西安鐵路局”)打造的人工智能平臺(tái)正式上線啟用。該人工智能平臺(tái)集成星火大模型
    的頭像 發(fā)表于 03-17 16:14 ?1034次閱讀