91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

云知聲山海知音大模型2.0重磅發(fā)布

云知聲 ? 來源:云知聲 ? 2026-01-27 14:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著智能體時代到來,云知聲在“山?!tlas”通用智算基座持續(xù)演進基礎(chǔ)上,年前實現(xiàn)了“山海·知醫(yī)”5.0醫(yī)療大模型升級,今天迎來了“山?!ぶ簟?.0的重磅發(fā)布,正在完成“一基兩翼”技術(shù)戰(zhàn)略升級的能力拼圖。

“山?!ぶ簟贝竽P?2.0——依托“山?!tlas”的多模態(tài)、跨語言基座能力,讓“山?!ぶt(yī)”等垂直專業(yè)智能體,惠及千家萬戶——聽懂專業(yè)與鄉(xiāng)音、聊出親情與溫度、極致機敏反應(yīng),是本次升級的三大能力進化。

1聽懂專業(yè)與鄉(xiāng)音——ASR全景升級

此次模型ASR能力在公開測試集和自有全場景測試集中,均顯現(xiàn)了領(lǐng)先的語音識別能力,在評測中實現(xiàn)了從通用到極端全面的領(lǐng)先水平,超過了國內(nèi)主流的開源和閉源語音大模型,達到業(yè)界最高水平。特別是在高難度的復(fù)雜噪音與方言口音場景下,相比主流ASR模型性能提升了2.5%至3.6%,在復(fù)雜背景音環(huán)境下識別準確率更是在業(yè)內(nèi)首次突破90%。

0ed0b8be-fa53-11f0-92de-92fbcf53809c.png

公開測試集

0f33e6c8-fa53-11f0-92de-92fbcf53809c.png

自有測試集

案例展示1:高噪環(huán)境下精準識別——商場購物

真實的語音識別環(huán)境中,還經(jīng)常會面臨專業(yè)術(shù)語識別不清、邏輯混亂等挑戰(zhàn)。作為此次升級中最大的亮點,即模型“能夠聽得懂專業(yè)話”,它可結(jié)合上下文和行業(yè)術(shù)語,聽懂專業(yè)場景中的每一個術(shù)語與指令,識別精度提升 30%。“它不是在‘聽字’,而是在‘理解事’”。

例如在汽車4S店試駕場景中,當(dāng)銷售提及“方向盤”相關(guān)描述時,即使上下文未明確出現(xiàn)“半幅方向盤”,模型仍能通過邏輯推理準確識別。

案例展示2:上下文理解——汽車4S店試駕

而在嚴肅的醫(yī)療場景,模型能顯式注入“依帕司他”“二甲雙胍”等術(shù)語進行定向增強,確保識別結(jié)果更精準。

案例展示3:專業(yè)知識庫——醫(yī)療對話錄音轉(zhuǎn)寫

同時,模型支持30余種中文方言及14種國際語言的識別轉(zhuǎn)寫,無論是晦澀的粵語、閩南語、上海話,還是英、日、韓、法、德、泰等國際語言,均能實現(xiàn)精準轉(zhuǎn)寫。更進一步,模型還能融合講義等視覺語義,構(gòu)建“視聽融合”閉環(huán)交互,進一步提升識別結(jié)果。

案例展示4:多方言語種混切——商務(wù)會議

2聊出親情與溫度——TTS聲動進化

如果說ASR能力是“耳朵”,那么TTS能力便是“嘴巴”。山?!ぶ?TTS以“高度擬人+創(chuàng)意多元”為核心,讓語音合成兼具真實感與創(chuàng)造力,使科技更有溫度。

它目前支持12種方言(粵語、四川話、上海話全拿下)+ 10種外語,清嗓、笑聲、呼吸聲都自然還原,甚至能切換 12種普通話風(fēng)格,溫柔、干練、親切隨你選?!翱萍疾辉摳吒咴谏?,而該用你最舒服的方式說話。”

案例展示5:細膩情感表達——AI電商直播

山?!ぶ?.0-TTS合成文本

高興:“家人們!下一個品!魔法保溫杯!矮油厲害啦!倒進去的開水,只要60秒!一分鐘的時間,就變55度溫泉水!再倒杯冰美式進去,半小時還是透心涼!哎淺嘗一下!”

咳嗽:“咳咳…對、對不起啊…太激動了嗆到了…”

沉穩(wěn):“呃,等一下等一下等一下…這個杯底怎么在漏水啊?不是吧剛開播就翻車?我打開看下啊,害,是我剛才試用的時候把密封圈給碰歪了。啊沒事,調(diào)一下,真金不怕火煉啊!這就沒問題啦!”

大聲:“哎,但是家人們福利來了啊!品牌方剛說了:看過剛才翻車的各位,只要您下單,立享三年只換不修!上鏈接!”

目前模型已支持粵語、四川話、上海話等12種方言,以及日語、韓語、泰語等10種外語。可實現(xiàn)跨方言、跨語種、跨情感的組合生成,針對小語種的語音韻律也進行了專項優(yōu)化——如日語的“促音”、泰語的“聲調(diào)變化”,合成自然度接近母語使用者。

案例展示6:多語種、方言支持——文旅宣傳

山?!ぶ?.0-TTS合成文本

這就是上海,等你來解鎖更多精彩。

此外,還支持一句話聲音復(fù)刻以及播客級長文本合成,賦能有聲內(nèi)容創(chuàng)作與互動娛樂。

案例展示7:一句話聲音復(fù)刻——視頻配音

結(jié)合樣音1的音色與樣音2的情感特征,生成目標文本的音頻

山?!ぶ?.0-TTS合成文本

什么?還要我等三十分鐘?一天有多少個三十分鐘?這天都快黑了,誰愛等誰等。

案例展示8:音色復(fù)刻——兒童伴讀

山?!ぶ?.0-TTS合成文本

在遠離城市燈火的地方,有一處“靜語森林”。這里的樹葉會在傍晚唱起輕柔的搖籃曲,溪水會隨著月光流淌出銀色的旋律。在森林最深處住著一只名叫小絨的松鼠,她有一個特別的身份——她是這片森林的星光編織師。

案例展示9:播客級長文本合成——播客

山?!ぶ?.0-TTS合成文本

A:哎,你有沒有注意到,長大后我們學(xué)到的那些最關(guān)鍵的生存技能,其實根本不是學(xué)校里教的那些東西?

B:呵,你是說…職場摸魚?

A:呵呵,太膚淺了!呵!其實是“如何體面地結(jié)束一場你不想繼續(xù)的對話”。這可是門藝術(shù)啊!

B:對對對!我最懂這種感受!

A:從電梯里被話癆同事攔住,到家庭聚會上應(yīng)付催婚的親戚…

B:哦——!我知道了!還有就是,接到那些討厭的推銷電話時,如何不讓對方覺得你是個壞人,卻又能干脆利落地把它掛掉!

基于大模型的語音合成通常采用流匹配(Flow Matching)將大語言模型預(yù)測的語音Token轉(zhuǎn)換為梅爾譜,再通過神經(jīng)聲碼器(Neural Vocoder)重建為最終語音。但該方案普遍存在延遲較高的問題。業(yè)界常通過流匹配分段處理來降低延遲,但效果有限,且容易犧牲音質(zhì)。

為實現(xiàn)真正高質(zhì)量、低延遲的流式語音生成,云知聲創(chuàng)新性地設(shè)計了基于純因果注意力機制的流匹配模塊,并與神經(jīng)聲碼器進行聯(lián)合優(yōu)化,構(gòu)建出端到端的純流式推理架構(gòu)。該方案在不損失合成質(zhì)量的前提下,顯著降低系統(tǒng)延遲——在低并發(fā)場景下,首包延遲已壓縮至90毫秒以內(nèi),達到業(yè)界領(lǐng)先的實時交互水平。

0f8f7f4c-fa53-11f0-92de-92fbcf53809c.png

因果注意力機制

3極致機敏反應(yīng)——端到端全雙工交互

真正的智能交互,在于“理解語境、感受情緒、自然回應(yīng)”。端到端模型實現(xiàn)流暢全雙工面臨的核心挑戰(zhàn)是:需在流式收聲時同步完成理解、決策與生成,并在任意打斷瞬間保持對話狀態(tài)連貫。山?!ぶ?.0基于端到端交互大腦攻克了這一難題,將全雙工能力提升至新高度。

支持隨時打斷、即時接話、連貫追問,就像和一個真正聰明的朋友聊天,行云流水,毫無卡頓。“這不是問答,是對話?!?/p>

案例展示10:端到端全雙工交互——與山海大模型對話

背后是誰在支撐這一切?

答案是云知聲獨創(chuàng)的 “山?!tlas”智算一體基座,將通用多模態(tài)大模型底座與Atlas基礎(chǔ)架構(gòu)深度整合,既是專業(yè)智能體的基礎(chǔ),也是感知AI中樞的根基——將傳統(tǒng)的ASR、TTS和全雙工能力,有效整合到端到端大模型中,做到傳統(tǒng)模塊級聯(lián)無法實現(xiàn)的極致交互體驗和效率。

智起山海,知音萬物

從手術(shù)室到鄉(xiāng)間小路,從駕駛艙到老人床頭,

云知聲相信:真正的智能,不是炫技,而是融入生活。

山海·知音 2.0,

讓 AI 不再“人工智障”,

而是聽得清、說得真、懂人心的伙伴。

這一次,AI 終于學(xué)會好好說話了。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 云知聲
    +關(guān)注

    關(guān)注

    0

    文章

    314

    瀏覽量

    9360
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3645

    瀏覽量

    5176

原文標題:智啟山海,交互無界——云知聲山?!ぶ?2.0 重磅發(fā)布

文章出處:【微信號:云知聲,微信公眾號:云知聲】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    正式推出Unisound U1-OCR文檔智能基礎(chǔ)大模型

    就在剛剛,正式推出 Unisound U1-OCR 文檔智能基礎(chǔ)大模型。作為首個工業(yè)級文檔智能基座,該模型憑借 “性能 SOTA、可信
    的頭像 發(fā)表于 02-26 17:28 ?715次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b>正式推出Unisound U1-OCR文檔智能基礎(chǔ)大<b class='flag-5'>模型</b>

    成功中標某頭部財險集團兩項重點項目

    近日,AGI技術(shù)產(chǎn)業(yè)化領(lǐng)軍企業(yè)(股票代碼:9678.HK)傳來重磅捷報——單日斬獲兩大核心項目中標佳績!攜手某頭部財險集團,一邊落地醫(yī)保資金監(jiān)管Agent搭建項目;一邊敲定醫(yī)保知
    的頭像 發(fā)表于 02-24 17:33 ?1680次閱讀

    發(fā)布山海·知音”大模型2.0,醫(yī)療AI加速落地驅(qū)動業(yè)績高增長

    今年1月,正式發(fā)布其自研大模型山海·知音
    發(fā)表于 02-06 10:28 ?303次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b>聲<b class='flag-5'>發(fā)布</b>“<b class='flag-5'>山海</b>·<b class='flag-5'>知音</b>”大<b class='flag-5'>模型</b><b class='flag-5'>2.0</b>,醫(yī)療AI加速落地驅(qū)動業(yè)績高增長

    與嘉會醫(yī)療達成戰(zhàn)略合作

    2月5日下午,國內(nèi)人工智能技術(shù)與服務(wù)領(lǐng)軍企業(yè)智能科技股份有限公司(以下簡稱“”)與中
    的頭像 發(fā)表于 02-06 09:05 ?997次閱讀

    榮登MedAIBench優(yōu)秀國產(chǎn)醫(yī)療大模型榜單

    12月20日,國家人工智能應(yīng)用中試基地(醫(yī)療)·浙江正式發(fā)布《MedAIBench測評榜(優(yōu)秀國產(chǎn)醫(yī)療大模型)》。在這一具備行業(yè)權(quán)威性與臨床導(dǎo)向性的嚴格測評中,
    的頭像 發(fā)表于 12-29 14:36 ?818次閱讀

    山海醫(yī)療大模型問鼎MedBench4.0三項榜首

    12月16日,中文醫(yī)療大模型權(quán)威評測平臺MedBench4.0發(fā)布最新評測結(jié)果。自主研發(fā)的“山海
    的頭像 發(fā)表于 12-29 14:35 ?3164次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b><b class='flag-5'>山海</b>醫(yī)療大<b class='flag-5'>模型</b>問鼎MedBench4.0三項榜首

    推出醫(yī)療領(lǐng)域?qū)<掖?b class='flag-5'>模型山海·醫(yī)大模型5.0”

    剛剛,正式推出醫(yī)療領(lǐng)域?qū)<壹壌?b class='flag-5'>模型全新力作——“山海?醫(yī)大
    的頭像 發(fā)表于 12-24 18:12 ?4238次閱讀

    入選2025中國AI大模型產(chǎn)業(yè)創(chuàng)新服務(wù)商TOP20榜單

    榮譽,(股票代碼:09678.HK)憑借自主研發(fā)的山海模型在技術(shù)創(chuàng)新、產(chǎn)業(yè)落地與生態(tài)構(gòu)建方面的卓越表現(xiàn),成功入選 "2025 中國
    的頭像 發(fā)表于 12-08 18:04 ?1785次閱讀

    多項業(yè)務(wù)營收大漲

    依托山海模型,不斷開拓陣地,開發(fā)了面向東盟等海外市場和國內(nèi)方言市場的語音大模型,
    的頭像 發(fā)表于 09-10 15:44 ?658次閱讀

    鴻之微發(fā)布鴻元AI大模型智能體2.0

    近日,“通信黃埔 數(shù)字臺州”產(chǎn)業(yè)交流大會在浙江省臺州市黃巖區(qū)隆重舉行。鴻之微董事長曹榮根博士攜鴻元AI 大模型智能體 2.0重磅亮相,并作《AI for Science 開啟新材料的生物制造之旅》主題演講。
    的頭像 發(fā)表于 07-10 17:29 ?1288次閱讀

    在港交所成功上市

    近日,智能科技股份有限公司(以下簡稱“”)于香港聯(lián)合交易所主板掛牌上市,股份代號:0
    的頭像 發(fā)表于 07-03 17:41 ?1047次閱讀

    與商湯科技達成戰(zhàn)略合作

    近日,智能科技股份有限公司(以下簡稱“”)與上海商湯智能科技有限公司(以下簡稱“商湯
    的頭像 發(fā)表于 06-20 14:52 ?978次閱讀

    榮登甲子光年2025中國AI產(chǎn)業(yè)逐浪者榜單

    近日,由甲子光年主辦的「AI共潮生·2025甲子引力X科技產(chǎn)業(yè)新風(fēng)向」在上海工業(yè)智能中心成功舉辦。憑借山海模型的領(lǐng)先技術(shù)實力與多領(lǐng)域
    的頭像 發(fā)表于 05-26 14:13 ?766次閱讀

    再度登頂MedBench榜單

    近日,中文醫(yī)療大模型權(quán)威評測平臺MedBench公布最新自測榜單結(jié)果,基于山海模型打造的
    的頭像 發(fā)表于 05-20 10:12 ?795次閱讀

    深度參與三項大模型國家標準編寫

    在人工智能技術(shù)加速落地的當(dāng)下,標準化建設(shè)已成為推動行業(yè)高質(zhì)量發(fā)展的關(guān)鍵因素。近日,參與編寫的3項人工智能大模型國家標準:20231736-T-469《人工智能 大
    的頭像 發(fā)表于 03-18 18:19 ?915次閱讀