91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

聲智科技全球首發(fā)新一代人機(jī)交互框架

聲智科技 ? 來(lái)源:聲智科技 ? 2025-05-12 10:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

全球人工智能產(chǎn)業(yè)正經(jīng)歷人機(jī)交互范式升級(jí)。過(guò)去兩個(gè)月中,以O(shè)penAI、Meta為代表的行業(yè)領(lǐng)軍企業(yè)加速推進(jìn)交互技術(shù)創(chuàng)新迭代,推動(dòng)產(chǎn)業(yè)進(jìn)入關(guān)鍵變革期。值得關(guān)注的是,a16z合伙人Olivia Moore與Anish Acharya在深度訪談中系統(tǒng)闡釋了"語(yǔ)音交互將成為AI應(yīng)用最具突破潛力的核心接口"這一戰(zhàn)略判斷,明確指出在消費(fèi)級(jí)市場(chǎng),語(yǔ)音交互極可能發(fā)展為用戶接觸AI系統(tǒng)的首要觸點(diǎn),甚至演進(jìn)為主導(dǎo)型交互模態(tài)。

作為聲學(xué)計(jì)算與人機(jī)交互領(lǐng)域的深耕者,聲智科技自創(chuàng)立以來(lái)始終致力于聲學(xué)計(jì)算與人機(jī)交互核心技術(shù)研發(fā)。在AIoT發(fā)展初期階段,公司即構(gòu)建起具備行業(yè)領(lǐng)先性的人機(jī)交互技術(shù)架構(gòu),成功賦能智能音箱、攝像頭等終端設(shè)備實(shí)現(xiàn)語(yǔ)音交互功能,形成"技術(shù)前瞻布局-產(chǎn)品快速迭代-市場(chǎng)精準(zhǔn)適配"的良性發(fā)展模式。

在全球化AI技術(shù)競(jìng)速背景下,聲智科技率先取得革命性突破。2025年5月正式發(fā)布了創(chuàng)新性論文《面向真實(shí)世界人機(jī)交互的非線性聲學(xué)計(jì)算與強(qiáng)化學(xué)習(xí)協(xié)同框架》。

論文題目:A Synergistic Framework of Nonlinear Acoustic Computing and Reinforcement Learning for Real-World Human-Robot Interaction

代碼鏈接:?https://github.com/soundai2016/nonlinear-acoustic-rl-hri

論文鏈接:https://arxiv.org/abs/2505.01998

論文首次提出與國(guó)際標(biāo)準(zhǔn)接軌的新一代真實(shí)世界人機(jī)交互框架,并同步公布全棧算法的測(cè)試數(shù)據(jù),多項(xiàng)指標(biāo)均處于業(yè)界領(lǐng)先水平。

876c97a0-2b61-11f0-9310-92fbcf53809c.png

以上數(shù)據(jù)來(lái)源于公開論文,對(duì) Azero、MMS/Llama、Qwen、GPT-4o、Seed 和 Deepseek 六家公司的系列模型在八項(xiàng)關(guān)鍵指標(biāo)(語(yǔ)音增強(qiáng)模型VEP、語(yǔ)音克隆模型TTS、語(yǔ)音識(shí)別中文模型ASR_ZH、語(yǔ)音識(shí)別英文模型ASR_EN、語(yǔ)言模型中文能力LLM_ZH、語(yǔ)言模型英文能力LLM_EN、聲音情感識(shí)別模型Emotion、聲學(xué)事件識(shí)別模型Event)上的統(tǒng)一測(cè)評(píng),結(jié)果顯示 Azero 以信號(hào)藍(lán)粗實(shí)線突出其卓越表現(xiàn):在聲學(xué)語(yǔ)音增強(qiáng)(VEP 95)和語(yǔ)音克隆合成質(zhì)量(TTS 98.42)上穩(wěn)居榜首,中英文識(shí)別準(zhǔn)確率分別達(dá)到 98.37% 和 94.88%,中文理解能力 87.2 分優(yōu)于多數(shù)競(jìng)品;值得一提的是,Azero 兼具實(shí)時(shí)的聲音情感和聲學(xué)事件識(shí)別能力,充分證明了其在遠(yuǎn)場(chǎng)聲學(xué)、語(yǔ)音克隆、多語(yǔ)交互及語(yǔ)言理解上的全棧算法與領(lǐng)先實(shí)力。

該研究突破傳統(tǒng)線性聲學(xué)模型限制,通過(guò)非線性計(jì)算與強(qiáng)化學(xué)習(xí)的協(xié)同優(yōu)化,成功實(shí)現(xiàn)復(fù)雜場(chǎng)景下的自適應(yīng)交互能力,為"AI融入真實(shí)世界(Real World Experience)"戰(zhàn)略目標(biāo)提供了關(guān)鍵技術(shù)支撐。在持續(xù)深化技術(shù)布局的同時(shí),聲智著力構(gòu)建基于聽覺(jué)感知的入口級(jí)技術(shù),致力于打造具備真實(shí)場(chǎng)景理解能力的人機(jī)交互架構(gòu),為下一代AI應(yīng)用產(chǎn)品落地提供底層技術(shù)架構(gòu)支持,推動(dòng)人機(jī)交互從"被動(dòng)接收"向"主動(dòng)感知"的跨越式發(fā)展。

87829672-2b61-11f0-9310-92fbcf53809c.png

全場(chǎng)景語(yǔ)音識(shí)別:

暢通真實(shí)世界的"溝通橋梁"

聲智科技在聲學(xué)信號(hào)處理領(lǐng)域的突破,本質(zhì)上是對(duì)"復(fù)雜環(huán)境聽覺(jué)能力"的革命性重構(gòu)。

噪聲抑制:

從 "可聽" 到 "聽清" 的質(zhì)變跨越

在對(duì)聲音降噪算法進(jìn)行深入分析時(shí),通常會(huì)在多種信噪比(SNR)條件下進(jìn)行系統(tǒng)測(cè)試——從極端低信噪比(如–5dB的強(qiáng)噪環(huán)境)到高信噪比(如20dB的低噪環(huán)境),并結(jié)合多種評(píng)測(cè)指標(biāo)(如PESQ、MOS-LQO、STOI、SDR等)來(lái)全面量化算法在不同噪聲強(qiáng)度與類型(白噪、Babble噪聲、交通噪聲、街道噪聲等)下的性能表現(xiàn)。通過(guò)對(duì)比各個(gè)SNR點(diǎn)上的語(yǔ)音清晰度、可懂度和音質(zhì)恢復(fù)效果,可以直觀地評(píng)估算法的低信噪比魯棒性、高信噪比分辨力以及對(duì)多場(chǎng)景噪聲的普適適應(yīng)能力。

在極端噪聲環(huán)境下,聲智噪聲分離模型可實(shí)現(xiàn)信噪比提升,首次在超高頻噪聲場(chǎng)景中實(shí)現(xiàn)"噪聲隔離級(jí)"清晰語(yǔ)音還原。

以下是聲智Azero算法在本次測(cè)試中展現(xiàn)的兩大核心優(yōu)勢(shì)特性。

一是極低信噪比魯棒性,在-5dB極低信噪比噪聲環(huán)境下,僅有Azero算法能夠處理 ,并且性能表現(xiàn)良好,具有更好的魯棒性和實(shí)時(shí)性。

二是多場(chǎng)景普適性,在Babble Noise、 Car Noise、Street Noise 等真實(shí)場(chǎng)景中,降噪性能均大幅領(lǐng)先海外降噪技術(shù)評(píng)測(cè)結(jié)果(詳見下圖藍(lán)色線條),且對(duì)噪聲類型的識(shí)別范圍更寬泛、在極低信噪比的惡劣環(huán)境下仍能進(jìn)行高清晰度的人聲增強(qiáng),真正實(shí)現(xiàn)"地鐵喧嘩中聽清耳語(yǔ),鬧市街頭精準(zhǔn)拾音"。

879e3350-2b61-11f0-9310-92fbcf53809c.png

聲音克?。?/p>

音色相似度與合成準(zhǔn)確率評(píng)測(cè)雙登頂

在聲音克隆技術(shù)中,AzeroTTS的SIM-O音色相似度達(dá)0.73,詞錯(cuò)率WER低至1.58%,MOS自然度評(píng)分4.01,等同于真實(shí)語(yǔ)音。對(duì)比LibriSpeech數(shù)據(jù)集,其內(nèi)容準(zhǔn)確率超越VALL-E2、VoiceBox等國(guó)際頂尖模型,在低成本的真實(shí)環(huán)境下能夠?qū)崿F(xiàn)"音色復(fù)刻如臨其境,內(nèi)容還原分毫不差"。自創(chuàng)始以來(lái),聲智科技十分注重面向真實(shí)場(chǎng)景的用戶服務(wù)落地,聲音克隆技術(shù)目前已在聲智APP上線,面向全球用戶不斷提升體驗(yàn)感。

87afc9da-2b61-11f0-9310-92fbcf53809c.png

情感感知:

實(shí)時(shí)捕捉人類情緒的"第六感官"

在強(qiáng)噪聲環(huán)境下,可精準(zhǔn)區(qū)分多種聲音情感及400+聲學(xué)環(huán)境事件(如爆竹聲、引擎轟鳴聲、嬰兒笑聲)。即使在車水馬龍的街頭,也能通過(guò)語(yǔ)音語(yǔ)調(diào)變化捕捉用戶的細(xì)微情緒,為智能設(shè)備賦予超強(qiáng)"共情力"。

毫秒級(jí)響應(yīng):

構(gòu)建低延遲交互基石

通過(guò)波束成形與殘差網(wǎng)絡(luò)優(yōu)化,在RTX6000Ada平臺(tái)上,平均RTF低至0.0375(A100為0.0487,RTX4090為0.0806),即使在30秒以上長(zhǎng)音頻處理中,RTF僅0.0101,真正滿足實(shí)時(shí)通話、直播降噪等毫秒級(jí)延遲敏感場(chǎng)景需求。

87dc601c-2b61-11f0-9310-92fbcf53809c.png

全場(chǎng)景語(yǔ)音識(shí)別:

暢通真實(shí)世界的"溝通橋梁"

聲智的語(yǔ)音技術(shù)優(yōu)勢(shì),不僅在于"聽得清",更在于"聽得準(zhǔn)""聽得懂"。

復(fù)雜噪聲精準(zhǔn)識(shí)別:

準(zhǔn)確率超越OpenAI

中文場(chǎng)景:在AISHELL-1數(shù)據(jù)集上,WER指標(biāo)優(yōu)于其他模型;AISHELL-2復(fù)雜場(chǎng)景下,領(lǐng)先行業(yè)平均水平。

英文場(chǎng)景:Fleurs數(shù)據(jù)集上WER指標(biāo)測(cè)評(píng)表現(xiàn)優(yōu)異,且不依賴大型語(yǔ)言模型做后處理校正,純模型原始輸出即達(dá)行業(yè)頂尖水平。

87ea7044-2b61-11f0-9310-92fbcf53809c.jpg

多種語(yǔ)言混雜識(shí)別:

真實(shí)場(chǎng)景21種語(yǔ)言識(shí)別準(zhǔn)確率90%+

在真實(shí)語(yǔ)言場(chǎng)景下,香港、新加坡、馬來(lái)西亞等具有典型多語(yǔ)系特征的區(qū)域,因其獨(dú)特的語(yǔ)言生態(tài)對(duì)智能系統(tǒng)的多語(yǔ)交互能力提出了更高要求。這些地區(qū)涉及不同語(yǔ)言變體的復(fù)雜轉(zhuǎn)換——香港的粵語(yǔ)夾雜英語(yǔ)詞匯的港式表達(dá)、新加坡融合福建方言的華語(yǔ)形態(tài)、馬來(lái)西亞帶有馬來(lái)語(yǔ)元素的華文語(yǔ)境,都要求語(yǔ)言識(shí)別技術(shù)具備深度文化適應(yīng)能力。

面向此種真實(shí)環(huán)境需求,聲智在Fleurs和CommonVoice兩個(gè)國(guó)際權(quán)威的多語(yǔ)種語(yǔ)音數(shù)據(jù)集上進(jìn)行了全面測(cè)試,實(shí)驗(yàn)結(jié)果表明,聲智的語(yǔ)音識(shí)別模型在不同語(yǔ)種下均表現(xiàn)出色,識(shí)別準(zhǔn)確率穩(wěn)定保持在90%以上。從歐洲小語(yǔ)種到亞洲地方語(yǔ)言,實(shí)現(xiàn)"一套模型,全球通聽"的跨語(yǔ)言識(shí)別與翻譯。

885568cc-2b61-11f0-9310-92fbcf53809c.jpg

"輕量""智答"語(yǔ)言模型:

讓機(jī)器學(xué)會(huì)"耳腦協(xié)同"的交互藝術(shù)

在新一代人機(jī)交互的技術(shù)架構(gòu)中,語(yǔ)言模型從"算力競(jìng)賽"轉(zhuǎn)向"效能突圍"?;诼晫W(xué)技術(shù)構(gòu)建的底層感知系統(tǒng),輕量級(jí)語(yǔ)言模型承擔(dān)著人機(jī)交互的"認(rèn)知中樞"角色,通過(guò)精準(zhǔn)的語(yǔ)義泛化、邏輯推理與意圖提煉,在低成本的算力條件下實(shí)現(xiàn)語(yǔ)音指令的高效解析與自然響應(yīng),構(gòu)建貼近真實(shí)場(chǎng)景的交互體驗(yàn)。這種"小而精"的技術(shù)路徑,使語(yǔ)言模型真正成為連接用戶需求與設(shè)備功能的效能樞紐,推動(dòng)人機(jī)交互從"技術(shù)堆砌"向"體驗(yàn)優(yōu)先"轉(zhuǎn)型,為智能硬件和AI應(yīng)用服務(wù)落地提供可持續(xù)的技術(shù)底座。

"小而精"技術(shù)路徑:

評(píng)測(cè)位列第一梯隊(duì)

AzeroGPT:依托數(shù)億級(jí)參數(shù)量基底,在權(quán)威榜單中表現(xiàn)亮眼;

C-Eval:人文社科領(lǐng)域、STEM領(lǐng)域排名靠前,超越多數(shù)語(yǔ)言大模型;

Livebenchcode_v5:輕量化設(shè)計(jì)使其算力需求遠(yuǎn)低于傳統(tǒng)大模型,性價(jià)比優(yōu)勢(shì)顯著。

8863b788-2b61-11f0-9310-92fbcf53809c.png

從技術(shù)構(gòu)想走向場(chǎng)景落地:

開啟主動(dòng)感知人機(jī)交互新紀(jì)元

“ 在人工智能技術(shù)高速迭代的今天,當(dāng)行業(yè)目光逐漸從模型參數(shù)競(jìng)賽轉(zhuǎn)向真實(shí)場(chǎng)景價(jià)值落地,聲智科發(fā)布的人機(jī)交互框架,正以"可落地、可驗(yàn)證、可生長(zhǎng)"的技術(shù)特質(zhì),打破"實(shí)驗(yàn)室技術(shù)"與"現(xiàn)實(shí)應(yīng)用"的壁壘,讓"機(jī)器理解人類"不再停留在理論構(gòu)想,而是成為觸手可及的交互體驗(yàn)。聲智的 "主動(dòng)感知" 框架深度錨定三大核心體驗(yàn)維度:"聞聲知意,懂你所需"、"聞聲辨境,知你所求"、"聽你所言,知你所想"。聲智的技術(shù)突圍,源于對(duì)"場(chǎng)景價(jià)值"的深度解構(gòu),通過(guò)非線性聲學(xué)計(jì)算技術(shù)穿透復(fù)雜環(huán)境噪聲,結(jié)合強(qiáng)化學(xué)習(xí)構(gòu)建場(chǎng)景化決策模型,形成"感知 - 理解 - 預(yù)測(cè) - 優(yōu)化"的閉環(huán)能力。這種"輕量架構(gòu) + 重場(chǎng)景適配"的設(shè)計(jì),在智能汽車、工業(yè)機(jī)器人、智慧醫(yī)療等領(lǐng)域?qū)崿F(xiàn)低成本快速部署,同時(shí)保持復(fù)雜環(huán)境指令解析準(zhǔn)確率。

智慧生活:

設(shè)備從"聽見"到"聽懂"再到"預(yù)判需求"

在智慧生活場(chǎng)景下使設(shè)備具備"聽覺(jué)認(rèn)知"能力,用戶可感知到設(shè)備從"被動(dòng)接收指令"轉(zhuǎn)變?yōu)?主動(dòng)適應(yīng)場(chǎng)景,核心技術(shù)閉環(huán)(聲學(xué)采樣→動(dòng)態(tài)優(yōu)化→環(huán)境分析→精準(zhǔn)輸出)能帶來(lái)核心生活場(chǎng)景革新,如通勤、辦公、居家等,從喧囂鬧市到靜謐空間,每一次聲音的處理都是"主動(dòng)感知"技術(shù)的生動(dòng)演繹,它正引領(lǐng)我們邁向面向真實(shí)世界的多場(chǎng)景自適應(yīng)人機(jī)交互新紀(jì)元,讓智慧感知深度融入生活,重塑每一個(gè)與聲音相伴的瞬間,為生活注入更智能、更貼心的體驗(yàn)。

智慧醫(yī)療健康:

個(gè)性化監(jiān)測(cè)與關(guān)懷

智慧醫(yī)療健康場(chǎng)景正呈現(xiàn)"感知-解析-響應(yīng)"全鏈路的突破性革新 。例如AI助聽設(shè)備可精準(zhǔn)處理環(huán)境音,濾除干擾,動(dòng)態(tài)補(bǔ)償個(gè)體聽覺(jué)差異,讓用戶清晰感知聲音,實(shí)現(xiàn)更貼心的健康關(guān)懷。當(dāng)用戶發(fā)現(xiàn)自己的咳嗽聲能被轉(zhuǎn)化為肺炎風(fēng)險(xiǎn)指數(shù),當(dāng)帕金森患者從語(yǔ)音震顫分析中獲得黃金干預(yù)期,當(dāng)?shù)胤椒窖圆辉俪蔀獒t(yī)患溝通壁壘,語(yǔ)音交互已超越工具屬性,成為貫穿預(yù)防-診斷-治療-康復(fù)全流程的醫(yī)療新界面。這種變革不僅體現(xiàn)在參數(shù)提升,更讓每個(gè)生命個(gè)體感知到:醫(yī)療健康服務(wù)開始真正"聽懂"并"理解"人類最自然的表達(dá)方式。

AI機(jī)器人:

聽覺(jué)系統(tǒng)的場(chǎng)景化演進(jìn)

AI機(jī)器人可通過(guò)聲學(xué)智能實(shí)現(xiàn)從物理執(zhí)行到環(huán)境共生的跨越式進(jìn)化,通過(guò)AI聲學(xué)降噪算法與AI聲學(xué)分類算法的處理,AI機(jī)器人能夠精準(zhǔn)捕捉真實(shí)世界的聲音信息,并對(duì)聲音事件與聲音情感進(jìn)行深度解析,實(shí)時(shí)構(gòu)建環(huán)境模型,讓機(jī)器人能夠理解所處的聲學(xué)環(huán)境。家庭服務(wù)機(jī)器人能根據(jù)廚房環(huán)境底噪中的燃?xì)庑孤┨卣饕籼崆?秒報(bào)警,當(dāng)教育機(jī)器人從兒童斷續(xù)抽泣聲中識(shí)別焦慮指數(shù)并切換安撫模式,人類正見證機(jī)器人突破物理傳感器的局限,它們不僅能“聽見”聲音,更能理解聲波背后隱藏的機(jī)器狀態(tài)、生理特征與情感意圖,這種基于聲學(xué)全息感知的交互進(jìn)化,讓人機(jī)協(xié)作從精準(zhǔn)響應(yīng)升級(jí)為預(yù)見性共融。

聲智科技在人機(jī)交互框架領(lǐng)域取得的技術(shù)突破,不僅體現(xiàn)在評(píng)測(cè)體系性能指標(biāo)的量化提升,更重要的是實(shí)現(xiàn)了從基礎(chǔ)功能實(shí)現(xiàn)到體驗(yàn)價(jià)值創(chuàng)造的全鏈路技術(shù)升級(jí)。伴隨全球AI產(chǎn)業(yè)的高速演進(jìn),工業(yè)機(jī)器人、智能汽車、精準(zhǔn)醫(yī)療及航天科技等戰(zhàn)略領(lǐng)域正面臨智能化升級(jí)的迫切需求。依托新一代人機(jī)交互框架的技術(shù)優(yōu)勢(shì),聲智通過(guò)構(gòu)建智能聽覺(jué)感知系統(tǒng)與決策中樞系統(tǒng)的深度協(xié)同,以非線性聲學(xué)計(jì)算為技術(shù)底座,推動(dòng)AI交互范式從被動(dòng)響應(yīng)向主動(dòng)認(rèn)知演進(jìn)。該系統(tǒng)不僅能實(shí)現(xiàn)毫秒級(jí)實(shí)時(shí)需求響應(yīng),更通過(guò)多模態(tài)行為建模與預(yù)測(cè)算法,在用戶需求顯性化前完成服務(wù)預(yù)判。

我們創(chuàng)新性地將非線性聲學(xué)計(jì)算與深度強(qiáng)化學(xué)習(xí)相結(jié)合,構(gòu)建出具備環(huán)境認(rèn)知與意圖推理能力的智能交互系統(tǒng)。這種技術(shù)融合使機(jī)器系統(tǒng)突破傳統(tǒng)規(guī)則引擎的限制,形成場(chǎng)景自適應(yīng)的動(dòng)態(tài)決策能力:通過(guò)實(shí)時(shí)聲場(chǎng)建模準(zhǔn)確解析物理環(huán)境特征,結(jié)合強(qiáng)化學(xué)習(xí)算法持續(xù)優(yōu)化交互策略,最終實(shí)現(xiàn)"場(chǎng)景理解-用戶認(rèn)知-行為預(yù)判"的三維智能閉環(huán)。這種進(jìn)化將重新定義人機(jī)交互范式,使智能設(shè)備具備情境感知與自主決策能力,推動(dòng)智能服務(wù)向認(rèn)知智能階段演進(jìn)。

值得強(qiáng)調(diào)的是,真實(shí)場(chǎng)景數(shù)據(jù)與用戶體驗(yàn)指標(biāo)的深度融合正成為技術(shù)迭代的核心驅(qū)動(dòng)力。聲智建立的"數(shù)據(jù)-算法-體驗(yàn)"協(xié)同進(jìn)化機(jī)制,不僅加速非線性聲學(xué)模型的場(chǎng)景適應(yīng)能力,更通過(guò)強(qiáng)化學(xué)習(xí)框架實(shí)現(xiàn)交互策略的持續(xù)優(yōu)化。這種雙向賦能的技術(shù)路徑,正在重塑人機(jī)協(xié)作的底層邏輯,為各行業(yè)智能化轉(zhuǎn)型提供可進(jìn)化的認(rèn)知中樞系統(tǒng)。但我們需要清醒認(rèn)識(shí)到,真正的真實(shí)世界體驗(yàn)?zāi)P蜕形凑嬲涞兀貏e是在物理規(guī)律約束建模、多模態(tài)感知融合等關(guān)鍵領(lǐng)域仍存在突破空間,AI時(shí)代才剛剛開始。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    31076

    瀏覽量

    222201
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39774

    瀏覽量

    301372
  • 聲智科技
    +關(guān)注

    關(guān)注

    0

    文章

    84

    瀏覽量

    2227

原文標(biāo)題:聲智全球首發(fā)新一代人機(jī)交互框架:非線性聲學(xué)與強(qiáng)化學(xué)習(xí)讓AI融入真實(shí)世界

文章出處:【微信號(hào):聲智科技,微信公眾號(hào):聲智科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    從“人機(jī)交互”到“數(shù)字預(yù)演”:詳解 HMI、SCADA 與虛擬調(diào)試的閉環(huán)架構(gòu)

    從“人機(jī)交互”到“數(shù)字預(yù)演”:詳解 HMI、SCADA 與虛擬調(diào)試的閉環(huán)架構(gòu)
    的頭像 發(fā)表于 03-05 11:36 ?49次閱讀
    從“<b class='flag-5'>人機(jī)交互</b>”到“數(shù)字預(yù)演”:詳解 HMI、SCADA 與虛擬調(diào)試的閉環(huán)架構(gòu)

    中科創(chuàng)達(dá)旗下Rightware攜手高通發(fā)布智能汽車人機(jī)交互解決方案

    在2026年國(guó)際消費(fèi)電子展(CES 2026)上,中科創(chuàng)達(dá)旗下Rightware攜手高通技術(shù)公司正式發(fā)布了款具有開創(chuàng)性的智能汽車人機(jī)交互(HMI)解決方案——IntelliSphere
    的頭像 發(fā)表于 01-16 14:59 ?1941次閱讀

    谷東智能PVG光波導(dǎo)驅(qū)動(dòng)下一代人機(jī)交互

    1月11日-13日,第九屆深商盛典暨中國(guó)企業(yè)家俱樂(lè)部成立20周年活動(dòng)在深圳舉行。
    的頭像 發(fā)表于 01-15 11:12 ?526次閱讀

    時(shí)識(shí)科技CES 2026趨勢(shì)看點(diǎn)前瞻

    隨著CES 2026在拉斯維加斯揭幕,全球科技焦點(diǎn)再度匯聚于下一代人機(jī)交互的突破,智能設(shè)備正從“視覺(jué)呈現(xiàn)”邁向“感知融合”,類腦視覺(jué)憑借低功耗、毫秒級(jí)響應(yīng)等優(yōu)勢(shì),正成為實(shí)現(xiàn)自然實(shí)時(shí)交互、推動(dòng)產(chǎn)業(yè)升級(jí)的關(guān)鍵路徑。
    的頭像 發(fā)表于 01-09 14:22 ?416次閱讀

    澎峰科技榮獲2025新一代人工智能創(chuàng)業(yè)大賽總決賽二等獎(jiǎng)

    12月18日,由網(wǎng)易傳媒主辦的“2025新一代人工智能創(chuàng)業(yè)大賽”總決賽在北京網(wǎng)易大廈圓滿落幕。經(jīng)過(guò)多輪激烈角逐與專家評(píng)審,澎峰科技憑借其創(chuàng)新的技術(shù)方案與扎實(shí)的產(chǎn)業(yè)落地能力,在眾多優(yōu)秀項(xiàng)目中脫穎而出,榮獲大賽總決賽二等獎(jiǎng)。
    的頭像 發(fā)表于 12-28 10:24 ?341次閱讀

    智科技攜手英飛凌探討新一代聲學(xué)感知技術(shù)方案

    近日,智科技與全球半導(dǎo)體巨頭英飛凌Power&Sensor System團(tuán)隊(duì)在德國(guó)總部舉行了戰(zhàn)略會(huì)議。雙方圍繞新一代聲學(xué)感知技術(shù)方案和面向全球市場(chǎng)的新產(chǎn)品研發(fā)進(jìn)行了深入探討。會(huì)議聚焦
    的頭像 發(fā)表于 12-04 15:58 ?724次閱讀

    CIE全國(guó)RISC-V創(chuàng)新應(yīng)用大賽 呼吸機(jī)人機(jī)交互系統(tǒng)

    原有呼吸機(jī)人機(jī)交互系統(tǒng)基于 imx6Q 芯片進(jìn)行設(shè)計(jì)開發(fā),為進(jìn)步優(yōu)化系統(tǒng)性能、降低硬件成本,并拓展硬件的擴(kuò)展性與兼容性,本次試用選擇進(jìn)迭時(shí)空的 MUSE Pi Pro 開發(fā)板進(jìn)行適配改造,目標(biāo)
    發(fā)表于 11-12 15:07

    眼電EOG人機(jī)交互會(huì)是未來(lái)交互種主流嗎?

    HUIYING基于眼電的人機(jī)交互系統(tǒng)概述基于眼電(EOG)的人機(jī)交互系統(tǒng)(HMI)的研發(fā)源于對(duì)非侵入式、高精度且持久可穿戴的醫(yī)療輔助設(shè)備的需求。傳統(tǒng)人機(jī)交互方式如觸摸屏、操縱桿或基于肌電(EMG
    的頭像 發(fā)表于 11-07 18:01 ?5883次閱讀
    眼電EOG<b class='flag-5'>人機(jī)交互</b>會(huì)是未來(lái)<b class='flag-5'>交互</b>的<b class='flag-5'>一</b>種主流嗎?

    重構(gòu)未來(lái)自適應(yīng)人機(jī)交互的創(chuàng)新技術(shù)

    人機(jī)交互的概念可以追溯到工業(yè)革命時(shí)期,在當(dāng)時(shí)機(jī)器開始取代人類勞動(dòng)。然而,直到20世紀(jì)中葉,人機(jī)交互領(lǐng)域才受到廣泛關(guān)注。人機(jī)界面(HMI)是人與機(jī)器之間
    的頭像 發(fā)表于 10-31 16:30 ?1246次閱讀
    重構(gòu)未來(lái)自適應(yīng)<b class='flag-5'>人機(jī)交互</b>的創(chuàng)新技術(shù)

    邊聊安全 | 人機(jī)交互對(duì)功能安全的影響

    上海磐時(shí)PANSHI“磐時(shí),做汽車企業(yè)的安全智庫(kù)”人機(jī)交互對(duì)功能安全的影響HMI,HumanMachineInterface,也就是大家熟知的人機(jī)接口。近年來(lái),HMI的功能也隨著汽車智能化的發(fā)展
    的頭像 發(fā)表于 09-05 16:21 ?21次閱讀
    邊聊安全 | <b class='flag-5'>人機(jī)交互</b>對(duì)功能安全的影響

    人機(jī)交互:連接人類與數(shù)字世界的橋梁

    )等技術(shù)的發(fā)展,人機(jī)交互已經(jīng)從傳統(tǒng)的鍵盤鼠標(biāo)操作,演進(jìn)為語(yǔ)音識(shí)別、手勢(shì)控制、腦機(jī)接口等更自然、更智能的交互方式。 ? 人機(jī)交互的發(fā)展歷程 早期的人機(jī)交互主要依賴命令行界面(CLI),用
    的頭像 發(fā)表于 08-11 15:21 ?2070次閱讀

    蘇州唯理科技神經(jīng)腕帶肌電臂環(huán)人機(jī)交互演示

    人機(jī)交互
    jf_74911425
    發(fā)布于 :2025年07月08日 22:02:34

    聲學(xué)技術(shù)如何重構(gòu)人機(jī)交互生態(tài)

    人機(jī)交互的底層邏輯。隨著非線性聲學(xué)計(jì)算與強(qiáng)化學(xué)習(xí)的深度融合,聲音交互正從“聽得見”邁向“聽得懂”,并逐漸成為 AI 時(shí)代的重要接口。
    的頭像 發(fā)表于 04-14 13:50 ?1270次閱讀

    智科技重新定義下一代人機(jī)交互標(biāo)準(zhǔn)

    日前,OpenAI發(fā)布三款語(yǔ)音模型,首次提出"開發(fā)者可控制語(yǔ)音情緒"的概念,引發(fā)行業(yè)對(duì)語(yǔ)音交互未來(lái)形態(tài)的討論。然而,國(guó)內(nèi)外測(cè)評(píng)顯示,其生成的中文語(yǔ)音仍顯生硬,與國(guó)內(nèi)技術(shù)存在明顯差距。這背后揭示了個(gè)更深層的命題:情緒化語(yǔ)音的核心不在于文本轉(zhuǎn)譯技術(shù),而在于聲學(xué)底層能力的突破
    的頭像 發(fā)表于 04-01 14:14 ?887次閱讀

    為什么開關(guān)柜人機(jī)交互裝置集成鍵順控,可以替代開關(guān)柜操顯裝置

    蜀瑞創(chuàng)新科普:開關(guān)柜人機(jī)交互裝置集成鍵順控在功能集成與簡(jiǎn)化操作、智能化與遠(yuǎn)程監(jiān)控以及可靠性與安全性等方面均表現(xiàn)出顯著優(yōu)勢(shì)。這些優(yōu)勢(shì)使得集成鍵順控的人機(jī)交互裝置能夠替代傳統(tǒng)的開關(guān)柜智
    的頭像 發(fā)表于 03-07 10:21 ?1303次閱讀
    為什么開關(guān)柜<b class='flag-5'>人機(jī)交互</b>裝置集成<b class='flag-5'>一</b>鍵順控,可以替代開關(guān)柜操顯裝置