91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

專利顯示蘋果正在研究如何利用音頻來估計設(shè)備與說話用戶的距離

璟琰乀 ? 來源:cnBeta.COM ? 作者:cnBeta.COM ? 2021-01-22 11:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

新專利顯示,蘋果正在研究HomePod或其他設(shè)備如何利用音頻來估計與說話用戶的距離,還可以識別周圍的聲音。蘋果的HomePod已經(jīng)很好地聽到了你的聲音,即使是在大聲播放音樂的時候?,F(xiàn)在新專利申請顯示,蘋果希望改進(jìn)這一點(diǎn),并將設(shè)備的聽覺能力,提升到一個新的水平。

一項(xiàng)是名為 “基于學(xué)習(xí)的距離估計”的專利,涉及到使用音頻不僅僅是為了識別用戶,而是為了弄清用戶的位置。蘋果在專利當(dāng)中表示,設(shè)備使用緊湊麥克風(fēng)陣列估計設(shè)備到用戶的距離,例如,設(shè)備可以根據(jù)用戶與設(shè)備的估計距離來調(diào)整播放音量或智能輔助設(shè)備的響應(yīng)。因此,如果用戶離設(shè)備非常近,音樂或語音將不會以高音量播放,另外,如果用戶離得很遠(yuǎn),媒體播放或智能助理設(shè)備的響應(yīng)可能會被調(diào)整到更大的音量。

這個想法也是為了改進(jìn)蘋果目前令人印象深刻但又有些缺陷的系統(tǒng),即多個蘋果設(shè)備都會嘗試確定你對哪個設(shè)備說了 “嘿,Siri”。對此,蘋果在專利當(dāng)中表示,在有多個設(shè)備的應(yīng)用場景中,設(shè)備之間可以相互協(xié)調(diào)或仲裁,根據(jù)每個設(shè)備到用戶的距離來決定哪一個或多個設(shè)備應(yīng)該回復(fù)查詢。

在專利當(dāng)中,蘋果提出了簡單和更復(fù)雜的解決方案,這些方案都可以協(xié)同使用。比較簡單的是讓設(shè)備像HomePod一樣,先繪制出環(huán)境圖。然后,它有效地?fù)碛幸粋€聲學(xué)環(huán)境中的測量或模擬點(diǎn)的網(wǎng)格。在這種情況下,就可以將聲音與這個 “網(wǎng)格 ”進(jìn)行對比,從而大致判斷出說話的人所在的位置。

如果這不夠好,蘋果還有另一個解決方案,它涉及 “基于學(xué)習(xí)的系統(tǒng),如深度神經(jīng)網(wǎng)絡(luò)(DNN),而且不需要多個設(shè)備互相協(xié)調(diào)幫助。蘋果在專利當(dāng)中表示,深度學(xué)習(xí)系統(tǒng)可以根據(jù)緊湊的麥克風(fēng)陣列接收到的語音信號,估計語音源在每個時間段的距離。這個DNN系統(tǒng)可以做的是確定什么是語音,什么是背景噪聲。然后,它可以計算出 關(guān)于直接信號傳播的信息,還可以計算出混響效應(yīng)和噪聲。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 音頻
    +關(guān)注

    關(guān)注

    31

    文章

    3190

    瀏覽量

    85610
  • 蘋果
    +關(guān)注

    關(guān)注

    61

    文章

    24600

    瀏覽量

    208410
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    蘋果Vision Pro的“隱形功臣”:揭秘頂級AR設(shè)備中導(dǎo)熱凝膠的精密應(yīng)用

    2025年,蘋果公司第二代VisionPro正式上市,憑借其在顯示精度、空間計算與交互體驗(yàn)上的全面升級,再次定義了高端增強(qiáng)現(xiàn)實(shí)(AugmentedReality,AR)設(shè)備的技術(shù)標(biāo)桿。然而,在這
    的頭像 發(fā)表于 01-27 11:17 ?697次閱讀
    <b class='flag-5'>蘋果</b>Vision Pro的“隱形功臣”:揭秘頂級AR<b class='flag-5'>設(shè)備</b>中導(dǎo)熱凝膠的精密應(yīng)用

    光纖20公里,網(wǎng)線250米,HT1001EK長距離傳輸無憂

    主機(jī)NVR、電腦、DVD等信號源 HDMI OUT 1個HDMI信號輸出口 連接高清電視機(jī)、拼接屏、投影機(jī)等顯示設(shè)備,實(shí)現(xiàn)信號環(huán)出 A-IN 3.5mm音頻輸入口 接入外部模擬音頻
    發(fā)表于 01-05 19:09

    雙目視覺是如何實(shí)現(xiàn)深度估計的?

    [首發(fā)于智駕最前沿微信公眾號]自動駕駛的純視覺方案中,單目攝像頭因無法直接感知深度,在環(huán)境理解上存在根本局限,雙目視覺技術(shù)在此需求下應(yīng)運(yùn)而生。它通過模擬人眼,利用雙攝像頭的視差推算距離,將二維圖像
    的頭像 發(fā)表于 12-31 09:45 ?515次閱讀
    雙目視覺是如何實(shí)現(xiàn)深度<b class='flag-5'>估計</b>的?

    如何用FPGA控制ADV7513實(shí)現(xiàn)HDMI畫面顯示音頻播放

    HDMI接口顯示使用DMT時序+TMDS編碼實(shí)現(xiàn)。當(dāng)用FPGA控制HDMI的數(shù)據(jù)傳輸時,通??梢圆捎眉僐TL實(shí)現(xiàn)TMDS算法或者使用專門的HDMI芯片(如ADV7513)這兩種方案完成。本文主要是介紹如何用FPGA控制ADV
    的頭像 發(fā)表于 12-02 11:05 ?6821次閱讀
    如何用FPGA控制ADV7513實(shí)現(xiàn)HDMI畫面<b class='flag-5'>顯示</b>和<b class='flag-5'>音頻</b>播放

    無人機(jī)遠(yuǎn)距離數(shù)傳圖傳設(shè)備技術(shù)的挑戰(zhàn)因素

    在無人機(jī)的遠(yuǎn)距離數(shù)傳中,選擇合適的設(shè)備至關(guān)重要。本文將深入探討適用于無人機(jī)遠(yuǎn)距離數(shù)傳的關(guān)鍵設(shè)備,包括通信模塊、數(shù)據(jù)鏈路系統(tǒng)等,幫助用戶了解如
    的頭像 發(fā)表于 12-01 15:33 ?348次閱讀
    無人機(jī)遠(yuǎn)<b class='flag-5'>距離</b>數(shù)傳圖傳<b class='flag-5'>設(shè)備</b>技術(shù)的挑戰(zhàn)因素

    飛易通——打破孤島,音頻互聯(lián) —無線音頻新紀(jì)元

    協(xié)議壁壘、兼容性差、延遲高以及無法實(shí)現(xiàn)多設(shè)備無縫切換等問題,導(dǎo)致不同的音頻設(shè)備之間形成“信息孤島”,嚴(yán)重影響了用戶的使用體驗(yàn)。 飛易通(Feasycom),作為全球領(lǐng)先的無線通信解決方案提供商,深知
    的頭像 發(fā)表于 10-13 14:20 ?435次閱讀
    飛易通——打破孤島,<b class='flag-5'>音頻</b>互聯(lián) —無線<b class='flag-5'>音頻</b>新紀(jì)元

    輕量化AI+AR顯示設(shè)備的新變局拉開帷幕

    在智能穿戴設(shè)備行業(yè)的激烈競爭中,每一次產(chǎn)品的推出與戰(zhàn)略的調(diào)整都如同投入湖面的巨石,激起層層漣漪。蘋果公司,這位科技領(lǐng)域的巨頭,其一舉一動都備受全球矚目。近期,蘋果公司在AI+AR顯示
    的頭像 發(fā)表于 08-19 11:19 ?1131次閱讀

    不止三折!華為新專利暗示四折屏設(shè)備已在路上?

    上周,華為正式公布一項(xiàng)名為“顯示方法、電子設(shè)備及可讀存儲介質(zhì)”的專利,針對三折疊及以上設(shè)備的交互邏輯提出革新方案,引發(fā)科技圈熱議。該專利通過
    的頭像 發(fā)表于 07-22 13:25 ?781次閱讀

    XR空間音頻革命:蘋果、三星推出新技術(shù),ASAF成Vision Pro最佳搭檔

    Audio)格式:Apple Spatial Audio Format(ASAF,蘋果空間音頻格式),可以用來打造真正沉浸式的音頻體驗(yàn)。 ? ASAF 通過確保使用聲學(xué)提示渲染
    的頭像 發(fā)表于 07-20 00:11 ?3119次閱讀

    大模型推理顯存和計算量估計方法研究

    過程中需要占用大量顯存,導(dǎo)致推理速度變慢,甚至無法進(jìn)行。 計算量過大:大模型的計算量較大,導(dǎo)致推理速度慢,難以滿足實(shí)時性要求。 為了解決這些問題,本文將針對大模型推理顯存和計算量的估計方法進(jìn)行研究。 二
    發(fā)表于 07-03 19:43

    蘋果發(fā)布的主動散熱專利,或?qū)㈤_啟移動電影攝影的未來

    在重新定義移動影像的征程中,蘋果或許剛剛暗示了一種革命性組合:一個影院級圖像傳感器,以及一套強(qiáng)大的新型主動散熱系統(tǒng)。YMCinema率先披露了蘋果具備20擋動態(tài)范圍的圖像傳感器專利,拼圖的各個碎片
    的頭像 發(fā)表于 06-27 07:20 ?970次閱讀
    <b class='flag-5'>蘋果</b>發(fā)布的主動散熱<b class='flag-5'>專利</b>,或?qū)㈤_啟移動電影攝影的未來

    神經(jīng)網(wǎng)絡(luò)RAS在異步電機(jī)轉(zhuǎn)速估計中的仿真研究

    眾多方法中,由于其結(jié)構(gòu)簡單,穩(wěn)定性好廣泛受到人們的重視,且已被用于產(chǎn)品開發(fā)。但是MRAS仍存在在低速區(qū)速度估計精度下降和對電動機(jī)參數(shù)變化非常敏感的問題。本文利用神經(jīng)網(wǎng)絡(luò)的特點(diǎn),使估計更為簡單、快速
    發(fā)表于 06-16 21:54

    紫光展銳T8300 5G SoC為用戶開創(chuàng)主流音頻新體驗(yàn)

    數(shù)字化時代,從語音通話到智能交互,從聆聽音樂到創(chuàng)作Vlog,聲音已成為隱形的基礎(chǔ)措施。日益發(fā)展的音頻技術(shù)正在重構(gòu)用戶感知世界的方式,重塑用戶的聽覺體驗(yàn)。
    的頭像 發(fā)表于 06-13 10:07 ?943次閱讀

    輪邊驅(qū)動電機(jī)專利技術(shù)發(fā)展

    摘要:利用輪邊電機(jī)直接驅(qū)動電動汽車采用輪邊電機(jī),避免了機(jī)械傳動系統(tǒng)中的能量損失,使電能得到了最大的利用。電動汽車采用輪邊直驅(qū)式可立即產(chǎn)生旋轉(zhuǎn)動力,減少了加速時間,并且對每個車輪實(shí)施單獨(dú)控制非常方便
    發(fā)表于 06-10 13:15

    智能報警器語音方案:NV512H全場景語音賦能,讓智能設(shè)備開口“說話

    智能報警器語音芯片開發(fā)隨著智能設(shè)備與物聯(lián)網(wǎng)技術(shù)日益成熟的今天,音頻播報功能已成為各類電子產(chǎn)品的標(biāo)配。無論是智能家居、工業(yè)生產(chǎn)、公共交通還是醫(yī)療養(yǎng)老等場所,用戶音頻內(nèi)容的個性化需求日益
    的頭像 發(fā)表于 05-24 15:06 ?616次閱讀
    智能報警器語音方案:NV512H全場景語音賦能,讓智能<b class='flag-5'>設(shè)備</b>開口“<b class='flag-5'>說話</b>”