91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

讓萬物聽說:亞馬遜Alexa語音交互系統(tǒng)背后的聲音

姚小熊27 ? 來源:與非網(wǎng) ? 作者:夏珍 ? 2020-06-17 14:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

“宿命”之說

“目前音頻壓縮算法的碼率日趨降低,研究空間相對(duì)較窄,主要是在某種算法的基礎(chǔ)上對(duì)特定應(yīng)用的改進(jìn)和定制。音頻信號(hào)的研究還可以在下列更廣闊的方向開展下去:基于信號(hào)模型的音頻內(nèi)容描述、特征提取、分類與檢索。這些研究可以作為多媒體數(shù)據(jù)庫研究的一個(gè)子課題,實(shí)現(xiàn)音頻數(shù)據(jù)庫的組織和管理,基于內(nèi)容的音頻點(diǎn)播等。在人機(jī)交互方面,音頻內(nèi)容的描述可以用于音頻一視頻信號(hào)處理(Audio 一 Visual Signal Processing),實(shí)現(xiàn)音視頻信號(hào)交互、信號(hào)對(duì)應(yīng)、信號(hào)關(guān)連等應(yīng)用。”

這段文字來源于 2003 年一篇題為《基于正弦+噪聲模型的寬帶音頻信號(hào)的表示與壓縮》的文章,是今天筆者要介紹的主人公——宋少鵬的碩士畢業(yè)論文節(jié)選。細(xì)讀這段文字,一個(gè)即將畢業(yè)的學(xué)生對(duì)音頻信號(hào)未來的發(fā)展是有積極想法的,我們似乎就可以清晰地看到這個(gè)年輕人將走上的職業(yè)生涯道路。

時(shí)間是最好的證明,這個(gè)從華南理工大學(xué)無線電系畢業(yè)的小伙子近 20 年來真的就只做了一件事,這件事就是音頻信號(hào)處理。常有人問他為什么喜歡這個(gè)領(lǐng)域、認(rèn)定這個(gè)方向的時(shí)候,他都會(huì)笑著答道,“兒時(shí)的興趣,我一直對(duì)聲波、電波充滿興趣,小時(shí)候聽黑膠唱片,聽磁帶,就一直想鉆進(jìn)去看看是誰在里面唱歌。此外,我的中文名字宋少鵬的拼音首字母縮寫是 SSP,而音頻信號(hào)處理(Sound Signal Processing)的英文首字母縮寫也是 SSP,因此這是一種宿命,很早就注定了的?!?/p>

我的職業(yè)生涯一路向前,沒有轉(zhuǎn)折

上面講到 2003 年宋少鵬碩士畢業(yè),這一年他放棄了大公司的 offer,選擇進(jìn)入一家以色列芯片公司 Zoran 做軟件開發(fā),鉆研音頻 DSP 技術(shù)。值得一提的是,全球第一個(gè)全套杜比單芯片解決方案就來自這家公司。

2010 年,他又去了微軟亞洲硬件中心,從事硬件產(chǎn)品的研發(fā)制造,經(jīng)手產(chǎn)品包括智能攝像頭、Kinnet 體感設(shè)備等。

就在 2012 年左右,他發(fā)現(xiàn)智能手機(jī)、電視、汽車都在向聯(lián)網(wǎng)化發(fā)展,由于給用戶帶來了豐富的內(nèi)容、社交和娛樂體驗(yàn),這些產(chǎn)業(yè)得到蓬勃發(fā)展。與此同時(shí),音頻設(shè)備卻還沒有聯(lián)網(wǎng),這在一個(gè)專業(yè)音頻從業(yè)者眼中,便是機(jī)遇。而眼前急切要弄清楚的是:如何聯(lián)網(wǎng)?如何承載娛樂和社交?

帶著這些思考,還在微軟供職的宋少鵬便尋找機(jī)會(huì)開始嘗試,這次嘗試不算成功,在他看來,原因有兩點(diǎn),一是當(dāng)時(shí)行業(yè)環(huán)境還不太成熟,二是大公司的體制存在一定的限制。

宋少鵬在后來接受利器的采訪時(shí)被問到職業(yè)生涯的轉(zhuǎn)折點(diǎn),他直言不諱地說:“我的職業(yè)生涯一路向前,沒有轉(zhuǎn)折?!币虼?,回溯到上述那次不太成功的嘗試,摸清原因,認(rèn)準(zhǔn)方向也是他職業(yè)道路上的收貨,當(dāng)然不止于此,他還結(jié)識(shí)了一幫志同道合的朋友。于是在 2013 年的某一天,他帶著這個(gè)團(tuán)隊(duì)毅然決然的開始了他們的創(chuàng)業(yè)闖蕩。

2014 年,米唐在深圳這個(gè)遠(yuǎn)離中國的政治和經(jīng)濟(jì)中心的灣區(qū)成立了,他喜歡那里自發(fā)式、民營式、創(chuàng)新型的經(jīng)濟(jì)模式,大家都來自江西、湖南、江蘇、四川、中國各地,移民所帶來的一些共同的特質(zhì),比如說勇敢、不屈服、創(chuàng)新,這些都與他的團(tuán)隊(duì)惺惺相惜。

從產(chǎn)品到解決方案,都在用心做“耳朵”

公司成立初期,產(chǎn)業(yè)的不成熟,加上創(chuàng)業(yè)公司交付能力的有限,使得米唐沒辦法短時(shí)間內(nèi)在語音交互領(lǐng)域拿出產(chǎn)品化的東西,基于訊飛 SDK 和谷歌 SDK 的嘗試又均不能滿足這個(gè)團(tuán)隊(duì)對(duì)產(chǎn)品體驗(yàn)的要求,而一家公司要生存下去就必須要有良好的資金回流,于是他們的第一款產(chǎn)品“方糖音箱”放棄了語音的交互,只保留了兩項(xiàng)特殊的“體感”操作方式:輕拍音箱頂部開始播放音樂或暫停,向左或向右傾斜切換上下曲目。

這款音箱通過 WiFi 連接上網(wǎng),可脫離手機(jī)獨(dú)立工作,并內(nèi)置了不少音樂電臺(tái),比如豆瓣電臺(tái)、荔枝 FM、還有一些國際電臺(tái),同時(shí)它還能記錄個(gè)人喜好,進(jìn)行智能推薦。若是用戶在互動(dòng)中能會(huì)心一笑,那在宋少鵬的眼中,除了趣味更是一種關(guān)懷帶來的暖意。

“產(chǎn)品就像藝術(shù)品,源于生活,高于生活,要從生活中抽象提煉需求,發(fā)掘人性。”這與宋少鵬以人性、人文觀點(diǎn)來思考產(chǎn)品設(shè)計(jì)的觀點(diǎn)高度契合。但生活要繼續(xù),公司更需發(fā)展,經(jīng)濟(jì)基礎(chǔ)決定上層建筑,即使方糖在 2015 年就開始銷往海外,并推出了同樣設(shè)計(jì)的藍(lán)牙音箱,以謀取更多的利潤,一年數(shù)萬臺(tái)的銷量還是顯得捉襟見肘。

作為一家始終觀察著這個(gè)領(lǐng)域的創(chuàng)業(yè)企業(yè),2015 年底,他們看到了亞馬遜的 Echo 和背后的 Alexa 語音交互系統(tǒng)。最初亞馬遜 Echo 以 MVP(最小可用原型)的形態(tài)交付用戶,語音識(shí)別和語義理解都僅能滿足流媒體播放的簡單需求,但是經(jīng)過一兩年的打磨,到了 2016 年,Echo 的體驗(yàn)就好了很多,它既可以提供音頻內(nèi)容,也可以提供生活服務(wù),包括音樂、電臺(tái)、有聲書、新聞、天氣、鬧鐘、日程等。這時(shí)候亞馬遜也將 Alexa 語音交互平臺(tái)開放出來,于是米唐團(tuán)隊(duì)在第一時(shí)間找到了亞馬遜。大概花了三四個(gè)月的時(shí)間,在眾多想接入 Alexa 的競爭者中,方糖成為首個(gè)通過亞馬遜認(rèn)證的第三方音箱產(chǎn)品。

“通過亞馬遜的認(rèn)證后,Alexa 團(tuán)隊(duì)的人就主動(dòng)找到了我,問我一年能夠賣多少,我說幾萬臺(tái),亞馬遜就說做他們的技術(shù)方案商,可以幫米唐一年賣幾百萬個(gè)解決方案”,宋少鵬回憶稱這是亞馬遜幫團(tuán)隊(duì)找到了方向。于是,一個(gè)擅長做技術(shù)的團(tuán)隊(duì),開始從做 C 端產(chǎn)品轉(zhuǎn)向做 B 端的方案,并決意將自己定位為聚焦海外市場(chǎng)的語音交互解決方案提供商。

“讓萬物聽說”是使命所在

目前,米唐的業(yè)務(wù)已擴(kuò)展到家用電器、汽車和消費(fèi)電子產(chǎn)品等多個(gè)領(lǐng)域,而其核心競爭力是他們的遠(yuǎn)場(chǎng)語音交互算法,在響應(yīng)速度、識(shí)別率、去噪、聲源定位和產(chǎn)品良率方面均做得還不錯(cuò)。

“作為創(chuàng)業(yè)狗,在哪都能工作。出差路上的飛行和堵車時(shí)的 YY 是獲得靈感的方式,出差的時(shí)候會(huì)帶一本書,和一個(gè)趁早筆記本。”宋少鵬如是說,“當(dāng)你做一個(gè)事情,真正站在場(chǎng)景和用戶的角度去思考,才有可能在價(jià)值上有所突破,而當(dāng)你受制于既得利益時(shí),其實(shí)會(huì)做很多束縛手腳的事情?!?/p>

未來的米唐會(huì)發(fā)展成怎樣,沒人可以預(yù)判,但“讓萬物聽說”會(huì)成為它和它背后的這個(gè)團(tuán)隊(duì)不變的使命。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • SSD
    SSD
    +關(guān)注

    關(guān)注

    21

    文章

    3122

    瀏覽量

    122322
  • 語音交互
    +關(guān)注

    關(guān)注

    3

    文章

    354

    瀏覽量

    29188
  • 亞馬遜
    +關(guān)注

    關(guān)注

    8

    文章

    2732

    瀏覽量

    85831
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    智能網(wǎng)關(guān):開啟萬物互聯(lián)的智慧新篇章

    。它不僅是技術(shù)進(jìn)步的產(chǎn)物,更是人類對(duì)美好生活追求的體現(xiàn)。隨著AI、6G、量子通信等技術(shù)的融合,智能網(wǎng)關(guān)將推動(dòng)萬物互聯(lián)向更深層次發(fā)展,為智能家居、工業(yè)4.0、智慧城市等領(lǐng)域注入持續(xù)動(dòng)能。 未來,每一個(gè)智能場(chǎng)景的背后,都將有一臺(tái)強(qiáng)大的智能網(wǎng)關(guān)在默默支撐。它或許不顯眼,卻正在改
    發(fā)表于 01-09 10:41

    芯知識(shí)|可錄音語音芯片如何實(shí)現(xiàn)聲音的儲(chǔ)存與重放?

    語音交互技術(shù)高速發(fā)展的今天,絕大多數(shù)設(shè)備的“聲音”功能仍停留在單向播報(bào)階段。然而,有一類特殊的語音芯片,不僅能讓設(shè)備“開口說話”,更能使其“聽見并記住”外界
    的頭像 發(fā)表于 01-08 09:44 ?228次閱讀
    芯知識(shí)|可錄音<b class='flag-5'>語音</b>芯片如何實(shí)現(xiàn)<b class='flag-5'>聲音</b>的儲(chǔ)存與重放?

    從感知到播放,WT2003H語音芯片完美適配不同類型傳感器,省事又省錢!

    聲音背后,其實(shí)蘊(yùn)含著一套完整的智能感知體系。今天的#唯創(chuàng)語音芯片小課堂,就讓我們一起走進(jìn)語音芯片和傳感交互的世界,看看它是如何
    的頭像 發(fā)表于 09-30 15:50 ?996次閱讀
    從感知到播放,WT2003H<b class='flag-5'>語音</b>芯片完美適配不同類型傳感器,省事又省錢!

    華為攜手共贏萬物互聯(lián)的智能時(shí)代

    ”,站在新的起點(diǎn)上,通過創(chuàng)新與開放,持續(xù)為產(chǎn)業(yè)創(chuàng)造新價(jià)值。鴻蒙智聯(lián)萬物,打造AI原生的全場(chǎng)景終端操作系統(tǒng);鯤鵬昇騰全面開源開放,為世界提供堅(jiān)實(shí)的算力底座;華為云做智能世界黑土地,加速千行業(yè)智能化;開放、合作、共贏,構(gòu)建可持續(xù)發(fā)
    的頭像 發(fā)表于 09-20 15:54 ?1835次閱讀

    “芯”聲代,智未來—VS680本地語音交互系統(tǒng) #語音交互 #芯片

    語音交互
    深蕾半導(dǎo)體
    發(fā)布于 :2025年09月17日 10:59:30

    IOTE聯(lián)網(wǎng)展|智聲賦能萬物,唯創(chuàng)知音【新】品齊聚深圳

    聯(lián)盛會(huì)啟幕,智聲創(chuàng)新登場(chǎng)8月27日至29日,IOTE聯(lián)網(wǎng)展會(huì)·深圳站在深圳國際會(huì)展中心(寶安新館)盛大啟幕,唯創(chuàng)知音以"智聲賦能萬物"為主題,攜六大核心產(chǎn)品線重磅亮相展位
    的頭像 發(fā)表于 08-29 12:03 ?1123次閱讀
    IOTE<b class='flag-5'>物</b>聯(lián)網(wǎng)展|智聲賦能<b class='flag-5'>萬物</b>,唯創(chuàng)知音【新】品齊聚深圳

    聯(lián)網(wǎng)云平臺(tái)的作用有哪些?萬物互聯(lián)

    、城市管理、民生服務(wù)等諸多領(lǐng)域的運(yùn)作模式。 一、設(shè)備互聯(lián)的“翻譯官”:打破異構(gòu)設(shè)備的通信壁壘 聯(lián)網(wǎng)的核心是“萬物互聯(lián)”,但現(xiàn)實(shí)中設(shè)備的多樣性和協(xié)議的碎片化,使得“連接”成為首要難題。聯(lián)網(wǎng)云平臺(tái)的首要作用,就是
    的頭像 發(fā)表于 08-07 18:00 ?1065次閱讀

    聯(lián)網(wǎng)設(shè)備也能‘開口說話’?Aircall實(shí)時(shí)通話功能讓智能交互觸手可及

    成為能‘聽懂’需求、‘說出’答案的智能伙伴。” 在萬物互聯(lián)的時(shí)代,語音通話是最自然的交互方式。 ? Air8000工業(yè)引擎Aircall功能:將復(fù)雜的通話流程簡化為三次點(diǎn)擊,為聯(lián)網(wǎng)設(shè)
    的頭像 發(fā)表于 07-07 09:26 ?832次閱讀
    <b class='flag-5'>物</b>聯(lián)網(wǎng)設(shè)備也能‘開口說話’?Aircall實(shí)時(shí)通話功能讓智能<b class='flag-5'>交互</b>觸手可及

    從‘指令接收器’到‘語音伙伴’:Aircall聯(lián)網(wǎng)設(shè)備實(shí)時(shí)通話能力落地!

    萬物互聯(lián)的時(shí)代,語音通話是最自然的交互方式。 Air8000工業(yè)引擎Aircall功能: 將復(fù)雜的通話流程簡化為三次點(diǎn)擊,為聯(lián)網(wǎng)設(shè)備賦予實(shí)時(shí)通話能力。其簡潔的API設(shè)計(jì)大幅降低開發(fā)門
    的頭像 發(fā)表于 07-06 16:12 ?551次閱讀
    從‘指令接收器’到‘<b class='flag-5'>語音</b>伙伴’:Aircall<b class='flag-5'>讓</b><b class='flag-5'>物</b>聯(lián)網(wǎng)設(shè)備實(shí)時(shí)通話能力落地!

    思必馳天穹3.0交互更自由隨心

    作為全屋智能語音交互系統(tǒng),天穹3.0基于思必馳中樞大模型構(gòu)建,融合了全鏈路語音交互技術(shù),采用“云端 + SDK”架構(gòu),云端有多個(gè)大模型協(xié)同運(yùn)
    的頭像 發(fā)表于 07-01 14:44 ?919次閱讀

    華為攜手產(chǎn)業(yè)伙伴共贏萬物智聯(lián)新時(shí)代未來

    ,IoT與AI融合共生智能無處不在、無所不達(dá)。他進(jìn)一步在發(fā)言中表示“實(shí)現(xiàn)萬物智聯(lián)需要具備三大關(guān)鍵要素:全場(chǎng)景物聯(lián),所有對(duì)象可連接;全超寬網(wǎng)絡(luò),所有數(shù)據(jù)聯(lián)云聯(lián)算;全智能加持,
    的頭像 發(fā)表于 06-23 16:53 ?1116次閱讀

    芯資訊|廣州唯創(chuàng)電子WTV系列語音芯片:以技術(shù)創(chuàng)新賦能智能語音交互

    萬物互聯(lián)的智能化時(shí)代,語音交互技術(shù)已成為人機(jī)交互的重要橋梁。廣州唯創(chuàng)電子深耕語音芯片領(lǐng)域多年,憑借自主研發(fā)的WTV系列
    的頭像 發(fā)表于 05-21 08:45 ?749次閱讀
    芯資訊|廣州唯創(chuàng)電子WTV系列<b class='flag-5'>語音</b>芯片:以技術(shù)創(chuàng)新賦能智能<b class='flag-5'>語音</b><b class='flag-5'>交互</b>

    從智能穿戴到智能家居:晶振如何賦能萬物互聯(lián)

    當(dāng)你輕觸智能手表查看心率,或是通過語音指令智能家居開啟燈光,背后都有一個(gè)微小卻至關(guān)重要的元件在默默發(fā)力——晶振。在萬物互聯(lián)的時(shí)代浪潮下,從貼身的智能穿戴設(shè)備到全屋智能生態(tài)
    的頭像 發(fā)表于 04-22 11:08 ?645次閱讀
    從智能穿戴到智能家居:晶振如何賦能<b class='flag-5'>萬物</b>互聯(lián)

    智能語音交互方案在客服領(lǐng)域的應(yīng)用

    在當(dāng)今數(shù)字化浪潮中,客服領(lǐng)域正經(jīng)歷著前所未有的變革,智能語音交互方案憑借其高效、便捷的特性,成為推動(dòng)這一變革的核心力量。其中,語音識(shí)別模型優(yōu)化私部署方案與語音合成
    的頭像 發(fā)表于 04-11 14:35 ?842次閱讀

    麻了!6440萬物聯(lián)網(wǎng)智慧路燈,我會(huì)……

    麻了!6440萬物聯(lián)網(wǎng)智慧路燈,我會(huì)……
    的頭像 發(fā)表于 04-10 08:43 ?750次閱讀
    麻了!6440<b class='flag-5'>萬物</b>聯(lián)網(wǎng)智慧路燈,我會(huì)……