91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

海岸語音石偉:聲矢量技術帶入消費級市場還遠遠不夠 我們的目標是整條語音技術鏈條

h1654155972.5709 ? 來源:電子發(fā)燒友網 ? 作者:工程師譚軍 ? 2018-07-14 09:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

互聯(lián)網發(fā)展至今,面對人工智能大時代的到來,智慧、高效、便捷的人工智能研發(fā)應用,發(fā)展智能產業(yè)成為科技行業(yè)工作的重中之重。協(xié)會特派記者走進深圳海岸語音技術有限公司,對石偉總經理進行了智能語音行業(yè)相關專訪。

深圳海岸語音技術有限公司創(chuàng)始人、總經理 石偉

記者:智能語音作為人工智能應用最成熟的技術之一,科技巨頭、初創(chuàng)公司紛紛布局,海岸語音是怎樣定位與布局?

石偉:從人機交互形式出發(fā),語音識別無疑是人工智能產品與用戶之間,最便捷有效的交流形式。語音交互技術鏈條較長,包括語音識別前端處理、語音識別、語義理解、語音合成等環(huán)節(jié)。在語音識別方面,百度、科大訊飛、谷歌等技術領先。我們主要做語音識別前端處理的技術,是一家專注于智能聽覺感知技術的人工智能初創(chuàng)企業(yè),面向物聯(lián)網和人工智能時代,提供軟、硬件結合加云端引擎的一體化智能聽覺感知技術解決方案。

記者:海岸語音的產品及應用有哪些?

石偉:有別于傳統(tǒng)的標量麥克風技術,我們產品所采用的是聲學矢量傳感技術,可同時測量聲場的聲壓信息和方向信息,該技術最早源于潛艇的矢量水聽器,在空氣中的應用極少。我們團隊歷經 8 年研發(fā),打造出 AI 時代必不可少的“機器耳朵”:VecSense ? 智能聲矢量傳感器。該傳感器是世界首款消費級聲矢量傳感器,可以應用在機器人智能音箱、家電等諸多領域。

記者:海岸語音的核心競爭力體現(xiàn)在哪些方面?

石偉:把產品做小、成本做低(幾美元左右)是我們研發(fā)的方向。目前 VecSense ? 智能聲矢量傳感器比一毛錢硬幣還小三分之一,性能高、成本低、體積小的特性使其在智能語音、機器人、智能家居、無人機、穿戴式設備以及智能車載等領域都有廣闊的應用前景。

作為 AI 時代機器必備的器件之一,“機器耳朵”需要更多的信息實現(xiàn)其智能的特性,這是傳統(tǒng)的標量麥克風所面臨的局限性。雖然在聲學傳感器的發(fā)展史上,各大研究機構嘗試了通過多種方式獲取除了聲壓信息以外的聲音方向信息,但這些技術都具有各類不同的缺陷,使其無法在消費級產品中使用。

我們在小尺寸的單顆傳感器封裝內實現(xiàn)平面 360°聲音定向,并內置多種語言 / 音頻智能算法。不僅在聽音辨位、抑制干擾、遠場拾音方面表現(xiàn)出超強的性能,因其獨特的信號特性還能做到出色語音分離,讓智能機器同時聽懂多個說話人的指令。

在數(shù)量、尺寸、功耗和成本方面,一顆 VecSense ?傳感器對應四至八顆傳感器組成的麥克風陣列,顯然具有突出的優(yōu)勢:尺寸減少 70%,功耗降低 90%,同時成本可降低 90%。

記者:海岸語音發(fā)展過程中有遇到哪些困難?

石偉:目前我們產品還未正式推向市場,產品還在不斷地優(yōu)化,找到行業(yè)典型應用是將要面臨的一大挑戰(zhàn)。在未來推向市場的時候,產品的正式落地希望能夠找到知名度較高的產品或廠商背書,進一步打開市場。

記者:石總怎么看待科技巨頭與初創(chuàng)公司在智能語音領域的發(fā)展模式?

石偉:科技巨頭主要打造開發(fā)者生態(tài)系統(tǒng),使用算法平臺吸引開發(fā)者,實現(xiàn)數(shù)據(jù)的快速積累、產品的快速迭代。目前,在國內智能語音領域,科大訊飛是做得比較完善,一整條產業(yè)鏈相關技術產品都有涉及,并將自身語音技術植入相關合作伙伴的產品中,以推動智能語音和人工智能技術在家居、車載、可穿戴等領域的落地。

初創(chuàng)公司目前以垂直領域和細分場景為突破口,切入產品場景應用。初創(chuàng)企業(yè)不應求大、求全,而是結合自身優(yōu)勢做最“性感”的技術和產品。

記者:海岸語音未來有些什么規(guī)劃?

石偉:海岸語音目前專注語音識別前端處理,未來將從前端向一整條語音技術鏈條進行滲透,實現(xiàn)音頻和視頻融合的人機交互。我們會將底層的技術打包為完整的交互解決方案,服務 B 端客戶。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人機交互
    +關注

    關注

    12

    文章

    1291

    瀏覽量

    58008
  • 人工智能
    +關注

    關注

    1819

    文章

    50164

    瀏覽量

    266023
  • 智能語音
    +關注

    關注

    11

    文章

    827

    瀏覽量

    50311

原文標題:對話 | 將聲矢量技術帶入消費級市場—專訪深圳海岸語音技術有限公司總經理石偉

文章出處:【微信號:SRA2009,微信公眾號:深圳市機器人協(xié)會】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    我們該如何理解“微加工”,納米精度技術構成的重新解讀

    在于“穩(wěn)”。 當你的設備每分鐘發(fā)射數(shù)千萬個脈沖,第一個孔和第一千萬個孔的幾何一致性,才是衡量工藝水平的標尺。而要做到這一點,單靠硬件遠遠不夠。 這里就不得不提閉環(huán)控制的重要性。在納米加工中,熱漂移
    發(fā)表于 03-16 16:27

    MAC CE技術為什么能調整語音編碼速率

    隨著NR網絡的快速發(fā)展,5G語音業(yè)務快速增加,5G支持高清語音,需要從技術上讓語音編碼適應網絡覆蓋的技術,商用外場這種訴求越發(fā)強烈,VoNR
    的頭像 發(fā)表于 12-19 16:52 ?753次閱讀
    MAC CE<b class='flag-5'>技術</b>為什么能調整<b class='flag-5'>語音</b>編碼速率

    WT2605C語音芯片32音量可調功能:重新定義音頻體驗

    一、突破性音量調節(jié)技術1.1技術規(guī)格概述作為語音芯片領域的技術領先者,廣州唯創(chuàng)電子推出的WT2605C聲音播放芯片集成了32精確音量控制功
    的頭像 發(fā)表于 11-10 13:00 ?838次閱讀
    WT2605C<b class='flag-5'>語音</b>芯片32<b class='flag-5'>級</b>音量可調功能:重新定義音頻體驗

    語音芯片白噪音支持功能詳解:打造舒適音頻體驗的關鍵技術 | 廣州唯創(chuàng)電子語音IC廠家

    前言:探索語音芯片的白噪音技術世界在現(xiàn)代電子設備日益普及的今天,語音芯片的功能創(chuàng)新正在不斷豐富著我們的日常生活體驗。作為專業(yè)的語音IC廠家,
    的頭像 發(fā)表于 11-06 08:56 ?552次閱讀
    <b class='flag-5'>語音</b>芯片白噪音支持功能詳解:打造舒適音頻體驗的關鍵<b class='flag-5'>技術</b> | 廣州唯創(chuàng)電子<b class='flag-5'>語音</b>IC廠家

    一款工業(yè)MP3語音芯片介紹

    ,憑借其出色的性能與穩(wěn)定性,為娛樂設備提供了專業(yè)的音頻解決方案。(廣州語創(chuàng)專業(yè)語音芯片方案供應商) 核心技術優(yōu)勢 1. 高速響應與流暢體驗 YC686具備業(yè)界領先的指令響應速度: · 曲目播放響應
    發(fā)表于 09-08 10:33

    語音識別系統(tǒng)的技術核心:從聲音到文字的智能轉換

    ? ? ? 語音識別技術,也稱為自動語音識別(ASR),其核心目標是將人類語音信號轉換為對應的文本或指令。隨著人工智能的發(fā)展,
    的頭像 發(fā)表于 09-05 14:04 ?877次閱讀

    語音機器人交互系統(tǒng):核心技術與應用挑戰(zhàn)

    ? ? ? 語音機器人交互系統(tǒng)是融合多學科技術的復雜工程,其核心目標是實現(xiàn)人與機器間的自然、流暢語音對話。該系統(tǒng)已廣泛應用于智能客服、智能家居、企業(yè)助手等場景,其
    的頭像 發(fā)表于 09-02 11:08 ?898次閱讀

    瑞芯微RK3576語音識別算法

    1.語音識別簡介語音識別技術,也被稱為自動語音識別(AutomaticSpeechRecognition,ASR),其目標是將人類的
    的頭像 發(fā)表于 08-15 15:13 ?2266次閱讀
    瑞芯微RK3576<b class='flag-5'>語音</b>識別算法

    語音識別---大家怎么看呢?

    語音識別是一門交叉學科。近二十年來,語音識別技術取得顯著進步,開始從實驗室走向市場。人們預計,未來10年內,語音識別
    發(fā)表于 08-09 10:54

    AP-0316 語音模組:不止是降噪神器,更是即插即用的 USB 聲卡全能王

    。 聲卡性能,降噪消回音雙開掛作為 USB 聲卡,它的 “聲音處理力” 堪稱頂流: AI 降噪(最高 90dB):通過 USB 傳輸?shù)穆曇?,會先經過智能過濾 —— 風扇、鍵盤、窗外雜音全被
    發(fā)表于 07-18 10:06

    藍牙語音遙控器:智能家居的智慧控制核心

    和OM6621芯片的強大性能,開發(fā)者能夠輕松打造高品質的遙控器產品,滿足市場多樣化需求。未來,隨著技術的不斷突破,藍牙語音遙控器必將在智能家居領域綻放更大光芒,為用戶創(chuàng)造更便捷、舒適的生活方式。
    發(fā)表于 06-01 20:24

    藍牙語音遙控器 低功耗芯片選型HS6621CxC/OM6621

    HS6621CxC和OM6621芯片的強大性能,開發(fā)者能夠輕松打造高品質的遙控器產品,滿足市場多樣化需求。未來,隨著技術的不斷突破,藍牙語音遙控器必將在智能家居領域綻放更大光芒,為用戶創(chuàng)造更便捷、舒適的生活方式。
    發(fā)表于 05-22 15:23

    芯資訊|基于廣州唯創(chuàng)電子語音芯片的煙霧報警器語音方案技術解析

    在智能家居與物聯(lián)網(IoT)技術快速發(fā)展的背景下,語音播報功能已成為煙霧報警器等安防設備提升用戶體驗的核心技術之一。廣州唯創(chuàng)電子憑借其WTV、WTN、WT588F及WT2605C系列語音
    的頭像 發(fā)表于 04-21 08:54 ?769次閱讀
    芯資訊|基于廣州唯創(chuàng)電子<b class='flag-5'>語音</b>芯片的煙霧報警器<b class='flag-5'>語音</b>方案<b class='flag-5'>技術</b>解析

    智能語音新風尚:WTK6900語音識別芯片賦能未來家居,讓涼爽觸“”可及

    在人工智能技術飛速發(fā)展的今天,語音交互正以顛覆性的方式重塑我們的生活體驗。WTK6900系列語音識別芯片憑借其離線高性能、抗噪遠場識別、毫秒
    的頭像 發(fā)表于 04-08 08:43 ?1341次閱讀
    智能<b class='flag-5'>語音</b>新風尚:WTK6900<b class='flag-5'>語音</b>識別芯片賦能未來家居,讓涼爽觸“<b class='flag-5'>聲</b>”可及

    芯知識|廣州唯創(chuàng)電子語音芯片電流問題解析與解決方案

    語音芯片在播放音頻時出現(xiàn)電流是嵌入式音頻系統(tǒng)開發(fā)中的常見問題,直接影響用戶體驗。廣州唯創(chuàng)電子WT系列語音芯片在智能家居、工業(yè)控制等領域廣泛應用,本文將從PWM直推輸出與DAC+功放輸出兩類典型電路
    的頭像 發(fā)表于 03-28 08:44 ?2070次閱讀
    芯知識|廣州唯創(chuàng)電子<b class='flag-5'>語音</b>芯片電流<b class='flag-5'>聲</b>問題解析與解決方案