互聯(lián)網發(fā)展至今,面對人工智能大時代的到來,智慧、高效、便捷的人工智能研發(fā)應用,發(fā)展智能產業(yè)成為科技行業(yè)工作的重中之重。協(xié)會特派記者走進深圳海岸語音技術有限公司,對石偉總經理進行了智能語音行業(yè)相關專訪。
深圳海岸語音技術有限公司創(chuàng)始人、總經理 石偉
記者:智能語音作為人工智能應用最成熟的技術之一,科技巨頭、初創(chuàng)公司紛紛布局,海岸語音是怎樣定位與布局?
石偉:從人機交互形式出發(fā),語音識別無疑是人工智能產品與用戶之間,最便捷有效的交流形式。語音交互技術鏈條較長,包括語音識別前端處理、語音識別、語義理解、語音合成等環(huán)節(jié)。在語音識別方面,百度、科大訊飛、谷歌等技術領先。我們主要做語音識別前端處理的技術,是一家專注于智能聽覺感知技術的人工智能初創(chuàng)企業(yè),面向物聯(lián)網和人工智能時代,提供軟、硬件結合加云端引擎的一體化智能聽覺感知技術解決方案。
記者:海岸語音的產品及應用有哪些?
石偉:有別于傳統(tǒng)的標量麥克風技術,我們產品所采用的是聲學矢量傳感技術,可同時測量聲場的聲壓信息和方向信息,該技術最早源于潛艇的矢量水聽器,在空氣中的應用極少。我們團隊歷經 8 年研發(fā),打造出 AI 時代必不可少的“機器耳朵”:VecSense ? 智能聲矢量傳感器。該傳感器是世界首款消費級聲矢量傳感器,可以應用在機器人、智能音箱、家電等諸多領域。
記者:海岸語音的核心競爭力體現(xiàn)在哪些方面?
石偉:把產品做小、成本做低(幾美元左右)是我們研發(fā)的方向。目前 VecSense ? 智能聲矢量傳感器比一毛錢硬幣還小三分之一,性能高、成本低、體積小的特性使其在智能語音、機器人、智能家居、無人機、穿戴式設備以及智能車載等領域都有廣闊的應用前景。
作為 AI 時代機器必備的器件之一,“機器耳朵”需要更多的信息實現(xiàn)其智能的特性,這是傳統(tǒng)的標量麥克風所面臨的局限性。雖然在聲學傳感器的發(fā)展史上,各大研究機構嘗試了通過多種方式獲取除了聲壓信息以外的聲音方向信息,但這些技術都具有各類不同的缺陷,使其無法在消費級產品中使用。
我們在小尺寸的單顆傳感器封裝內實現(xiàn)平面 360°聲音定向,并內置多種語言 / 音頻智能算法。不僅在聽音辨位、抑制干擾、遠場拾音方面表現(xiàn)出超強的性能,因其獨特的信號特性還能做到出色語音分離,讓智能機器同時聽懂多個說話人的指令。
在數(shù)量、尺寸、功耗和成本方面,一顆 VecSense ?傳感器對應四至八顆傳感器組成的麥克風陣列,顯然具有突出的優(yōu)勢:尺寸減少 70%,功耗降低 90%,同時成本可降低 90%。
記者:海岸語音發(fā)展過程中有遇到哪些困難?
石偉:目前我們產品還未正式推向市場,產品還在不斷地優(yōu)化,找到行業(yè)典型應用是將要面臨的一大挑戰(zhàn)。在未來推向市場的時候,產品的正式落地希望能夠找到知名度較高的產品或廠商背書,進一步打開市場。
記者:石總怎么看待科技巨頭與初創(chuàng)公司在智能語音領域的發(fā)展模式?
石偉:科技巨頭主要打造開發(fā)者生態(tài)系統(tǒng),使用算法平臺吸引開發(fā)者,實現(xiàn)數(shù)據(jù)的快速積累、產品的快速迭代。目前,在國內智能語音領域,科大訊飛是做得比較完善,一整條產業(yè)鏈相關技術產品都有涉及,并將自身語音技術植入相關合作伙伴的產品中,以推動智能語音和人工智能技術在家居、車載、可穿戴等領域的落地。
初創(chuàng)公司目前以垂直領域和細分場景為突破口,切入產品場景應用。初創(chuàng)企業(yè)不應求大、求全,而是結合自身優(yōu)勢做最“性感”的技術和產品。
記者:海岸語音未來有些什么規(guī)劃?
石偉:海岸語音目前專注語音識別前端處理,未來將從前端向一整條語音技術鏈條進行滲透,實現(xiàn)音頻和視頻融合的人機交互。我們會將底層的技術打包為完整的交互解決方案,服務 B 端客戶。
-
人機交互
+關注
關注
12文章
1291瀏覽量
58008 -
人工智能
+關注
關注
1819文章
50164瀏覽量
266023 -
智能語音
+關注
關注
11文章
827瀏覽量
50311
原文標題:對話 | 將聲矢量技術帶入消費級市場—專訪深圳海岸語音技術有限公司總經理石偉
文章出處:【微信號:SRA2009,微信公眾號:深圳市機器人協(xié)會】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
我們該如何理解“微加工”,納米級精度技術構成的重新解讀
MAC CE技術為什么能調整語音編碼速率
WT2605C語音芯片32級音量可調功能:重新定義音頻體驗
語音芯片白噪音支持功能詳解:打造舒適音頻體驗的關鍵技術 | 廣州唯創(chuàng)電子語音IC廠家
一款工業(yè)級MP3語音芯片介紹
語音識別系統(tǒng)的技術核心:從聲音到文字的智能轉換
語音機器人交互系統(tǒng):核心技術與應用挑戰(zhàn)
AP-0316 語音模組:不止是降噪神器,更是即插即用的 USB 聲卡全能王
藍牙語音遙控器:智能家居的智慧控制核心
藍牙語音遙控器 低功耗芯片選型HS6621CxC/OM6621
芯資訊|基于廣州唯創(chuàng)電子語音芯片的煙霧報警器語音方案技術解析
智能語音新風尚:WTK6900語音識別芯片賦能未來家居,讓涼爽觸“聲”可及
芯知識|廣州唯創(chuàng)電子語音芯片電流聲問題解析與解決方案
海岸語音石偉:聲矢量技術帶入消費級市場還遠遠不夠 我們的目標是整條語音技術鏈條
評論