基于語音的技術將對許多行業(yè)產生巨大影響,在短短兩年內,預計50%的搜索將基于語音技術。
該項技術的普及率可能因用戶的年齡、地理位置和讀寫能力而有所不同,但一些市場和平臺已擁有很高的滲透率,而全球10%的搜索已經是基于語音的搜索。
在這一領域將會出現新的贏家和輸家,而現有品牌將需要考慮到在收購過程中失去對消費者對話的控制的影響,這加大了在競爭中脫穎而出的難度。
然而,語音界面為各品牌提供了前所未有的機會,讓它們能以一種極為強大的新方式與消費者進行互動,而目前來說,很少有品牌利用到了這一點。
當前廣泛使用的功能在范圍和用途上均受到限制。就開發(fā)創(chuàng)新的內容和體驗,以及全新的服務來說,現下各品牌仍有機會。
那些能在此情景下崛起的品牌,在提升市場份額方面處于有利地位。此外,市面上有許多工具,讓用戶可以用最低限額的投資來輕松地進行語音實驗。
我們的建議是盡快開始一項服務設計和聲音試驗的低投資計劃,可能還要與市場推廣活動相結合,以便讓你的品牌充分利用這項技術所帶來的機遇。
我們所說的“語音”是什么意思?
在本文的語境中,我們對“語音”的定義是自動化的語音服務。它涵蓋了從交互式文字到實用工具內的所有信息,內置于定制的硬件設備,以及手機和云端應用內的各種應用,可通過品牌產品或人工智能行業(yè)內的幾大公司的虛擬助手來進行訪問。
很多關于基于語音的技術的宣傳都圍繞著智能音箱的普及(75%的美國家庭預計在2020年均擁有智能音箱),以及音響附帶的“語音助手”?,F在已有幾個公司允許第三方直接整合旗下的智能助理,有點像智能手機上的應用。
此外,需要注意的是,不論是上文提及的還是其他語音助手也可以在其他硬件(通常是手機和平板電腦)上使用,人們可通過手機應用和深度操作系統(tǒng)集成來使用,但也可以通過定制硬件設備,甚至是網站來使用語音助手。
從許多方面來看,語音和機器人背后的技術都是一樣的,但二者之間在生態(tài)系統(tǒng)和影響這兩方面的差異足以使語音技術成為一個非常重要的領域。
語音簡史
基于語音的交互界面已經存在了幾十年,盡管它們最具影響力的方面一直是客戶服務電話。大多數與語音相關的系統(tǒng)都遭遇了各種各樣的問題,從語音識別到復雜的生態(tài)系統(tǒng)。
五年前,行業(yè)領先的語音識別技術的準確率僅為75%左右,機器學習技術、系統(tǒng)和硬件的最新發(fā)展,使得最好的語音識別系統(tǒng)的準確率提高到了95%到97%。
不斷接近并跨過這一認知門檻成了當前語音產業(yè)繁榮的最大因素。人類識別口語詞匯的準確率約95%,并能使用語境來糾正錯誤。對于大多數用戶來說,任何具有較低識別準確率的自動化系統(tǒng)都會讓他們失望,因此這在商業(yè)上并不可行。
機器學習在意圖推導方面的相關發(fā)展(后文另作解釋),這也是產業(yè)繁榮的一個巨大貢獻因素。幾年前,這一功能的商業(yè)系統(tǒng)已經跨過了類似的門檻,并推動了機器人產業(yè)的繁榮;語音其實就是無文字版本的機器人。
機器人本身也已經存在了幾十年,但處理自然語言的能力,而不是簡單地識別關鍵字,才帶來了基于對話的互動,這反過來又推動了相關平臺和服務近期的爆炸式增長。
在當前的語音技術領域,虛擬自動化助理的崛起首屈一指。盡管Siri(以及其他一些不太知名的語音助理)已經推出多年,但Alexa和谷歌助理的崛起預示著一種更廣泛的平臺方式。
這些新出爐的助手會在一系列設備上推廣整個生態(tài)系統(tǒng)和功能,Alexa可以控制你的燈光,告訴你當天的會議是什么,并幫助你烹飪食譜上的菜品。
語音技術只是炒作嗎?
當然不是。的確,人們對語音技術的大肆宣傳,就像之前的3D打印和其他“改變我們生活方式的技術”的過度炒作一樣,但通過語音界面與計算機進行互動的趨勢將會持續(xù)下去。
除此之外,還有一系列極具說服力的統(tǒng)計數據,例如,超過20%的移動搜索已經是基于語音的搜索,并且,預計到2020年,這一比例將上升到50%?;蛟S更有趣的是,這些統(tǒng)計數據背后有一些原因也許更值得我們去探討。
在科技圈,人們經常說,未來初次上網的10億人中的大部分,其受教育水平很低,還很可能是文盲,因為“不發(fā)達”國家的人們也開始接觸互聯(lián)網。對于這些群體來說,視頻和聲音或許是最重要的,而且聲音可能是他們能接觸到的唯一雙向媒介。
此外,iPad效應還揭示出,即使是非常年幼的孩子,還握不住鼠標時也能與觸摸屏互動,而語音交互甚至能更快、更直觀與孩子互動(一旦有人可以說話),而且毫無疑問將成為幾年內某些功能的主要交互方式。
此外,也值得考慮到這其中涉及到的風險和利益,尤其是谷歌和亞馬遜這兩家分別在廣告收入和發(fā)掘新產品方面最強大的公司。亞馬遜進軍語音市場的舉動,已經對谷歌的利潤產生了明顯的影響,因為它使得搜索業(yè)務走出了網頁和谷歌廣告的覆蓋范圍,這也解釋了為什么谷歌要努力讓旗下的谷歌助手取得成功。
為了自身利益,谷歌可以利用他們現有的25億臺Android設備。隨著數字的不斷增長,你可以理解,到2021年預計將會有75億個已安裝使用的語音助理。在某些方面,對隱私和安全的擔憂會慢慢地被采納,我們將在本文的后續(xù)部分對此進行探討。
反對語音技術的一個常見言論是,對著設備大聲說話,尤其是在公共場合會讓人覺得怪異或者是尷尬(尤其是年齡大一點的人會這樣覺得,我們指的是20歲以上的人)。
BBH公司的觀點是,這些標準很快就會改變。例如,十年前,在大多數情況下,把手機放在餐桌上簡直是天方夜譚,如今,這可能是一種專注的表現(取決于細微差別),或者在某些情況下,在吃飯時接聽電話或寫短信也是可以接受的。
應用場景
語音正在迅速為產品和服務的技術接觸點的融合創(chuàng)造一個空間。從許多方面來看,這并不令人驚訝。使用我們的聲音進行交流的速度是打字的3倍,而且說話比打字要容易得多。
盡管它帶來了一種全新的社會規(guī)范,但這是一件很簡單的事情,用戶只要用30分鐘就可以輕松地享受這個全新的界面。
在某些情況下,聲音可以輕而易舉地打敗非語音輸入方式,比如手是濕的或者兩只手都空不出來,比如做飯和洗澡,或者眼睛只能專心干一件事時,比如駕駛,還有其他一些對于我們來說需要一定程度上使用我們的雙手和眼睛的事情。在這些情況下,使用語音輸入顯然更加輕松。
電子發(fā)燒友App














評論