91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

【解讀】VTX316 TTS語音合成芯片幾個(gè)很實(shí)用的應(yīng)用技巧

智能語音 ? 來源:智能語音 ? 作者:智能語音 ? 2024-05-13 16:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

前言
VTX316是北京宇音天下科技有限公司最新推出的一款更具性價(jià)比的中文TTS語音合成芯片,采用QFN32(4*4mm)封裝,體積更加精巧,文本合成一次高達(dá)500字節(jié)數(shù)據(jù)(250個(gè)漢字),支持8種發(fā)音風(fēng)格,支持低功耗模式(2uA)等等……
但大家在開發(fā)過程中,往往還會(huì)忽略一些比較實(shí)用的小技巧,認(rèn)識(shí)這些將給您的開發(fā)帶來極大的便利,下面給大家細(xì)致講解。

一、芯片回傳數(shù)據(jù)
回傳數(shù)據(jù)是TTS語音合成芯片主動(dòng)或被動(dòng)告訴上位機(jī)自己當(dāng)前所處的狀態(tài),方便開發(fā)者根據(jù)這些數(shù)據(jù)來判斷要執(zhí)行的任務(wù)。
但很多開發(fā)者對(duì)于數(shù)據(jù)回傳理解不是很透徹,造成語音合成芯片不能按照設(shè)計(jì)執(zhí)行下一步任務(wù)。
1、初始化回傳:0x4A
芯片在上電或是復(fù)位后,會(huì)主動(dòng)回傳帶有”0x4A“的數(shù)據(jù),只有接收到該數(shù)據(jù),表示語音芯片已經(jīng)初始化完成,可以開始執(zhí)行任務(wù)了。
注意:當(dāng)MCU沒有收到TTS芯片回傳的“0x4A”數(shù)據(jù)時(shí),芯片是不會(huì)執(zhí)行任何指令的!
2、命令接收成功回傳:0x41
當(dāng)上位機(jī)給TTS語音芯片發(fā)送指令后,會(huì)主動(dòng)回傳一個(gè)單字節(jié)數(shù)據(jù)“0x41”,代表命令接收成功,開始執(zhí)行。
3、命令接收失敗回傳:0x45
如TTS芯片接收到錯(cuò)誤命令幀時(shí),會(huì)主動(dòng)回傳一個(gè)單字節(jié)數(shù)據(jù)“0x45”,這時(shí)就需要開發(fā)者們查看命令幀是否準(zhǔn)確了,或是因其它干擾因素影響,需要重新發(fā)送指令。
4、芯片狀態(tài)回傳:0x4E、0x4F
VTX316 TTS語音合成芯片有2種工作狀態(tài):空閑狀態(tài)、忙時(shí)狀態(tài),可通過軟件“芯片忙閑查詢命令”,進(jìn)行查詢。
命令幀:0xFD 0x00 0x01 0x21

忙時(shí)狀態(tài):指芯片正在合成播音中,任務(wù)還未結(jié)束,此時(shí)查詢狀態(tài)會(huì)回傳一個(gè)單字節(jié)數(shù)據(jù)“0x4E”。
注意:芯片在忙時(shí)狀態(tài)下,用戶很容易犯這樣一個(gè)錯(cuò)誤
例如:當(dāng)前TTS芯片正在合成播音,此時(shí)MCU向TTS芯片發(fā)送一條指令,語音芯片會(huì)立即中斷當(dāng)前的合成任務(wù),從而執(zhí)行剛剛發(fā)來的新任務(wù)。為避免此類事件的發(fā)生,可以在發(fā)送指令前先查詢一下芯片的狀態(tài),如回傳“0x4F”(代表芯片處于空閑狀態(tài))再發(fā)送下一條指令。

空閑狀態(tài):也稱待機(jī)狀態(tài),此時(shí)查詢狀態(tài)會(huì)回傳一個(gè)單字節(jié)的數(shù)據(jù)“0x4F”。
注意:當(dāng)合成播音結(jié)束時(shí),也會(huì)主動(dòng)回傳一個(gè)單字節(jié)數(shù)據(jù)“0x4F”,表示合成完畢,進(jìn)入待機(jī)狀態(tài)了。

另外也可通過硬件查詢TTS芯片第6引腳“R/B”的電平來判斷語音合成芯片的忙閑狀態(tài)。
忙時(shí)狀態(tài):“R/B”為高電平。
空閑狀態(tài):“R/B”為低電平。

二、低功耗模式
對(duì)于要求極低功耗的應(yīng)用場(chǎng)景,開發(fā)者可選擇將TTS語音芯片進(jìn)入低功耗模式。
1、物理斷電
通常情況下開發(fā)者會(huì)采用上位機(jī)通過電源管理芯片控制語音合成芯片的供電腳“VCC”的通斷電(即工作完斷電,工作前上電)方案。
注意:采用此方案時(shí)需注意,芯片VCC管腳斷電后,要防止電流倒灌現(xiàn)象;另外,還要注意芯片上電后,待接收到TTS芯片回傳的“0x4A”后,再開始執(zhí)行任務(wù)。

2、DeepSleep模式
針對(duì)于上位機(jī)IO緊張的情況下,開發(fā)者也可以采用讓芯片進(jìn)入DeepSleep模式(睡眠模式),該模式下芯片功耗為2uA。
命令幀:FD 00 01 22
注意:TTS芯片進(jìn)入睡眠模式后,需先將芯片喚醒才能正常工作

喚醒方法有2種:
軟喚醒:喚醒命令幀0xFD 0x00 0x01 0xFF,其它指令也可以將語音合成芯片喚醒
硬喚醒:芯片15引腳(WAKEUP)下降沿信號(hào)喚醒
注意:芯片在睡眠時(shí),可能因串口抖動(dòng),造成誤喚醒;同樣還要注意芯片上電后,待接收到TTS芯片回傳的“0x4A”后,再開始執(zhí)行任務(wù)。

三、配置參數(shù)實(shí)時(shí)存儲(chǔ)
VTX316語音合成芯片的合成參數(shù)配置是實(shí)時(shí)存儲(chǔ)在芯片內(nèi)部的(掉電不會(huì)丟失),開發(fā)者們無需每次開機(jī)都重新配置其參數(shù),只需配置一次即可。

四、特殊參數(shù)配置
特殊參數(shù)配置是應(yīng)對(duì)不同功放芯片時(shí)序差異,解決上電和斷電時(shí)產(chǎn)生的POP雜音和句首丟音的問題。
本語音合成芯片支持修改3個(gè)特殊參數(shù):
1、去上電POP音延時(shí)參數(shù)
遇到上電有POP雜音時(shí),可增加此延時(shí)參數(shù)去除。
默認(rèn)值為0,調(diào)整范圍:0~200,即0~200ms。
注意:數(shù)值越小,芯片啟動(dòng)越快。

2、去句首丟音延時(shí)參數(shù)
遇到句首丟音時(shí),可增加此延時(shí)參數(shù)解決。
默認(rèn)值為0,調(diào)整范圍:0~250,即0~250ms。
注意:數(shù)值越小,出音響應(yīng)越快。

3、去句尾POP音延時(shí)參數(shù)
遇到句尾有POP雜音時(shí),可通過增加此延時(shí)參數(shù)去除。
默認(rèn)值為50,調(diào)整范圍:0~300,即0~300ms。
注意:值越小,合成播音完畢返回“0x4F”(空閑狀態(tài))越快。

五、提示音連播
VTX316TTS語音芯片預(yù)置多首提示音效(有些開發(fā)者稱為鈴聲),提示音效一般用于在語音播報(bào)前,起到前導(dǎo)提示的作用。
而大多的提示音效時(shí)長較短,我們可以通過多次播放同一提示音來實(shí)現(xiàn)一個(gè)較長提示音的效果,例如:“sound901”提示音,音效為蜂鳴器“滴”,時(shí)長為50ms。
如果我們想實(shí)現(xiàn)先播報(bào)3次“滴”,每次間隔100ms,再播報(bào)其它內(nèi)容,可以這樣做:
發(fā)送文本內(nèi)容:sound901[p100]sound901[p100]sound901,歡迎使用宇音天下語音合成芯片
注意:[p100]=100ms

希望這些小技巧能幫助廣大開發(fā)者們更好地理解和應(yīng)用VTX316 TTS語音合成芯片。如果有任何疑問或需要進(jìn)一步幫助,請(qǐng)隨時(shí)告訴我們。

審核編輯 黃宇


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 語音合成芯片
    +關(guān)注

    關(guān)注

    0

    文章

    27

    瀏覽量

    7841
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    4路TTS語音播報(bào)控制器:聯(lián)動(dòng)控制,音頻定時(shí)播放

    4路TTS語音播報(bào)控制器是一種能夠?qū)⑽谋拘畔⑥D(zhuǎn)換為語音并進(jìn)行播報(bào)的電子設(shè)備,具備4路相關(guān)控制功能。 通過語音合成技術(shù),將輸入的文字自動(dòng)
    的頭像 發(fā)表于 10-31 15:44 ?503次閱讀

    語音報(bào)警器:TTS語音播報(bào),云平臺(tái)邏輯自控

    TTS語音播報(bào)報(bào)警器是一種集成了傳統(tǒng)報(bào)警器和TTS(文本轉(zhuǎn)語音)技術(shù)的智能設(shè)備。清晰、準(zhǔn)確地用人類語言播報(bào)報(bào)警原因、位置、狀態(tài)等具體信息。 工作原理 文本
    的頭像 發(fā)表于 10-29 16:31 ?790次閱讀

    基于開源鴻蒙的語音識(shí)別及語音合成應(yīng)用開發(fā)樣例

    本期內(nèi)容由AI Model SIG提供,介紹了在開源鴻蒙中,利用sherpa_onnx開源三方庫進(jìn)行ASR語音識(shí)別與TTS語音合成應(yīng)用開發(fā)的流程。
    的頭像 發(fā)表于 08-25 14:26 ?4156次閱讀
    基于開源鴻蒙的<b class='flag-5'>語音</b>識(shí)別及<b class='flag-5'>語音</b><b class='flag-5'>合成</b>應(yīng)用開發(fā)樣例

    TTS文字合成語音芯片的使用場(chǎng)景

    TTS文字合成語音播報(bào)芯片的使用場(chǎng)景非常廣泛,可以適用于各行各業(yè),主要應(yīng)用于復(fù)雜的語音播報(bào)場(chǎng)景,下面小編帶大家一起來了解一下。 傳統(tǒng)的語音
    的頭像 發(fā)表于 08-22 17:11 ?1027次閱讀

    開源TTS應(yīng)用:打破技術(shù)壟斷,讓語音合成成為每個(gè)人的創(chuàng)造力工具

    傳統(tǒng)語音合成技術(shù)往往被巨頭壟斷,成本高且定制難。開源TTS應(yīng)用的誕生,徹底改變游戲規(guī)則。其開放源代碼讓中小企業(yè)、個(gè)人開發(fā)者乃至普通用戶都能低成本接入并改造語音技術(shù),將
    的頭像 發(fā)表于 08-15 14:03 ?628次閱讀
    開源<b class='flag-5'>TTS</b>應(yīng)用:打破技術(shù)壟斷,讓<b class='flag-5'>語音</b><b class='flag-5'>合成</b>成為每個(gè)人的創(chuàng)造力工具

    一顆TTS語音芯給產(chǎn)品增加智能語音播報(bào)能力

    一顆TTS語音芯片給產(chǎn)品增加智能語音播報(bào)能力 傳統(tǒng)語音播報(bào)芯片可以設(shè)置一些固定的
    的頭像 發(fā)表于 08-14 16:33 ?762次閱讀

    從開發(fā)工程師視角看TTS語音合成芯片

    從開發(fā)工程師視角看TTS語音合成芯片語音交互領(lǐng)域,TTS
    的頭像 發(fā)表于 08-13 14:52 ?854次閱讀

    Air8000 TTS開源,語音合成從此“零距離”!

    技術(shù)不應(yīng)有圍墻,創(chuàng)新需要共生長。Air8000宣布TTS應(yīng)用源代碼全面開放,開發(fā)者可自由定制語音風(fēng)格、優(yōu)化合成效果,讓文字與聲音的對(duì)話,不再受限于黑箱算法。 TTS (Text-to-
    的頭像 發(fā)表于 07-03 16:33 ?640次閱讀
    Air8000 <b class='flag-5'>TTS</b>開源,<b class='flag-5'>語音</b><b class='flag-5'>合成</b>從此“零距離”!

    從代碼到聲音,Air8000 TTS開源應(yīng)用開啟創(chuàng)作新紀(jì)元!

    Air8000顛覆傳統(tǒng)TTS開發(fā)模式,以開源之力重塑語音合成領(lǐng)域!獲取應(yīng)用源碼,開發(fā)者即可自由修改參數(shù)、適配多場(chǎng)景,讓文字與聲音的結(jié)合,迸發(fā)無限創(chuàng)意價(jià)值。 TTS (Text-to-S
    的頭像 發(fā)表于 06-27 17:06 ?592次閱讀
    從代碼到聲音,Air8000 <b class='flag-5'>TTS</b>開源應(yīng)用開啟創(chuàng)作新紀(jì)元!

    使用NVIDIA Triton和TensorRT-LLM部署TTS應(yīng)用的最佳實(shí)踐

    GPU 上,F(xiàn)5-TTS 模型每秒可生成長達(dá) 25 秒的音頻;Spark-TTS 在流式合成場(chǎng)景下,首包延遲可低至 200 余毫秒。
    的頭像 發(fā)表于 06-12 15:37 ?1929次閱讀
    使用NVIDIA Triton和TensorRT-LLM部署<b class='flag-5'>TTS</b>應(yīng)用的最佳實(shí)踐

    智能收銀語音交互新標(biāo)桿—WT3000T8語音合成芯片TTS技術(shù)應(yīng)用解析

    一、行業(yè)應(yīng)用背景在零售業(yè)態(tài)智能化轉(zhuǎn)型的浪潮中,收銀設(shè)備正經(jīng)歷從功能型向服務(wù)型轉(zhuǎn)變的關(guān)鍵階段。WT3000T8語音合成芯片應(yīng)運(yùn)而生,專為滿足新零售場(chǎng)景下智能收銀終端的語音交互需求而設(shè)計(jì)。
    的頭像 發(fā)表于 04-24 08:45 ?1080次閱讀
    智能收銀<b class='flag-5'>語音</b>交互新標(biāo)桿—WT3000T8<b class='flag-5'>語音</b><b class='flag-5'>合成</b><b class='flag-5'>芯片</b><b class='flag-5'>TTS</b>技術(shù)應(yīng)用解析

    WT3000TX語音合成芯片介紹V1

    WT3000TX是一系列功能強(qiáng)大的高品質(zhì)語音芯片,采用了高性能32位處理器、最高頻率可達(dá)240MHz。WT3000TX高集成度的語音合成芯片
    發(fā)表于 04-17 08:43 ?0次下載

    芯資訊|WT3000T8語音合成芯片TTS在智能收款機(jī)中的創(chuàng)新應(yīng)用設(shè)計(jì)方案介紹

    體驗(yàn)的關(guān)鍵模塊。廠家廣州唯創(chuàng)電子推出的WT3000T8作為新一代高性能語音合成芯片,憑借其優(yōu)異的處理能力和靈活的功能配置,正在為收款機(jī)智能化升級(jí)提供核心技術(shù)支持。
    的頭像 發(fā)表于 04-15 08:55 ?932次閱讀
    芯資訊|WT3000T8<b class='flag-5'>語音</b><b class='flag-5'>合成</b><b class='flag-5'>芯片</b><b class='flag-5'>TTS</b>在智能收款機(jī)中的創(chuàng)新應(yīng)用設(shè)計(jì)方案介紹

    【CW32模塊使用】語音合成播報(bào)模塊

    SYN6288E 中文語音合成芯片是北京宇音天下科技有限公司在 2010 年初推出的一款性/價(jià)比更高的 SYN6288 芯片的基礎(chǔ)上更改封裝方式的,效果更自然的一款中高端
    的頭像 發(fā)表于 03-29 17:25 ?1236次閱讀
    【CW32模塊使用】<b class='flag-5'>語音</b><b class='flag-5'>合成</b>播報(bào)模塊

    WT3000T8-32N語音合成TTS芯片:小體積、強(qiáng)性能,重塑智能語音交互體驗(yàn)

    在萬物互聯(lián)的智能化浪潮中,語音交互已成為人機(jī)交互的核心入口。廣州唯創(chuàng)電子推出的WT3000T8-32N語音合成芯片,憑借其4×4mm超小封裝、240MHz超強(qiáng)算力與多場(chǎng)景
    的頭像 發(fā)表于 03-21 09:20 ?1078次閱讀
    WT3000T8-32N<b class='flag-5'>語音</b><b class='flag-5'>合成</b><b class='flag-5'>TTS</b><b class='flag-5'>芯片</b>:小體積、強(qiáng)性能,重塑智能<b class='flag-5'>語音</b>交互體驗(yàn)