美國專利商標(biāo)局(USPTO)授予Microsoft的一項新專利表明,該公司正在開發(fā)能夠反映用戶對話風(fēng)格和/或面部表情的對話代理。專利- 語言風(fēng)格匹配代理 -于2020年9月3日授予Microsoft,并以發(fā)明者Daniel J McDuff,Kael R. Rowan,Mary P Czerwinski,Deepali Aneja和Rens Hoegen稱號。
隨著語音識別和生成對話模型的發(fā)展,諸如聊天機(jī)器人和虛擬代理之類的對話界面正變得越來越流行。盡管這種自然語言的交互導(dǎo)致了人機(jī)交互的發(fā)展,但這種交流大多是單調(diào)的且受約束的。因此,這些對話最終只是事務(wù)性的,并不是很自然。
這項新的專利技術(shù)旨在帶來一種基于端到端基于語音的對話代理,該對話代理可以進(jìn)行更自然,多輪回的對話,從而與用戶的對話風(fēng)格和面部表情保持一致。
被實現(xiàn)為僅語音的代理或用臉部體現(xiàn)的會話代理可以與用戶的語音和面部表情匹配。可以通過識別用戶語音的韻律特征并為具有相同或相似特征的虛擬代理合成語音來實現(xiàn)會話代理的語言樣式匹配。用戶的面部表情可以通過具體化的對話代理的臉部來識別和模仿。虛擬代理的發(fā)言可以基于預(yù)定的腳本響應(yīng)和由機(jī)器學(xué)習(xí)技術(shù)生成的開放式響應(yīng)的組合。與用戶的會話風(fēng)格和面部表情保持一致的會話代理可能會被認(rèn)為更值得信賴,更容易理解,
對話代理可以是純音頻的,也可以是體現(xiàn)的,這意味著它具有看起來像在說話的“臉”。在這兩種實現(xiàn)方式中,代理可以使用機(jī)器學(xué)習(xí)技術(shù),并以自然且可理解的方式響應(yīng)用戶的話語,從而整體上改善人機(jī)交互。
-
人機(jī)交互
+關(guān)注
關(guān)注
12文章
1288瀏覽量
57942 -
語音識別
+關(guān)注
關(guān)注
39文章
1812瀏覽量
116064 -
聊天機(jī)器人
+關(guān)注
關(guān)注
0文章
348瀏覽量
13092
發(fā)布評論請先 登錄
端側(cè)大模型上車:從“語音助手”到“車內(nèi) AI 智能體”的躍遷革命
Nullmax感知規(guī)劃端到端大模型進(jìn)化提速
如何訓(xùn)練好自動駕駛端到端模型?
端到端智駕模擬軟件推薦——為什么選擇Keymotek的aiSim?
Nullmax端到端軌跡規(guī)劃論文入選AAAI 2026
自動駕駛中端到端仿真與基于規(guī)則的仿真有什么區(qū)別?
自動駕駛中常提的一段式(單段)端到端是個啥?
端到端語音交互數(shù)據(jù) 精準(zhǔn)賦能語音大模型進(jìn)階
自主工具鏈助力端到端組合輔助駕駛算法驗證
當(dāng)經(jīng)典IP撞上AI技術(shù):利爾達(dá)助力躍然創(chuàng)新推出全球首款端到端AI互動玩具
廣和通發(fā)布自研端側(cè)語音識別大模型FiboASR
一文帶你厘清自動駕駛端到端架構(gòu)差異
小米汽車端到端智駕技術(shù)介紹
一種基于端到端基于語音的對話代理
評論