91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人機(jī)交互的未來 搜狗聯(lián)合清華天工研究院推出ChoreoNet模型

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2020-08-24 11:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

聲音與AI行為搭配在一起,會發(fā)生怎樣的化學(xué)反應(yīng)呢?這一話題,正在成為國內(nèi)外AI研究比較熱衷的新方向。

比如卡內(nèi)基·梅隆大學(xué)和CMU機(jī)器人研究所,就在研究聲音和機(jī)器人動作之間的相互作用;國內(nèi)則從數(shù)字人入手,搜狗分身技術(shù)團(tuán)隊(duì)聯(lián)合清華大學(xué)天工智能計(jì)算研究院賈珈老師團(tuán)隊(duì),率先展開了音頻驅(qū)動身體動作的研究。

近日二者共同發(fā)表的數(shù)字人技術(shù)論文《ChoreoNet: 基于舞蹈動作單元的音樂-舞蹈合成框架》,就被2020國際頂級盛會ACM Multimedia錄用為長文。

作為計(jì)算機(jī)領(lǐng)域諾貝爾獎——圖靈獎的評選機(jī)構(gòu),ACM(國際計(jì)算機(jī)學(xué)會Association for Computing Machinery)的業(yè)界地位不用贅述,旗下的ACM Multimedia也被認(rèn)為是多媒體技術(shù)領(lǐng)域奧運(yùn)級別的頂級盛會,論文接受率很低。

那么,能得到頂會的認(rèn)可,這一新技術(shù)究竟有哪些開創(chuàng)性呢?

聞聲起舞,“樂舞合成”是怎樣實(shí)現(xiàn)的?

讓數(shù)字人根據(jù)文本語義做出相對應(yīng)的面部表情及肢體動作,目前已經(jīng)有不少成熟的應(yīng)用,比如AI合成主播。如果再能夠跟隨音頻做出同步、自然的肢體反應(yīng),無疑會在多種場景中產(chǎn)生奇妙的化學(xué)反應(yīng)。

不過,隨聲而動這件事的難度在于,背后需要解決的技術(shù)問題不少,比如:

傳統(tǒng)音樂與舞蹈合成的方式是基線法,通過人體骨骼關(guān)鍵點(diǎn)的映射,但許多關(guān)鍵點(diǎn)難以捕捉和預(yù)測,就會出現(xiàn)高度冗余和噪聲,導(dǎo)致合成結(jié)果的不穩(wěn)定、動作節(jié)銜接不像真人。

后來,雅爾塔等學(xué)者也提出要通過AI的弱監(jiān)督學(xué)習(xí)來解決上述問題,但由于缺乏對人類舞蹈經(jīng)驗(yàn)知識的了解,依然會出現(xiàn)合成不夠自然、情感表達(dá)不夠流暢的問題。

另外,由于音樂片段比較長,背后伴隨著成千上萬的動作畫面,需要智能體記住并映射這種超長的序列也是一大挑戰(zhàn)。

搜狗及清華天工院研究團(tuán)隊(duì)所做的突破,就是將人類專業(yè)知識融入算法,提出了一個(gè)模仿人類舞蹈編排的程序ChoreoNet,來根據(jù)音樂生成動態(tài)優(yōu)美連貫、非線性高度擬真的舞蹈。

簡單來說,ChoreoNet是將專業(yè)舞者的各個(gè)動作單元與音樂旋律捕捉并數(shù)據(jù)化,然后讓AI在其中尋找規(guī)律,知道在怎樣的音樂節(jié)拍、旋律風(fēng)格中應(yīng)該做出怎樣的舞蹈動作,進(jìn)而形成連貫的動作軌跡。

其中,研究人員共突破了兩個(gè)環(huán)節(jié):

1.舞蹈知識化。用動作捕捉采集專業(yè)的人類舞者是如何根據(jù)音樂的節(jié)奏、旋律來編排動作的。研究人員收集了4種不同類型(恰恰、華爾茲、倫巴和探戈)的舞蹈數(shù)據(jù),數(shù)個(gè)音樂節(jié)拍裁剪出一個(gè)編舞動作單元(CAUs) 相對應(yīng)的片段,形成一個(gè)動作控制單元(CA),形成一個(gè)音樂與動作的映射序列。

2.之前采集的舞蹈動作只是人體骨骼關(guān)鍵點(diǎn)數(shù)據(jù),怎樣讓它們之間的連續(xù)過渡更加自然呢?研究人員借助NLP語義理解,讓AI可以根據(jù)積累的知識進(jìn)行實(shí)時(shí)反應(yīng)。利用GAN設(shè)計(jì)了一個(gè)運(yùn)動生成模型,讓AI可以繪制一些舞蹈動作,補(bǔ)上缺失的數(shù)據(jù),從而實(shí)現(xiàn)舞蹈的平滑過渡,產(chǎn)生自然的效果。

實(shí)驗(yàn)結(jié)果證明,與基線法相比,ChoreoNet性能更好,可以生成持續(xù)時(shí)間較長的結(jié)構(gòu)化控件,來生成與音樂匹配的動作,并使其自然連接、情感流暢。

在這一突破中,搜狗對音頻驅(qū)動身體動作這一課題的敏銳感知,以及AI分身技術(shù)在身體動作及姿態(tài)生成方面的加成,無疑是領(lǐng)先技術(shù)能力與創(chuàng)新意識的絕佳組合。

持續(xù)領(lǐng)跑,搜狗與分身技術(shù)的不解之緣

可以看到,ChoreoNet的出現(xiàn),既帶來了人機(jī)交互能力的提升,也給機(jī)器學(xué)習(xí)融入了知識元素。這可以看做是搜狗“分身技術(shù)”的一次進(jìn)階,也側(cè)面印證了搜狗以“自然交互+知識計(jì)算”為核心的AI技術(shù)版圖,正在持續(xù)狂奔,也得以積蓄起不斷引領(lǐng)技術(shù)方向的勢能。

從2018年首創(chuàng)分身技術(shù)之后,搜狗的研發(fā)腳步從未停止,持續(xù)專注于如何以文本及音頻更好驅(qū)動數(shù)字人的面部表情及唇動進(jìn)行研究。相繼在2D/3D數(shù)字人領(lǐng)域構(gòu)建了音畫同步、逼真的面部表情唇動生成及驅(qū)動能力。

如何能夠讓數(shù)字人更加自然并且富有表現(xiàn)力也是搜狗分身的重點(diǎn)研究方向,其中身體動作以及姿態(tài)的表達(dá)至關(guān)重要。在對數(shù)字人的面部驅(qū)動達(dá)到較高標(biāo)準(zhǔn)后,搜狗將研究重點(diǎn)從面部為主的驅(qū)動轉(zhuǎn)到面部+動作的驅(qū)動,重點(diǎn)攻關(guān)如何讓肢體動作更具自然表現(xiàn)力。如在今年5月推出的3D AI合成主播身上,不僅有經(jīng)得起高清鏡頭考驗(yàn)的面部表現(xiàn),同時(shí)實(shí)現(xiàn)了以文本語義為驅(qū)動的自如行走。

如今,ChoreoNet更進(jìn)一步,實(shí)現(xiàn)了以音頻對AI數(shù)字人進(jìn)行實(shí)時(shí)驅(qū)動。搜狗在業(yè)內(nèi)率先嘗試并取得突破性研發(fā)結(jié)果的這一舉動,更是一改只能由文本、語義驅(qū)動AI分身面部+動作的現(xiàn)狀,為行業(yè)帶來了更多的創(chuàng)新可能,搜狗的分身技術(shù)理想與實(shí)力也躍然紙上。

不斷打造可視化、能自然交互的AI數(shù)字人,搜狗到底想做什么?

人機(jī)交互的未來,與搜狗的技術(shù)遠(yuǎn)景

回歸到企業(yè)戰(zhàn)略層面,搜狗的AI理念是讓AI賦能于人。通過人機(jī)協(xié)作,把人從重復(fù)性工作中解放出來,更好地解放社會生產(chǎn)力。比如AI主播,就可以讓主持人不再困于朗讀既定內(nèi)容,可以投身于更具創(chuàng)造性的工作。當(dāng)然,這一切都要從更自然的人機(jī)交互開始,完成一次次交流與觸碰。

而此次ChoreoNet讓數(shù)字人跟隨音樂起舞,這個(gè)創(chuàng)意的突破不僅僅是技術(shù)上夠炫酷,應(yīng)用空間也非常巨大。

不出意外,搜狗很大可能會將該技術(shù)同3D數(shù)字人相結(jié)合,因?yàn)橄噍^2D數(shù)字人,3D數(shù)字人的肢體靈活性、可塑性驅(qū)動更強(qiáng),從而有更廣泛的應(yīng)用空間。音頻驅(qū)動技術(shù)的加入,不僅能豐富搜狗3D數(shù)字人在新聞播報(bào)、外景采訪的場景,更直接有助于突破融媒體領(lǐng)域、向娛樂、影視等領(lǐng)域落地進(jìn)軍。可以看到,基于視覺的人機(jī)交互會越來越成為主流,比如當(dāng)前流行的智能客服、虛擬偶像等等,往往需要大量文本、語義的輸入來進(jìn)行推理與交互,虛擬偶像的動作也需要捕捉后由人工逐幀進(jìn)行制作,而改為音頻驅(qū)動可以更為直接地實(shí)現(xiàn)語音交流,節(jié)省制作/計(jì)算的步驟與成本。

此外,人類知識體系與機(jī)器學(xué)習(xí)的結(jié)合,讓AI能力有極大的提升。通過垂直領(lǐng)域的知識數(shù)據(jù)進(jìn)行訓(xùn)練和學(xué)習(xí),從而提供更精準(zhǔn)、可靠的服務(wù),大大提升AI客服的接受度。

當(dāng)然,音頻驅(qū)動也可以生成更具人性化的個(gè)人秘書,幫助人減輕工作負(fù)擔(dān)、提高效率的同時(shí),通過音頻識別與判斷來實(shí)時(shí)反應(yīng),表現(xiàn)力更加豐富,讓智能家居、服務(wù)機(jī)器人等更好地融入生活環(huán)境,在老人關(guān)懷、私人助理、兒童陪伴等等場景之中,扮演更積極的角色。

業(yè)內(nèi)有個(gè)共識,一般情況下只有對日常生活和技術(shù)突破具有巨大影響潛力的研究項(xiàng)目,才會被ACM Multimedia通過和錄取。從這個(gè)角度看,搜狗與清華天工院所做的工作,遠(yuǎn)遠(yuǎn)不只是學(xué)術(shù)上的突破那么簡單。當(dāng)全球科技巨頭都在探索如何用多模態(tài)交互締造新玩法、新功能的時(shí)候,搜狗已經(jīng)向前邁出了讓人眼前一亮的步伐。

讓數(shù)字人更像人,就能更早地與人類達(dá)成親密無間的配合與協(xié)作,對于人類和AI來說,同樣重要。也正由于此,世界頂級盛會才會投注認(rèn)可與鼓勵。下一次,搜狗會為數(shù)字人集齊怎樣的能力呢?我們拭目以待。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 人機(jī)交互
    +關(guān)注

    關(guān)注

    12

    文章

    1290

    瀏覽量

    57964
  • 搜狗
    +關(guān)注

    關(guān)注

    0

    文章

    91

    瀏覽量

    14265
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    3013

    瀏覽量

    115169
  • 數(shù)字
    +關(guān)注

    關(guān)注

    1

    文章

    1700

    瀏覽量

    52564
  • 清華
    +關(guān)注

    關(guān)注

    0

    文章

    16

    瀏覽量

    19042
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    從“人機(jī)交互”到“數(shù)字預(yù)演”:詳解 HMI、SCADA 與虛擬調(diào)試的閉環(huán)架構(gòu)

    從“人機(jī)交互”到“數(shù)字預(yù)演”:詳解 HMI、SCADA 與虛擬調(diào)試的閉環(huán)架構(gòu)
    的頭像 發(fā)表于 03-05 11:36 ?148次閱讀
    從“<b class='flag-5'>人機(jī)交互</b>”到“數(shù)字預(yù)演”:詳解 HMI、SCADA 與虛擬調(diào)試的閉環(huán)架構(gòu)

    沐曦股份聯(lián)合清華大學(xué)發(fā)布磁性材料AI原子基座模型

    2月27日,沐曦股份聯(lián)合清華大學(xué)等多家研究機(jī)構(gòu)聯(lián)合發(fā)布了磁性材料AI原子基座模型。該模型是首個(gè)覆
    的頭像 發(fā)表于 03-03 15:25 ?416次閱讀
    沐曦股份<b class='flag-5'>聯(lián)合</b><b class='flag-5'>清華</b>大學(xué)發(fā)布磁性材料AI原子基座<b class='flag-5'>模型</b>

    中科創(chuàng)達(dá)旗下Rightware攜手高通發(fā)布智能汽車人機(jī)交互解決方案

    Reality(簡稱ISR)。該方案依托Rightware人機(jī)交互工具鏈Kanzi與高通驍龍Ride Elite平臺聯(lián)合打造。
    的頭像 發(fā)表于 01-16 14:59 ?1985次閱讀

    廣電計(jì)量與長沙三大研究院達(dá)成戰(zhàn)略合作

    11月26-27日,廣電計(jì)量與長沙北斗產(chǎn)業(yè)安全技術(shù)研究院集團(tuán)股份有限公司(簡稱“長沙北斗研究院”)、長沙量子測量產(chǎn)業(yè)技術(shù)研究院有限公司(簡稱“長沙量子研究院”)、湖南大學(xué)長沙半導(dǎo)體技術(shù)
    的頭像 發(fā)表于 12-04 14:36 ?541次閱讀

    眼電EOG人機(jī)交互會是未來交互的一種主流嗎?

    HUIYING基于眼電的人機(jī)交互系統(tǒng)概述基于眼電(EOG)的人機(jī)交互系統(tǒng)(HMI)的研發(fā)源于對非侵入式、高精度且持久可穿戴的醫(yī)療輔助設(shè)備的需求。傳統(tǒng)人機(jī)交互方式如觸摸屏、操縱桿或基于肌電(EMG
    的頭像 發(fā)表于 11-07 18:01 ?5967次閱讀
    眼電EOG<b class='flag-5'>人機(jī)交互</b>會是<b class='flag-5'>未來</b><b class='flag-5'>交互</b>的一種主流嗎?

    重構(gòu)未來自適應(yīng)人機(jī)交互的創(chuàng)新技術(shù)

    人機(jī)交互的概念可以追溯到工業(yè)革命時(shí)期,在當(dāng)時(shí)機(jī)器開始取代人類勞動。然而,直到20世紀(jì)中葉,人機(jī)交互領(lǐng)域才受到廣泛關(guān)注。人機(jī)界面(HMI)是人與機(jī)器之間交互的關(guān)鍵點(diǎn),形成了用戶可以控制復(fù)
    的頭像 發(fā)表于 10-31 16:30 ?1316次閱讀
    重構(gòu)<b class='flag-5'>未來</b>自適應(yīng)<b class='flag-5'>人機(jī)交互</b>的創(chuàng)新技術(shù)

    模型驅(qū)動下的人機(jī)交互革命,“超擬真人互動”?讓玩具讀懂你的情緒

    ,全方位重構(gòu)了智能硬件的人機(jī)交互范式,為行業(yè)提供了從技術(shù)底層到商業(yè)應(yīng)用的完整路徑。 ? 從人機(jī)交互的技術(shù)演進(jìn)邏輯來看,經(jīng)歷了文本交互(CUI)、圖像交互(GUI)到自然語言多模態(tài)
    的頭像 發(fā)表于 10-31 09:21 ?6468次閱讀
    大<b class='flag-5'>模型</b>驅(qū)動下的<b class='flag-5'>人機(jī)交互</b>革命,“超擬真人互動”?讓玩具讀懂你的情緒

    廣電計(jì)量攜手南山研究院打造大健康產(chǎn)業(yè)新生態(tài)

    10月19日, “南山研究院南海四周年系列活動”在廣東省南山醫(yī)藥創(chuàng)新研究院(簡稱“南山研究院”)成功舉辦。期間,南山研究院與廣電計(jì)量等多家單位聯(lián)合
    的頭像 發(fā)表于 10-23 17:42 ?1150次閱讀

    人機(jī)交互:連接人類與數(shù)字世界的橋梁

    人機(jī)交互(Human-Computer Interaction, HCI)是研究人與計(jì)算機(jī)系統(tǒng)之間信息交流方式的學(xué)科,旨在優(yōu)化用戶體驗(yàn),提高交互效率。隨著人工智能、虛擬現(xiàn)實(shí)(VR)和物聯(lián)網(wǎng)(IoT
    的頭像 發(fā)表于 08-11 15:21 ?2111次閱讀

    慧鼎科技與吉利汽車研究院成立聯(lián)合創(chuàng)新實(shí)驗(yàn)室

    近日,慧鼎科技與吉利汽車研究院正式成立聯(lián)合創(chuàng)新實(shí)驗(yàn)室并舉行了隆重的揭牌儀式。此次合作聚焦于磁流變智能懸架系統(tǒng)的研發(fā)與產(chǎn)業(yè)化,標(biāo)志著雙方將在磁流變減振技術(shù)及汽車底盤智能化領(lǐng)域展開深度合作,共同攻克智能懸架系統(tǒng)的關(guān)鍵技術(shù)難題,攜手推動汽車駕乘體驗(yàn)與性能的革命性提升。
    的頭像 發(fā)表于 07-24 17:18 ?1123次閱讀

    蘇州高新區(qū)聯(lián)合領(lǐng)軍企業(yè)研究院到訪智行者科技

    近日,蘇州高新區(qū)聯(lián)合領(lǐng)軍企業(yè)研究院率蘇州高新區(qū)內(nèi)20余家專精特新企業(yè)負(fù)責(zé)人蒞臨智行者參觀交流。
    的頭像 發(fā)表于 07-23 17:13 ?1169次閱讀

    蘇州唯理科技神經(jīng)腕帶肌電臂環(huán)人機(jī)交互演示

    人機(jī)交互
    jf_74911425
    發(fā)布于 :2025年07月08日 22:02:34

    恩智浦與吉利汽車研究院成立聯(lián)合創(chuàng)新實(shí)驗(yàn)室,共創(chuàng)汽車智能化未來

    恩智浦半導(dǎo)體宣布,與吉利汽車研究院成立聯(lián)合創(chuàng)新實(shí)驗(yàn)室,深化雙方合作,聚焦智能化汽車技術(shù),攜手創(chuàng)新,助力吉利汽車智能化戰(zhàn)略加速落地。 吉利汽車研究院常務(wù)副院長任向飛,恩智浦半導(dǎo)體執(zhí)行副總裁兼高級模擬
    的頭像 發(fā)表于 07-04 16:07 ?2608次閱讀

    導(dǎo)遠(yuǎn)科技與清華大學(xué)無錫應(yīng)用技術(shù)研究院達(dá)成合作

    近日,導(dǎo)遠(yuǎn)科技與清華大學(xué)無錫應(yīng)用技術(shù)研究院(以下簡稱:研究院)達(dá)成合作。導(dǎo)遠(yuǎn)科技將提供高精度定位產(chǎn)品及解決方案,以支持研究院在L4級自動駕駛和人形機(jī)器人領(lǐng)域的技術(shù)研發(fā)及轉(zhuǎn)化落地。
    的頭像 發(fā)表于 06-12 16:34 ?1051次閱讀

    華寶新能與電子科技大學(xué)(深圳)高等研究院共建聯(lián)合實(shí)驗(yàn)室

    為加速新能源技術(shù)創(chuàng)新與產(chǎn)業(yè)轉(zhuǎn)化,助力國家“雙碳”目標(biāo)實(shí)現(xiàn)與粵港澳大灣區(qū)國際科創(chuàng)中心建設(shè),近日,華寶新能與電子科技大學(xué)(深圳)高等研究院成立“華寶新能光伏儲能電子聯(lián)合實(shí)驗(yàn)室”,并在電子科技大學(xué)(深圳
    的頭像 發(fā)表于 05-30 19:58 ?875次閱讀