91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌發(fā)布VLOGGER AI模型,實現(xiàn)肖像朗讀音頻內(nèi)容

微云疏影 ? 來源:綜合整理 ? 作者:綜合整理 ? 2024-03-19 14:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

3 月 19 日,Google 在其官方博客上發(fā)布了關于 VLOGGER AI 模型的相關信息。這是一款利用用戶提供的肖像照片和音頻內(nèi)容,使人物生動地呈現(xiàn)音頻內(nèi)容并具備豐富面部表情的人工智能程序。

具體來說,VLOGGER AI 采用一種適應虛擬肖像的多模態(tài) Diffusion 模型,通過 MENTOR 數(shù)據(jù)庫進行訓練,涵蓋了超80萬個人物肖像及超過2200小時的視頻數(shù)據(jù)。得益于此,VLOGGER 可以生成各種族、各年齡段、穿著多樣、姿態(tài)各異的肖像視頻。

研發(fā)團隊指出,相較于之前的同類產(chǎn)品,VLOGGER 的獨特之處在于無需針對每個使用者進行單獨培訓,且不受限于人臉檢測和裁剪,能產(chǎn)出完整的圖像,且能夠處理更多元化的情境如可見的身軀或者其他身份特征,這對于真實再現(xiàn)人物交流過程至關重要。

谷歌將 VLOGGER 視為通往“通用聊天機器人”未來的關鍵一步,使人工智能能以自然的語音、手勢和眼神等方式與人類交互。除此之外,VLOGGER 還可用作報告、教育領域以及旁白等方面的輔助工具,并能對已有的電影進行剪輯和表情調(diào)整。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Google
    +關注

    關注

    5

    文章

    1807

    瀏覽量

    60538
  • 模型
    +關注

    關注

    1

    文章

    3757

    瀏覽量

    52130
  • VLogger
    +關注

    關注

    0

    文章

    5

    瀏覽量

    8476
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    谷歌AI霸主歸來!多線反擊OpenAI,開啟安卓Gemini時代

    電子發(fā)燒友網(wǎng)報道(文/莫婷婷)北京時間5月21日,谷歌2025 Google I/O開發(fā)者大會正式召開,從其發(fā)布的新品來看,這可以說是一場AI盛會。 在AI
    的頭像 發(fā)表于 05-22 09:01 ?6654次閱讀
    <b class='flag-5'>谷歌</b><b class='flag-5'>AI</b>霸主歸來!多線反擊OpenAI,開啟安卓Gemini時代

    使用NORDIC AI的好處

    ; 自定義 Neuton 模型博客] Axon NPU :集成在 nRF54LM20B 等高端 SoC 中的專用 AI 加速器,對 TensorFlow Lite 模型實現(xiàn)最高約 1
    發(fā)表于 01-31 23:16

    泰凌微:布局端側(cè)AI,產(chǎn)品支持谷歌LiteRT、TVM開源模型

    ?電子發(fā)燒友網(wǎng)報道(文/李彎彎)泰凌微近日表示,公司與谷歌在智能家居、音頻等多個領域開展具體項目合作。其與谷歌已從單一的遙控器芯片供應,發(fā)展為涵蓋音頻、智能家居、端側(cè)
    的頭像 發(fā)表于 12-15 08:21 ?1w次閱讀

    GMate發(fā)布《2025全球AI內(nèi)容營銷趨勢報告》

    報告顯示:到2026年,全球70%以上品牌內(nèi)容將由AI輔助生成,AI營銷進入“全自動增長”新紀元。 ? 10月,AI營銷創(chuàng)新平臺 GMate 發(fā)布
    的頭像 發(fā)表于 11-18 19:42 ?695次閱讀

    谷歌AlphaEarth和維智時空AI模型的核心差異

    谷歌AlphaEarth和維智時空AI模型在技術理念上存在諸多共性,但兩者在目標尺度、數(shù)據(jù)來源、技術實現(xiàn)和應用模式上存在顯著差異。
    的頭像 發(fā)表于 10-22 14:50 ?905次閱讀

    谷歌AlphaEarth和維智時空AI模型的技術路徑

    谷歌AlphaEarth和維智時空AI模型在應用場景和技術實現(xiàn)上各有側(cè)重,但兩者在底層技術理念上存在顯著共性。
    的頭像 發(fā)表于 10-22 14:48 ?922次閱讀

    AI模型的配置AI模型該怎么做?

    STM32可以跑AI,這個AI模型怎么搞,知識盲區(qū)
    發(fā)表于 10-14 07:14

    NVIDIA推出多語種語音AI開放數(shù)據(jù)集與模型

    發(fā)布的 Granary 數(shù)據(jù)集包含約 100 萬小時音頻,可用于訓練高精度、高吞吐量的 AI 音頻轉(zhuǎn)錄與翻譯模型
    的頭像 發(fā)表于 09-23 15:34 ?976次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+內(nèi)容總覽

    ,其中第一章是概論,主要介紹大模型浪潮下AI芯片的需求與挑戰(zhàn)。第二章和第三章分別介紹實現(xiàn)深度學習AI芯片的創(chuàng)新方法和架構。以及一些新型的算法和思路。第四章是全面介紹半導體芯產(chǎn)業(yè)的前沿技
    發(fā)表于 09-05 15:10

    谷歌AI模型點亮開發(fā)無限可能

    在 2025 年的 Google 谷歌開發(fā)者大會上,AI 不是一門“技術”,更是一股徹底改變開發(fā)范式的“力量”,助力開發(fā)者們在海外市場更上一層樓。AI 已經(jīng)不僅僅是生成幾行代碼,它正在全面提升整個開發(fā)過程。從
    的頭像 發(fā)表于 08-29 09:29 ?1156次閱讀

    英語單詞學習頁面+單詞朗讀實現(xiàn) -- 【2】單詞朗讀實現(xiàn) ##HarmonyOS SDK AI##

    的原理是通過文字轉(zhuǎn)語音的形式實現(xiàn)的,之前也寫過文章分享過在API9下如何進行文字轉(zhuǎn)語音,那是通過第三方的API實現(xiàn)的,需要申請token,請求接口,然后再通過media去播放,整體流程較為復雜,還必須
    發(fā)表于 06-29 23:26

    英語單詞學習頁面+單詞朗讀實現(xiàn) -- 【1】頁面實現(xiàn) ##HarmonyOS SDK AI##

    ?先看一下頁面效果 ? 整體頁面是一個比較簡潔的頁面,其中有兩個特色功能 對于例句中,能夠實現(xiàn)將當前的單詞從句子中進行識別并突出顯示 對于單詞和句子,可以進行朗讀,這個朗讀使用的是Core
    發(fā)表于 06-29 23:24

    首創(chuàng)開源架構,天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應手

    的自有模型移植,使首字詞生態(tài)速度比云端方案提升70%,賦能絕影多模態(tài)智能座艙強大的端側(cè)運行能力,讓汽車擁有“有趣的靈魂”。 不僅如此,天璣AI開發(fā)套件已經(jīng)接入NVIDIA TAO生態(tài)圈,實現(xiàn)TAO
    發(fā)表于 04-13 19:52

    谷歌第七代TPU Ironwood深度解讀:AI推理時代的硬件革命

    谷歌第七代TPU Ironwood深度解讀:AI推理時代的硬件革命 Google 發(fā)布了 Ironwood,這是其第七代張量處理單元 (TPU),專為推理而設計。這款功能強大的 AI
    的頭像 發(fā)表于 04-12 11:10 ?3790次閱讀
    <b class='flag-5'>谷歌</b>第七代TPU Ironwood深度解讀:<b class='flag-5'>AI</b>推理時代的硬件革命

    谷歌新一代 TPU 芯片 Ironwood:助力大規(guī)模思考與推理的 AI 模型新引擎?

    與推理 AI 模型谷歌方面表示,它代表著 AI 發(fā)展從 “響應式” 向 “主動式” 的范式轉(zhuǎn)變,未來 AI 代理將能夠主動檢索并
    的頭像 發(fā)表于 04-12 00:57 ?3759次閱讀