91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌推出能一次生成完整視頻的擴(kuò)散模型

微云疏影 ? 來源:綜合整理 ? 作者:綜合整理 ? 2024-01-29 11:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

谷歌研究院近日發(fā)布了一款名為Lumiere的文生視頻擴(kuò)散模型,基于自家研發(fā)的Space-Time U-Net基礎(chǔ)架構(gòu),獨(dú)立生成具有高效、完整且動(dòng)作連貫性的視頻效果。

該公司指出,當(dāng)前眾多文生視頻模型普遍存在無法生成長時(shí)、高品質(zhì)及動(dòng)作連貫的問題。這些模型往往采用“分段生成視頻”策略,即先生成少量關(guān)鍵幀,再借助時(shí)間超級(jí)分辨率(TSM)技術(shù)生成其間的視頻文件。盡管此策略可減緩RAM負(fù)擔(dān),但難以生成理想的連續(xù)視頻效果。

針對(duì)此問題,谷歌的Lumiere模型創(chuàng)新地引入了新型Space-Time U-Net基礎(chǔ)架構(gòu),這種架構(gòu)能在空間和時(shí)間兩個(gè)維度同時(shí)降低信號(hào)采樣率,使其具備更高的計(jì)算效率,進(jìn)而實(shí)現(xiàn)生成更具持續(xù)性、動(dòng)作連貫的視頻效果。

此外,開發(fā)者們特別說明,Lumiere每次可生成80幀視頻(在16FPS模式下相當(dāng)于5秒視頻,或在24FPS模式下為約3.34秒視頻)。盡管這一時(shí)光貌似短暫,然而他們強(qiáng)調(diào),事實(shí)上,這段5秒視頻所包含的鏡頭時(shí)長已超出大多數(shù)媒體作品中單一鏡頭的平均時(shí)長。

除運(yùn)用架構(gòu)創(chuàng)新以外,作為AI構(gòu)建基礎(chǔ)的預(yù)訓(xùn)練文生圖像模型也得到了谷歌團(tuán)隊(duì)的特別關(guān)注。該模型首次生成簡單像素草稿作為視頻分幀,然后借助空間超分辨率(SRM)模型,逐步提高分幀分辨率,同時(shí)引入通用生成框架Multi-Diffusion以增強(qiáng)模型穩(wěn)定性,從而確保最終輸出的視頻效果一致且連續(xù)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6254

    瀏覽量

    111490
  • RAM
    RAM
    +關(guān)注

    關(guān)注

    8

    文章

    1399

    瀏覽量

    120627
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39912

    瀏覽量

    301557
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3757

    瀏覽量

    52131
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    谷歌AI霸主歸來!多線反擊OpenAI,開啟安卓Gemini時(shí)代

    Pro、擴(kuò)散語言模型Gemini Diffusion、視頻生成模型Veo 3+ Flow應(yīng)用、圖像生成
    的頭像 發(fā)表于 05-22 09:01 ?6654次閱讀
    <b class='flag-5'>谷歌</b>AI霸主歸來!多線反擊OpenAI,開啟安卓Gemini時(shí)代

    ZWS智慧儲(chǔ)云平臺(tái):讓多形式設(shè)備“一次上云,各顯其長”

    多形式儲(chǔ)設(shè)備怎樣快速上云,又能各顯其長?ZWS智慧儲(chǔ)云平臺(tái)一次講透。前言上期我們介紹了ZWS智慧儲(chǔ)云平臺(tái)的基礎(chǔ)接入能力——通過EM系列儲(chǔ)
    的頭像 發(fā)表于 02-12 11:39 ?195次閱讀
    ZWS智慧儲(chǔ)<b class='flag-5'>能</b>云平臺(tái):讓多形式設(shè)備“<b class='flag-5'>一次</b>上云,各顯其長”

    谷歌正式推出Gemini 3 Flash模型

    我們正式推出了 Gemini 3 Flash,這是以較低成本打造的高效前沿智能,成功地進(jìn)步擴(kuò)展了 Gemini 3 模型系列。
    的頭像 發(fā)表于 01-22 16:04 ?515次閱讀

    光伏一次調(diào)頻設(shè)備/一次調(diào)頻裝置|光伏一次調(diào)頻涉網(wǎng)試驗(yàn)/光伏電站一次調(diào)頻建設(shè)改造方案

    改造方案既能滿足電網(wǎng)要求,又能節(jié)約投資成本。是光伏業(yè)主和二集成商共同要考慮的問題。大家好我是廣州智昊小曾本視頻我就從一次調(diào)頻的基本原理,裝置的結(jié)構(gòu)形態(tài),安裝部署,光伏電站的應(yīng)用方案,大致的投資成本說清楚。
    的頭像 發(fā)表于 01-17 08:54 ?1245次閱讀
    光伏<b class='flag-5'>一次</b>調(diào)頻設(shè)備/<b class='flag-5'>一次</b>調(diào)頻裝置|光伏<b class='flag-5'>一次</b>調(diào)頻涉網(wǎng)試驗(yàn)/光伏電站<b class='flag-5'>一次</b>調(diào)頻建設(shè)改造方案

    光伏一次調(diào)頻設(shè)備,光伏電站一次調(diào)頻建設(shè)改造方案

    分布式光伏電站,又要面臨改造投資問題,壓力較大。如何選擇質(zhì)優(yōu)價(jià)廉的一次調(diào)頻產(chǎn)品改造方案既能滿足電網(wǎng)要求,又能節(jié)約投資成本。是光伏業(yè)主和二集成商共同要考慮的問題。本視頻就從一次調(diào)頻的基
    發(fā)表于 01-16 20:06

    每年10億美元,蘋果與谷歌官宣合作,Gemini大模型注入Siri

    電子發(fā)燒友網(wǎng)報(bào)道 當(dāng)?shù)貢r(shí)間1月12日,蘋果官宣將與谷歌聯(lián)手,為蘋果的人工智能功能提供支持,其中包括今年晚些時(shí)候?qū)iri的一次重大升級(jí)。谷歌在其官方博客上表示,蘋果已與谷歌達(dá)成
    的頭像 發(fā)表于 01-13 14:59 ?5181次閱讀

    解析一次消諧和二消諧的差異與應(yīng)用場景

    裝置,是兩個(gè)完全不同的產(chǎn)品。 一次消諧器主要是在電壓互感器PT的開口三角處接入非線性電阻,當(dāng)系統(tǒng)發(fā)生鐵磁諧振時(shí),非線性電阻會(huì)迅速動(dòng)作,將諧振能量消耗掉,從而抑制諧振過電壓。這種方式直接作用于一次系統(tǒng),快速有效的消
    的頭像 發(fā)表于 12-11 11:33 ?537次閱讀

    HarmonyOSAI編程萬卡片生成

    基于AI大模型理解開發(fā)者的卡片需求信息,通過對(duì)話式的交互智能生成HarmonyOS萬卡片工程。 使用約束 建議從以下維度描述卡片需求: 當(dāng)前不支持在生成卡片預(yù)覽圖后繼續(xù)描述需求進(jìn)行增
    發(fā)表于 09-08 17:09

    谷歌DeepMind重磅發(fā)布Genie 3,首次實(shí)現(xiàn)世界模型實(shí)時(shí)交互

    電子發(fā)燒友網(wǎng)綜合報(bào)道 當(dāng)?shù)貢r(shí)間2025年8月5日,谷歌DeepMind正式推出第三代通用世界模型Genie3。這款被英偉達(dá)科學(xué)家Jim Fan譽(yù)為“游戲引擎2.0”的模型,通過單文本提
    的頭像 發(fā)表于 08-13 08:27 ?6901次閱讀

    智能客服驅(qū)動(dòng)效率和體驗(yàn)升級(jí),上海電信+昇騰AI的一次民生應(yīng)用實(shí)踐

    上海電信+昇騰AI的一次民生應(yīng)用實(shí)踐
    的頭像 發(fā)表于 07-30 23:44 ?2958次閱讀
    智能客服驅(qū)動(dòng)效率和體驗(yàn)升級(jí),上海電信+昇騰AI的<b class='flag-5'>一次</b>民生應(yīng)用實(shí)踐

    種基于擴(kuò)散模型視頻生成框架RoboTransfer

    在機(jī)器人操作領(lǐng)域,模仿學(xué)習(xí)是推動(dòng)具身智能發(fā)展的關(guān)鍵路徑,但高度依賴大規(guī)模、高質(zhì)量的真實(shí)演示數(shù)據(jù),面臨高昂采集成本與效率瓶頸。仿真器雖提供了低成本數(shù)據(jù)生成方案,但顯著的“模擬到現(xiàn)實(shí)”(Sim2Real)鴻溝,制約了仿真數(shù)據(jù)訓(xùn)練策略的泛化能力與落地應(yīng)用。
    的頭像 發(fā)表于 07-09 14:02 ?840次閱讀
    <b class='flag-5'>一</b>種基于<b class='flag-5'>擴(kuò)散</b><b class='flag-5'>模型</b>的<b class='flag-5'>視頻生成</b>框架RoboTransfer

    谷歌生成式AI媒體模型登陸Vertex AI平臺(tái)

    我們?cè)?Vertex AI 上推出新一生成式 AI 媒體模型: Imagen 4、Veo 3 和 Lyria 2。
    的頭像 發(fā)表于 06-18 09:56 ?1121次閱讀

    4K、多模態(tài)、長視頻:AI視頻生成的下個(gè)戰(zhàn)場,誰在領(lǐng)跑?

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎) 6月11日,豆包App上線視頻生成模型豆包Seedance 1.0 pro。這是字節(jié)跳動(dòng)最新視頻模型,支持文字與圖片輸入,可
    的頭像 發(fā)表于 06-16 00:13 ?7309次閱讀

    一次消諧裝置與二消諧裝置區(qū)別、一次消諧器與二消諧器的區(qū)別

    一次消諧器與二消諧器是電力系統(tǒng)中用于抑制諧振過電壓的不同裝置,主要區(qū)別如下: 安裝位置:一次消諧器串聯(lián)于電壓互感器(PT)一次側(cè)中性點(diǎn)與地之間,直接承受高電壓;二
    的頭像 發(fā)表于 05-07 09:58 ?4325次閱讀
    <b class='flag-5'>一次</b>消諧裝置與二<b class='flag-5'>次</b>消諧裝置區(qū)別、<b class='flag-5'>一次</b>消諧器與二<b class='flag-5'>次</b>消諧器的區(qū)別

    ?Diffusion生成式動(dòng)作引擎技術(shù)解析

    Diffusion生成式動(dòng)作引擎 Diffusion生成式動(dòng)作引擎是種基于擴(kuò)散模型(Diffusion Models)的
    的頭像 發(fā)表于 03-17 15:14 ?3085次閱讀