91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

除了刷屏的Sora,國(guó)內(nèi)外還有哪些AI視頻生成工具

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2024-02-26 08:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群



電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)近日,OpenAI發(fā)布的文生視頻模型Sora全網(wǎng)刷屏。相比之前的文生視頻模型,Sora無論是視頻時(shí)長(zhǎng),還是畫面精細(xì)度,細(xì)節(jié)完整性,或是多鏡頭拍攝,都更為突出。Sora的發(fā)布也讓AI生成視頻有了突破性進(jìn)展。

過去一年多,全球科技公司都在發(fā)布各種大模型,然而AI生成內(nèi)容更多集中在文本和圖片方面,AI視頻生成方面卻進(jìn)展緩慢。從當(dāng)前的形勢(shì)來看,AI視頻生成在今年或許會(huì)有一番新景象。那么目前國(guó)內(nèi)外都有哪些AI視頻生成工具,效果如何呢?

Sora

OpenAI發(fā)布的新型視頻生成模型Sora,其核心能力是能夠生成長(zhǎng)達(dá)一分鐘的高清視頻,這一時(shí)長(zhǎng)遠(yuǎn)超之前的生成模型。而且,Sora生成的視頻不僅畫質(zhì)卓越,細(xì)節(jié)豐富,而且?guī)矢?、連續(xù)性好,幾乎達(dá)到了無縫銜接的效果。

從OpenAI官網(wǎng)展示的一個(gè)視頻來看,輸入提示詞“一位時(shí)尚女士走在東京的街道上,街道上充滿了溫暖的霓虹燈和動(dòng)畫城市標(biāo)志。她穿著黑色皮夾克、紅色長(zhǎng)裙和黑色靴子,拿著一個(gè)黑色錢包。她戴著太陽(yáng)鏡,涂著紅色口紅。她走路自信而隨意。街道潮濕且反光,形成了五顏六色燈光的鏡面效果。許多行人四處走動(dòng)?!?br />
生成的視頻,無論是運(yùn)鏡還是人物、地面、背景的細(xì)節(jié),還有拉進(jìn)鏡頭后人物面部上的皺紋、毛發(fā)、墨鏡上的反光,都幾乎可以以假亂真,畫面穩(wěn)定不錯(cuò)位。在長(zhǎng)達(dá)60秒的視頻里,畫面隨鏡頭的大幅度運(yùn)動(dòng)并沒有出現(xiàn)錯(cuò)位的情況,整體風(fēng)格保持了驚人的一致性。

據(jù)IDC中國(guó)預(yù)測(cè),Sora將率先在短視頻、廣告、互動(dòng)娛樂、影視制作和媒體等行業(yè)中得到應(yīng)用。在這些領(lǐng)域,利用Sora的多模態(tài)大模型能力,可以輔助內(nèi)容行業(yè)的工作者更高效地創(chuàng)作視頻,不僅加快了生產(chǎn)速度,還提高了產(chǎn)出數(shù)量,并為用戶帶來前所未有的視覺體驗(yàn)。這將助力企業(yè)實(shí)現(xiàn)成本降低、效率提升,并進(jìn)一步優(yōu)化用戶體驗(yàn)。

Pika 1.0

在OpenAI發(fā)布視頻生成模型Sora之前,去年11月29日,美國(guó)AI初創(chuàng)公司Pika labs發(fā)布的文生視頻產(chǎn)品Pika 1.0呈現(xiàn)的效果在當(dāng)時(shí)也相當(dāng)驚艷。Pika labs是一家成立于去年4月份的初創(chuàng)公司,創(chuàng)始人郭文景和聯(lián)合創(chuàng)始人兼CTO Chenlin Meng,都是斯坦福大學(xué)AI Lab博士生。一位專注于NLP(自然語(yǔ)言處理)和圖形學(xué),另一位主攻計(jì)算機(jī)視覺方向。

據(jù)介紹,該公司推出的視頻生成模型Pika 1.0能夠生成和編輯3D動(dòng)畫、動(dòng)漫、卡通和電影。視頻生成方面,可以通過文字生成視頻,也可以圖片生成視頻。比如,只需輸入提示詞“馬斯克穿著太空服,3D動(dòng)畫”,一個(gè)動(dòng)畫版本、穿著太空服準(zhǔn)備乘坐火箭上太空的馬斯克即可生成,外形、動(dòng)作、背景等元素均十分逼真,可以媲美花大成本制作的3D動(dòng)畫影像。

Pika 1.0還可以通過原有視頻生成更高質(zhì)量的視頻。該公司當(dāng)時(shí)展示了一個(gè)騎馬的黑白原視頻,通過Pika 1.0生成了物種不同風(fēng)格的動(dòng)畫,幾乎涵蓋現(xiàn)有電影和動(dòng)畫大部分風(fēng)格,看上去質(zhì)量效果非常好。除了視頻生成,Pika 1.0還能夠進(jìn)行視頻編輯,用戶只需要選定編輯區(qū)域,就能根據(jù)文本提示詞修改特定區(qū)域。

在當(dāng)時(shí)來看,Pika 1.0的出現(xiàn)可以說效果好于之前的文生視頻模型。然而隨著現(xiàn)在Sora的出現(xiàn),Pika或許會(huì)感覺到壓力。Pika公司創(chuàng)始人郭文景表示,“我們覺得這是一個(gè)很振奮人心的消息,我們已經(jīng)在籌備升級(jí)中,將直接對(duì)標(biāo) Sora?!?br />
Gen-2

相比于OpenAI和Pika,成立于2018年的AI初創(chuàng)公司Runway應(yīng)該是最早探索視頻生成領(lǐng)域的企業(yè)。2022年2月,Runway發(fā)布了Gen-1,可以對(duì)原視頻進(jìn)行風(fēng)格化的編輯。3月該公司又發(fā)布了生成式AI視頻模型Gen-2,允許用戶輸入文本提示生成四秒長(zhǎng)視頻,8月,Runway添加了一個(gè)選項(xiàng),可以將 Gen-2 中人工智能生成的視頻延長(zhǎng)至 18 秒。

在隨后的幾個(gè)月,Runway還對(duì)Gen-2 做了幾次更新。之后更是推出動(dòng)態(tài)筆刷Motion Brush,它是Runway視頻生成工具Gen-2的一部分。Runway動(dòng)態(tài)筆刷是一種利用人工智能技術(shù)讓靜止圖片中的物體動(dòng)起來的功能,你只需要在圖片上用畫筆涂抹你想要?jiǎng)悠饋淼牟糠郑琑unway就會(huì)自動(dòng)識(shí)別物體的運(yùn)動(dòng)軌跡和特征,生成逼真的動(dòng)態(tài)效果。該工具的發(fā)布引起業(yè)界不小的關(guān)注。

在Pika 1.0和Sora出現(xiàn)之前,Runway的Gen-2模型被認(rèn)為是AI視頻制作的頂尖模型,它制作出來的視頻效果逼真、流暢、高清。隨著OpenAI Sora的發(fā)布,Runway接下來或許會(huì)有新動(dòng)作,在Sora發(fā)布之后,Runway CEO第一時(shí)間在X上發(fā)推特稱“game on(競(jìng)爭(zhēng)開始了)”。

Stable Video Diffusion

在圖片生成領(lǐng)域遙遙領(lǐng)先的Stability AI,去年11月發(fā)布了其最新的AI模型Stable Video Diffusion,這款模型能夠通過現(xiàn)有圖片生成視頻,是基于之前發(fā)布的Stable Diffusion文本轉(zhuǎn)圖片模型的延伸,不過當(dāng)時(shí),這款模型并不是對(duì)所有人開放的。

據(jù)介紹,Stable Video Diffusion當(dāng)時(shí)還處于Stability AI所謂的“研究預(yù)覽”階段。想要使用這款模型的人必須同意一些使用條款,其中規(guī)定了Stable Video Diffusion的預(yù)期應(yīng)用場(chǎng)景(例如教育或創(chuàng)意工具、設(shè)計(jì)和其他藝術(shù)過程等)和非預(yù)期的場(chǎng)景(例如對(duì)人或事件的事實(shí)或真實(shí)的表達(dá))。

從網(wǎng)友對(duì)比反饋來看,Stable Video Diffusion生成視頻的效果可以與當(dāng)時(shí)被看好的的Runway 和Pika Labs 的AI生成視頻相媲美。不過局限性在于,Stability AI的視頻生成模型,不能生成沒有運(yùn)動(dòng)或緩慢的攝像機(jī)平移的視頻,也不能通過文本進(jìn)行控制,也不能渲染文字(至少不能清晰地渲染),也不能一致地“正確地”生成人臉和人物。

寫在最后

目前來看,在視頻生成方面,表現(xiàn)比較優(yōu)秀的幾個(gè)模型就是上文提到的OpenAI發(fā)布的Sora,以及Pika labs、Runway、Stability AI發(fā)布的視頻模型。其中Sora無論是在時(shí)長(zhǎng),還是運(yùn)鏡、畫面細(xì)節(jié)等方面都更為突出。Stability AI的模型目前還不能進(jìn)行文本生成視頻。

除了這幾款視頻生成工具之外,還有一些企業(yè)在文生視頻方面也有動(dòng)作,包括Adobe,該公司宣布已收購(gòu)AI視頻生成創(chuàng)業(yè)公司Rephrase.ai;谷歌,其團(tuán)隊(duì)已經(jīng)發(fā)布發(fā)布了視頻生成模型VideoPoet。

國(guó)內(nèi)的字節(jié)跳動(dòng)、百度、阿里在這方面也有動(dòng)作。字節(jié)跳動(dòng)此前就推出了一款視頻模型Boximator,可以通過文本精準(zhǔn)控制生成視頻中人物或物體的動(dòng)作。不過近日,字節(jié)跳動(dòng)對(duì)此回應(yīng)稱,Boximator是視頻生成領(lǐng)域控制對(duì)象運(yùn)動(dòng)的技術(shù)方法研究項(xiàng)目,目前還無法作為完善的產(chǎn)品落地,距離國(guó)外領(lǐng)先的視頻生成模型在畫面質(zhì)量、保真率、視頻時(shí)長(zhǎng)等方面還有很大差距。

另外值得關(guān)注的是,2月23日消息,谷歌資深科學(xué)家、VideoPoet項(xiàng)目負(fù)責(zé)人蔣路已加入字節(jié)跳動(dòng)旗下短視頻社交平臺(tái)TikTok。字節(jié)跳動(dòng)接下來在視頻生成方面的研究還是可以期待一下。

早前就傳出百度文心大模型視頻生成功能在內(nèi)測(cè)中,不過目前還沒進(jìn)展的消息。阿里在去年底也上線了Animate Anyone模型,通過一張圖片就能生成視頻,當(dāng)時(shí)有網(wǎng)友用一張照片生成了一段跳舞視頻,每一個(gè)動(dòng)作都十分自然,幾乎可以亂真,在網(wǎng)絡(luò)上引起大量傳播。

總的來說,目前國(guó)內(nèi)外已經(jīng)有不少企業(yè)在探索視頻生成領(lǐng)域,包括國(guó)內(nèi)的字節(jié)跳動(dòng)、百度、阿里,雖然已經(jīng)逐漸有一些進(jìn)展。不過相比OpenAI、Pika labs、Runway等的視頻模型,還存在差距。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1245

    瀏覽量

    10098
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3651

    瀏覽量

    5194
  • Sora
    +關(guān)注

    關(guān)注

    0

    文章

    86

    瀏覽量

    810
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    人形機(jī)器人燃爆2025慕展!國(guó)內(nèi)外半導(dǎo)體廠商同臺(tái)“秀肌肉”

    電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)4月15日,慕尼黑上海電子展盛大開幕,現(xiàn)場(chǎng)人潮涌動(dòng),眾多國(guó)內(nèi)外廠商參展。MCU、電源管理芯片、功率器件、電感/電容等被動(dòng)器件、傳感器等各類產(chǎn)品紛紛亮相,AI技術(shù)、工業(yè)
    的頭像 發(fā)表于 04-17 09:07 ?3246次閱讀
    人形機(jī)器人燃爆2025慕展!<b class='flag-5'>國(guó)內(nèi)外</b>半導(dǎo)體廠商同臺(tái)“秀肌肉”

    SeaVerse發(fā)布全球首個(gè)AI Native平臺(tái),“All in AI Native”引領(lǐng)AI創(chuàng)作前瞻革命

    2026年1月10日,SeaVerse宣布全球發(fā)布SeaVerse AI平臺(tái)。這是全球首個(gè)AI原生的創(chuàng)建和部署平臺(tái),集合大語(yǔ)言模型、圖像生成、視頻生成、Agent等多方面的能力,通過全
    的頭像 發(fā)表于 01-14 17:41 ?1253次閱讀

    商湯科技日日新Seko系列模型與寒武紀(jì)成功適配

    12月15日,商湯科技基于在生成AI與多模態(tài)交互領(lǐng)域的技術(shù)積累,正式發(fā)布Seko2.0——行業(yè)首個(gè)多劇集生成智能體。該智能體在多劇集視頻生成的一致性方面展現(xiàn)出顯著優(yōu)勢(shì),其背后依托的是
    的頭像 發(fā)表于 12-17 14:06 ?466次閱讀

    國(guó)內(nèi)哪些生成AI 工具最容易上手?企業(yè)真正看重的是“能馬上用起來”

    生成AI 工具國(guó)內(nèi)越來越多,但企業(yè)真正關(guān)心的問題并不是“誰(shuí)的模型更大”“誰(shuí)的 API 更多”,而是一個(gè)更現(xiàn)實(shí)的問題: 到底哪類工具最容
    的頭像 發(fā)表于 12-08 10:55 ?368次閱讀

    OpenAI Sora 2模型上線微軟Azure AI Foundry國(guó)際版

    我們非常激動(dòng)地宣布,OpenAI 的新一代多模態(tài)視頻生成模型 Sora 2 現(xiàn)已在 Azure AI Foundry(國(guó)際版)上線,進(jìn)入公共預(yù)覽階段。
    的頭像 發(fā)表于 10-22 09:44 ?782次閱讀
    OpenAI <b class='flag-5'>Sora</b> 2模型上線微軟Azure <b class='flag-5'>AI</b> Foundry國(guó)際版

    看點(diǎn):谷歌Veo 3.1迎來重大更新硬剛Sora 2 12英寸硅片國(guó)產(chǎn)龍頭西安奕材今日申購(gòu)

    給大家?guī)硪恍I(yè)界資訊: 谷歌Veo 3.1迎來重大更新硬剛Sora 2 據(jù)外媒報(bào)道,在10月16日,谷歌發(fā)布了AI視頻生成模型Veo 3.1,升級(jí)音頻集成與敘事控制能力;以及更逼真的質(zhì)感還原。在
    的頭像 發(fā)表于 10-16 16:00 ?1027次閱讀

    全球首個(gè)動(dòng)漫專屬AI視頻生成平臺(tái)Animon,國(guó)內(nèi)版&quot;萌動(dòng)AI&quot;正式發(fā)布

    Animon國(guó)內(nèi)版——"萌動(dòng)AI"首秀:AI動(dòng)漫創(chuàng)作進(jìn)入全民時(shí)代 北京2025年9月25日?/美通社/ -- CreateAI(OTC:TSPH)今日宣布,其打造的全球首個(gè)專注于動(dòng)漫的AI
    的頭像 發(fā)表于 09-25 12:33 ?962次閱讀

    直線模組品牌大起底:國(guó)內(nèi)外優(yōu)質(zhì)品牌全解析

    全球范圍內(nèi),眾多品牌在直線電機(jī)模組領(lǐng)域不斷深耕,以先進(jìn)技術(shù)和卓越品質(zhì)塑造了良好口碑。接下來,為您詳細(xì)梳理國(guó)內(nèi)外知名直線電機(jī)模組品牌。國(guó)外知名直線模組品牌美國(guó)派克(P
    的頭像 發(fā)表于 07-16 11:26 ?1196次閱讀
    直線模組品牌大起底:<b class='flag-5'>國(guó)內(nèi)外</b>優(yōu)質(zhì)品牌全解析

    HarmonyOS AI輔助編程工具(CodeGenie)UI生成

    UI Generator基于BitFun Platform AI能力平臺(tái),用于快速生成可編譯、可運(yùn)行的HarmonyOS UI工程,支持基于已有UI布局文件(XML),快速生成
    發(fā)表于 07-10 11:51

    4K、多模態(tài)、長(zhǎng)視頻AI視頻生成的下一個(gè)戰(zhàn)場(chǎng),誰(shuí)在領(lǐng)跑?

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎) 6月11日,豆包App上線視頻生成模型豆包Seedance 1.0 pro。這是字節(jié)跳動(dòng)最新視頻模型,支持文字與圖片輸入,可生成多鏡頭無縫切換的1080P高品質(zhì)
    的頭像 發(fā)表于 06-16 00:13 ?7297次閱讀

    AKOOL發(fā)布全球首款實(shí)時(shí)攝像頭

    近日,硅谷新銳公司AKOOL發(fā)布全球首款實(shí)時(shí)攝像頭Akool Live Camera,集虛擬數(shù)字人、AI視頻翻譯、實(shí)時(shí)換臉、實(shí)時(shí)AI視頻生成四大功能于一身,重新定義了
    的頭像 發(fā)表于 06-09 16:30 ?2232次閱讀

    國(guó)內(nèi)外電機(jī)結(jié)構(gòu) 工藝對(duì)比分析

    純分享帖,需要者可點(diǎn)擊附件免費(fèi)獲取完整資料~~~*附件:國(guó)內(nèi)外電機(jī)結(jié)構(gòu) 工藝對(duì)比分析.pdf【免責(zé)聲明】本文系網(wǎng)絡(luò)轉(zhuǎn)載,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問題,請(qǐng)第一時(shí)間告知,刪除內(nèi)容!
    發(fā)表于 05-29 14:06

    生成式人工智能認(rèn)證:重塑AI職業(yè)生態(tài)的底層邏輯

    在人工智能技術(shù)滲透至社會(huì)毛細(xì)血管的今天,生成式人工智能(Generative AI)的崛起正在改寫人類與技術(shù)的協(xié)作范式。從ChatGPT引爆的全球熱潮,到Sora模型推動(dòng)的文生視頻革命
    的頭像 發(fā)表于 05-23 09:17 ?820次閱讀

    國(guó)內(nèi)外半導(dǎo)體廠商涌現(xiàn)慕展,共話產(chǎn)業(yè)新風(fēng)向! ——2025慕尼黑上海電子展官方視頻采訪集錦(下)

    2025年4月15日到17日,一年一度的行業(yè)盛會(huì)——慕尼黑上海電子展盛大舉行。電子發(fā)燒友網(wǎng)做為慕展的官方視頻采訪合作伙伴,邀請(qǐng)諸多國(guó)內(nèi)外半導(dǎo)體廠商來到直播間進(jìn)行了視頻采訪。以下是廠商代表們對(duì)產(chǎn)品精彩
    發(fā)表于 04-23 16:33 ?1432次閱讀
    <b class='flag-5'>國(guó)內(nèi)外</b>半導(dǎo)體廠商涌現(xiàn)慕展,共話產(chǎn)業(yè)新風(fēng)向! ——2025慕尼黑上海電子展官方<b class='flag-5'>視頻</b>采訪集錦(下)

    國(guó)內(nèi)外半導(dǎo)體廠商涌現(xiàn)慕展,共話產(chǎn)業(yè)新風(fēng)向! ——2025慕尼黑上海電子展官方視頻采訪集錦(上)

    2025年4月15日到17日,一年一度的行業(yè)盛會(huì)——慕尼黑上海電子展盛大舉行。電子發(fā)燒友網(wǎng)做為慕展的官方視頻采訪合作伙伴,邀請(qǐng)諸多國(guó)內(nèi)外半導(dǎo)體廠商來到直播間進(jìn)行了視頻采訪。以下是廠商代表們對(duì)產(chǎn)品精彩
    發(fā)表于 04-23 16:28 ?1558次閱讀
    <b class='flag-5'>國(guó)內(nèi)外</b>半導(dǎo)體廠商涌現(xiàn)慕展,共話產(chǎn)業(yè)新風(fēng)向! ——2025慕尼黑上海電子展官方<b class='flag-5'>視頻</b>采訪集錦(上)