91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

從AI作畫到AI做視頻,這一跳改變了什么?

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2022-10-18 20:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

九月初的時候,AI繪畫作品《太空歌劇院》在美國獲得了人類藝術(shù)競賽一等獎的新聞讓許多人震驚不已。學多人沒有想到,畫沙雕圖的AI竟然這么快就技能進步到超越了人類。AI作畫的時間從年初以小時為單位到現(xiàn)在短到秒級別,并且繪出的圖像質(zhì)量越來越高,幾乎接近人類專業(yè)畫家的水平。我們在社交媒體中也看到越來越多的人分享他們在各種AI作畫平臺上的作品。

AI作畫的風頭正盛,用AI做視頻的應用也悄然而至。九月底Meta小扎公布了自家Make-A-Video的AI視頻制作工具。這款工具可以生成高質(zhì)量的短視頻。Meta AI做視頻的新聞還沒有焐熱,谷歌也不甘示弱,推出了兩款AI生成視頻的工具:Imagen Video 和 Phenaki。前者傾向于打造視頻質(zhì)量,后者傾向于視頻的邏輯與時長。這幾款AI視頻制作工具各有特色。

文本生成圖像的AI技術(shù)大火才不過幾個月,就直接躍升至文本生成動態(tài)視頻。從畫圖到做視頻,AI的發(fā)展速度令人訝異,同時令人對未來的數(shù)字媒體憧憬。那么,這種跨越到底會給未來帶來什么呢?

AI做視頻是AI作圖的延伸

在討論AI生成視頻會給未來帶來哪些改變前,我們先梳理下,AI生成視頻的技術(shù)原理和應用場景。

先從Meta家的Make-A-Video看起。在小扎公布的視頻中,我們可以看到一場AI制作的視頻秀,其中一幕是泰迪熊正在畫自畫像。僅僅通過文本描述,Make-A-Video就可以生成一段視頻。官網(wǎng)的案例中,我們會發(fā)現(xiàn)還有一些會飛的超人狗狗、喝水的馬等,這些視頻都是由AI生成的。

谷歌的Phenaki工具也類似Make-A-Video,可以通過一系列的文本提示生成有故事性的連貫視頻。如官網(wǎng)展示的騎馬太空人、游泳的小熊等。

從AI作畫到AI制作視頻,靜態(tài)的圖像創(chuàng)作又轉(zhuǎn)化為動態(tài)的視頻演繹一些簡單的情節(jié)片段,這些是如何依靠技術(shù)達成的呢?

AI繪畫的原理,簡單來說是通過神經(jīng)網(wǎng)絡模型將圖像與文本連接,基于大規(guī)模的圖文訓練集對比學習訓練,提取文本與圖像特征互相匹配,最終生成關(guān)聯(lián)程度較高的圖像。

與AI作畫相比,AI生成視頻需要多個AI模型的配合來完成視頻的制作。作畫與做視頻的第一步都需要預訓練文本-圖像模型,先由文本生成大量的圖像。而后續(xù)的步驟就出現(xiàn)較大的差別。AI生成視頻,在完成基本的圖像生成之后,還需要將這些圖片連起來,變成動態(tài)清晰有邏輯的視頻。這就需要額外增加插值模型來處理圖片變成一幀幀流暢的視頻動作,用超分辨率模型來提升圖像的像素。通過這些模型的處理,讓前后幀之間的過渡動作更加平滑,畫質(zhì)的像素質(zhì)量更高,最終生成高分辨率和幀率的視頻。

相較于AI作畫,從技術(shù)上來看,視頻可以認為是多張“圖片”有邏輯、連貫的組成。視頻幀是一張張圖像,各幀之間有畫面、邏輯等層面的關(guān)聯(lián)。因此,由文生圖與由文生視頻完全是兩種難度級別。AI生成視頻,是AI生成圖像的深度延伸。

AI生成視頻相對更難實現(xiàn)。為什么AI研究人員會向視頻領域的創(chuàng)作進發(fā)?AI做視頻到底有什么應用價值呢?

AI做視頻價值幾何?

移動互聯(lián)網(wǎng)的繁榮,催生出了各類社交和流媒體平臺。這些平臺中豐富的圖文、視頻內(nèi)容,成為當代人碎片時間的精神食糧。伴隨短視頻平臺和直播行業(yè)的興起,人們對內(nèi)容的需求越來越旺盛。這也筑造了規(guī)模龐大的泛內(nèi)容產(chǎn)業(yè)。

對于內(nèi)容的創(chuàng)作,核心的是創(chuàng)意與效率。但以人為核心模式的創(chuàng)作模式在高速迭代的內(nèi)容產(chǎn)業(yè)中似乎越來越趕不上趟。應用AI技術(shù)來輔助內(nèi)容創(chuàng)作的AIGC模式,開始滲入到泛內(nèi)容領域中。

從視頻的創(chuàng)作角度來說,在腳本外,尋找匹配適合的視頻素材是創(chuàng)作的核心。雖然行業(yè)內(nèi)有大量的素材庫,但尋覓素材的過程耗費時間,并且也不一定能找到符合腳本內(nèi)容的視頻素材。

面對提升效率與貼合腳本內(nèi)容的需求,AI生成視頻工具可以很好地解決這類問題。谷歌和Meta的AI視頻工具都可以基于文本描述生成視頻。

Make-A-Video目前可以實現(xiàn)文字轉(zhuǎn)視頻、圖片轉(zhuǎn)視頻、視頻生成視頻三種功能場景。谷歌Imagen Video不僅能生成高清視頻,而且能理解并生成不同藝術(shù)風格的作品。而谷歌Phenaki目前可以做到文字轉(zhuǎn)視頻,并且根據(jù)文字描述可以生成較長、情節(jié)連貫的作品。Phenaki瞄準的是長視頻的制作。

無論是短視頻領域,還是長視頻領域,面向這些行業(yè),AI生成視頻都會為視頻內(nèi)容行業(yè)的發(fā)展賦予價值。

1.提升視頻制作效率的同時降低制作成本。傳統(tǒng)的視頻制作需要腳本、收集素材、剪輯等流程,每一項工作都需要耗費大量的時間與成本。AI生成視頻可以通過文本生成視頻,或者由圖片、視頻等素材生成視頻,可以降低拍攝或搜集視頻素材的成本。AI可以對應著腳本文本的描述,就能生成視頻,大幅提高視頻制作的效率。

2.增加豐富的創(chuàng)意。AI大模型可以遍歷學習所有的創(chuàng)意與風格。從內(nèi)容的豐富度來說,人類無法企及。通過不同風格、創(chuàng)意素材的喂養(yǎng),AI視頻生成可以創(chuàng)作出多種風格融合的作品,補充人類制作視頻的創(chuàng)意。

3.增加內(nèi)容產(chǎn)業(yè)價值。AI視頻生成對視頻內(nèi)容領域的革新,為行業(yè)帶來新的應用場景與新工種。AI作畫已經(jīng)誕生出了新的職業(yè)AI畫師。類似AI作圖,AI做視頻也會誕生出新的職業(yè),AI剪輯師,應用AI工具創(chuàng)作視頻。未來AI生成視頻將會與游戲、影視、媒體等多行業(yè)結(jié)合,與元宇宙、AR、VR等場景碰撞,創(chuàng)造出更多的場景與產(chǎn)業(yè)價值。

不過現(xiàn)下AI生成視頻的發(fā)展處于非常初級的階段,并不能完全生成出較完善的視頻。我們在谷歌和Meta中看到的視頻,仍然存在許多問題。比如視頻動作過渡不自然、理解角度詭異、視頻分辨率不高等。這些情況的出現(xiàn)原因在于AI工具模型的能力不高,對模型投喂的素材數(shù)據(jù)質(zhì)量有一定的要求。如果這些問題得不到較好的解決,也會限制未來一些場景的應用可能,如對于像素和邏輯要求較高的商業(yè)影視劇。而短平快的小視頻根據(jù)分發(fā)渠道的不同,質(zhì)量的參差帶來的影響不同。但歸根結(jié)底,高質(zhì)量的視頻內(nèi)容商業(yè)化的可能性會更大。

未來的商業(yè)模式

AI生成視頻,未來的商業(yè)模式取決于不同的應用場景。面對一些制作短視頻為主的小B端企業(yè),如媒體、廣告、電商等行業(yè)。谷歌、Meta等AI企業(yè)會為這些小B端企業(yè)提供AI視頻制作應用服務。類似AI作畫的商業(yè)邏輯,可能提供按次收費、按時長付費或者是按照不同功能與需求的制作收費,助力這些行業(yè)提升內(nèi)容創(chuàng)造的效率,增加在線視頻領域的流量。不過這種商業(yè)模式的發(fā)展必須以規(guī)?;危@樣才能有可持續(xù)發(fā)展的可能,畢竟AI廠商的視頻工具開發(fā)與運維成本較高。

對于以流媒體平臺分發(fā)為主,制作中長視頻的影視行業(yè)來說,需求的頻次與質(zhì)量要求較高,因此AI廠商需要提供的是解決方案為主的服務,甚至是定制化的服務,提供專屬的創(chuàng)作模塊,比如特效、運鏡、轉(zhuǎn)場等模塊化工具。這種商業(yè)模式的價值高,但對于整個影視行業(yè)以及上下游產(chǎn)業(yè)鏈來說,是巨大的變革。產(chǎn)業(yè)需要花費較長時間地過渡與適應。

除了影視企業(yè)以外,游戲行業(yè)與AI視頻制作也會有可能碰撞出火花。游戲行業(yè)的視頻內(nèi)容開發(fā)可以借助AI生成視頻來提高創(chuàng)意與效率,降低開發(fā)的成本。對于游戲行業(yè)的商業(yè)模式也會類似影視行業(yè)提供專門的行業(yè)解決方案。

當然,整個產(chǎn)業(yè)領域中,也有一些企業(yè)對視頻生成的需求并不高,但也不是完全沒有需求。比如大多數(shù)小企業(yè)都需要簡單的企業(yè)宣傳視頻,或是年度的幾場活動需要視頻內(nèi)容宣傳支持。一年可能就兩三次的需求,頻次較低。這些企業(yè)并沒有專業(yè)的視頻制作人員,可能會選擇應用AI生成視頻工具。

如果觀察的視角從企業(yè)轉(zhuǎn)向個體的話,大部分個人消費者也可以應用AI生成視頻來娛樂。就像AI作圖一般,AI生成的視頻也會成為新的社交媒體話題。網(wǎng)友可以通過輸入文本指令生成各種各樣的視頻,交流創(chuàng)意。我們或許會從被投喂的角色,轉(zhuǎn)化為創(chuàng)作者互相分享,交流創(chuàng)意與思想。

這些商業(yè)模式的可能性建立在視頻內(nèi)容優(yōu)良與成本合理的前提下。未來AI視頻商業(yè)化的過程中,可能依然會面臨版權(quán)和倫理的問題。無論是素材庫還是AI生成視頻的風格養(yǎng)成,都離不開人類創(chuàng)作的圖像、視頻等內(nèi)容。AI工具需要這些人類創(chuàng)作的圖像數(shù)據(jù)訓練迭代。這也意味著在版權(quán)方面依然存在歸屬爭議的灰色地帶。倫理方面,當輸入暴力、血腥、黃色等敏感信息,生成的內(nèi)容可能會陷入倫理道德的困境。這些問題會伴隨著視頻生成長期存在,需要設置更好的機制與模式去減少這類事情的發(fā)生。

與AI做視頻不同,AI作圖最終內(nèi)容可以抽象。這種圖像內(nèi)容可能藝術(shù)價值更高。但對于視頻來說,內(nèi)容必須連貫、有邏輯。這也對AI生成視頻的能力提出了要求。AI生成長視頻是否有邏輯,可以根據(jù)文本表達出故事性,仍然是個未知數(shù)。尤其是一些深度的內(nèi)容制作,AI是否能夠創(chuàng)作出這類內(nèi)容需要打個問號。而這些AI到達不了的領域,就是人類創(chuàng)作的價值地所在。

內(nèi)容的創(chuàng)作,藝術(shù)的創(chuàng)作最終導向的是連接,或者是連接智慧,或者是連接靈魂。人們借由藝術(shù)表達共鳴,而這些都是AI去不了的場域。未來,或許在AI的內(nèi)卷下,是人類高質(zhì)量內(nèi)容創(chuàng)作的高峰。

審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39911

    瀏覽量

    301556
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50115

    瀏覽量

    265588
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    邊緣AI算力臨界點:深度解析176TOPS香橙派AI Station的產(chǎn)業(yè)價值

    ” 。 隨著DeepSeek、LLaMA等開源模型的輕量化演進,以及具身智能、工業(yè)質(zhì)檢對實時性的嚴苛要求,AI計算正在從云數(shù)據(jù)中心擴散到離數(shù)據(jù)源頭最近的物理世界。在這一背景下,AI Mini Server(迷你
    發(fā)表于 03-10 14:19

    使用NORDIC AI的好處

    原始傳感器數(shù)據(jù),可顯著降低功耗、延長電池壽命。[Edge AI 概述; Nordic Edge AI 技術(shù)頁] 降低云依賴與時延 直接在設備上推理,很多決策可以“本地實時”完成,不必等云端響應
    發(fā)表于 01-31 23:16

    VS680 HDMI AI分析解決方案 #目標識別 #視頻翻譯 #AI #芯片

    AI
    深蕾半導體
    發(fā)布于 :2025年11月12日 10:29:33

    AI模型的配置AI模型該怎么

    STM32可以跑AI,這個AI模型怎么搞,知識盲區(qū)
    發(fā)表于 10-14 07:14

    AI賦能6G與衛(wèi)星通信:開啟智能天網(wǎng)新時代

    \"更清晰\"的秘訣 衛(wèi)星通信面臨的大挑戰(zhàn)是信號衰減和干擾。當衛(wèi)星信號穿越大氣層時,會受到天氣、電離層變化等因素的影響,導致信號質(zhì)量下降。而AI正在改變這一局面。 通過機器學習和深度
    發(fā)表于 10-11 16:01

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學應用

    AI被賦予了人的智能,科學家們希望在沒有人類的引導下,AI自主的提出科學假設,諾貝爾獎級別的假設哦。 AI驅(qū)動科學被認為是科學發(fā)現(xiàn)的第五個范式了,與實驗科學、理論科學、計算科學、數(shù)據(jù)驅(qū)動科學
    發(fā)表于 09-17 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)

    當今社會,AI已經(jīng)發(fā)展很迅速了,但是你了解AI的發(fā)展歷程嗎?本章作者將為我們打開AI的發(fā)展歷程以及需求和挑戰(zhàn)的面紗。 2017年開始生成式AI
    發(fā)表于 09-12 16:07

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+可期之變:AI硬件到AI濕件

    ,又分為真菌計算和基于DNA的計算。 圖4 基本的真菌計算機結(jié)構(gòu) 在用化學和生物方法實現(xiàn)AI功能的過程中,要經(jīng)歷5個階段,見圖5所示。 圖5 以化學和生物方法實現(xiàn)AI功能各階段 期待AI
    發(fā)表于 09-06 19:12

    AI 芯片浪潮下,職場晉升新契機?

    在科技飛速發(fā)展的當下,AI 芯片已然成為眾多行業(yè)變革的核心驅(qū)動力。互聯(lián)網(wǎng)巨頭的數(shù)據(jù)中心,到我們?nèi)粘J褂玫闹悄苁謾C、智能家居設備,AI 芯片的身影無處不在,深刻改變著產(chǎn)品形態(tài)與服務模式
    發(fā)表于 08-19 08:58

    AI 邊緣計算網(wǎng)關(guān):開啟智能新時代的鑰匙?—龍興物聯(lián)

    這一過程常受網(wǎng)絡延遲和不穩(wěn)定的困擾。如今,借助 AI 邊緣計算網(wǎng)關(guān),數(shù)據(jù)處理任務下沉至網(wǎng)絡邊緣,在本地即可快速完成。以智能安防監(jiān)控為例,在大型商場中,眾多監(jiān)控攝像頭采集的視頻數(shù)據(jù),通過 AI
    發(fā)表于 08-09 16:40

    【書籍評測活動NO.64】AI芯片,過去走向未來:《AI芯片:科技探索與AGI愿景》

    問題請咨詢工作人員(微信:elecfans_666)。 AI芯片,過去走向未來 四年前,市面上僅有的AI芯片全書在世界范圍內(nèi)掀起
    發(fā)表于 07-28 13:54

    AI視頻分析和算法集合

    AI
    jf_02235694
    發(fā)布于 :2025年07月23日 16:10:12

    大家都在用什么AI軟件?有沒有好用的免費的AI軟件推薦下?

    大家都在用什么AI軟件?有沒有好用的免費的AI軟件推薦下?直接發(fā)個安裝包,謝謝。比如deepseek、Chatgpt、豆包、阿里AI、百度AI
    發(fā)表于 07-09 18:30

    AI將如何改變自動駕駛?

    [首發(fā)于智駕最前沿微信公眾號]五一假期繼續(xù)閑聊下,還歡迎大家隨意留言,隨著人工智能(AI)的發(fā)展,很多車企及自動駕駛供應商正嘗試將AI融入自動駕駛系統(tǒng),為何大家都在積極推動這一技術(shù)?
    的頭像 發(fā)表于 05-04 09:58 ?854次閱讀

    AI 時代開啟,企業(yè)跟風 AI 產(chǎn)品是明智之舉?

    AI
    華成工控
    發(fā)布于 :2025年04月10日 17:28:44