ABSTRACT摘要
2 月 16 日凌晨,也就是中國(guó)大年初七,OpenAI 在 AI 生成視頻領(lǐng)域扔出一枚“王炸”,宣布推出全新的生成式人工智能模型“Sora”。
這家舊金山公司周四推出的該工具使用生成人工智能,根據(jù)書面命令立即創(chuàng)建短視頻。
JAEALOT
2024年2月16日
2 月 16 日凌晨,也就是中國(guó)大年初七,OpenAI 在 AI 生成視頻領(lǐng)域扔出一枚“王炸”,宣布推出全新的生成式人工智能模型“Sora”。
這家舊金山公司周四推出的該工具使用生成人工智能,根據(jù)書面命令立即創(chuàng)建短視頻。
Sora 并不是第一個(gè)展示這種技術(shù)的產(chǎn)品。但行業(yè)分析師指出,該工具迄今為止展示的視頻質(zhì)量很高,并指出它的推出標(biāo)志著 OpenAI 和文本到視頻生成的未來的整體重大飛躍。
盡管如此,與當(dāng)今快速發(fā)展的人工智能領(lǐng)域的所有事物一樣,此類技術(shù)也引發(fā)了人們對(duì)潛在道德和社會(huì)影響的擔(dān)憂。
Sora 是一款文本到視頻生成器 - 使用生成式 AI 根據(jù)書面提示創(chuàng)建長(zhǎng)達(dá) 60 秒的視頻。該模型還可以從現(xiàn)有的靜態(tài)圖像生成視頻。
生成式人工智能是人工智能的一個(gè)分支,可以創(chuàng)造新的東西。示例包括聊天機(jī)器人(如 OpenAI 的 ChatGPT)以及圖像生成器(如 DALL-E 和 Midjourney)。讓人工智能系統(tǒng)生成視頻是更新且更具挑戰(zhàn)性的,但依賴于一些相同的技術(shù)。
OpenAI 在周四(2 月 15 日)的博客文章中表示, Sora可以根據(jù)用戶的文本提示創(chuàng)建長(zhǎng)達(dá)一分鐘的視頻。
OpenAI 在帖子中表示:“我們正在教人工智能理解和模擬運(yùn)動(dòng)中的物理世界,目的是訓(xùn)練模型來幫助人們解決需要現(xiàn)實(shí)世界交互的問題?!?/p>
OpenAI 在帖子中補(bǔ)充道:“Sora 能夠生成具有多個(gè)角色、特定類型的運(yùn)動(dòng)以及主題和背景的準(zhǔn)確細(xì)節(jié)的復(fù)雜場(chǎng)景?!?“該模型不僅了解用戶在提示中提出的要求,還了解這些東西在物理世界中的存在方式?!?/p>
此外,根據(jù)該帖子,生成式人工智能模型可以基于單個(gè)圖像創(chuàng)建視頻,以及擴(kuò)展現(xiàn)有視頻或填充缺失的幀。
Sora 尚未可供公眾使用(OpenAI 表示,在正式發(fā)布該工具之前,它正在與政策制定者和藝術(shù)家進(jìn)行接觸),而且還有很多我們不知道的事情。但自周四宣布以來,該公司已經(jīng)分享了一些 Sora 生成的視頻示例,以展示其功能。
OpenAI 首席執(zhí)行官 Sam Altman 還利用 X(以前稱為Twitter 的平臺(tái))要求社交媒體用戶及時(shí)發(fā)送想法。后來,他分享了逼真詳細(xì)的視頻,這些視頻響應(yīng)了“兩只金毛獵犬在山頂上播客”和“在海洋上與不同動(dòng)物進(jìn)行自行車比賽,運(yùn)動(dòng)員在無人機(jī)攝像機(jī)視圖下騎自行車”等提示。
雖然 Sora 生成的視頻可以描繪復(fù)雜、極其詳細(xì)的場(chǎng)景,但 OpenAI 指出仍然存在一些弱點(diǎn),包括一些空間和因果元素。例如,OpenAI 在其網(wǎng)站上補(bǔ)充道,“一個(gè)人可能會(huì)咬一口餅干,但之后,餅干可能沒有咬痕?!?/p>
OpenAI 的 Sora 并不是同類產(chǎn)品中的第一個(gè)。谷歌、Meta 和初創(chuàng)公司 Runway ML 等公司都展示了類似的技術(shù)。
-
機(jī)器人
+關(guān)注
關(guān)注
213文章
31092瀏覽量
222350 -
AI
+關(guān)注
關(guān)注
91文章
39820瀏覽量
301500 -
人工智能
+關(guān)注
關(guān)注
1817文章
50102瀏覽量
265523
發(fā)布評(píng)論請(qǐng)先 登錄
商湯科技日日新Seko系列模型與寒武紀(jì)成功適配
OpenAI Sora 2模型上線微軟Azure AI Foundry國(guó)際版
看點(diǎn):谷歌Veo 3.1迎來重大更新硬剛Sora 2 12英寸硅片國(guó)產(chǎn)龍頭西安奕材今日申購(gòu)
全球首個(gè)動(dòng)漫專屬AI視頻生成平臺(tái)Animon,國(guó)內(nèi)版"萌動(dòng)AI"正式發(fā)布
智能體化AI和生成式AI的區(qū)別
【Sipeed MaixCAM Pro開發(fā)板試用體驗(yàn)】基于MaixCAM-Pro的AI生成圖像鑒別系統(tǒng)
亞馬遜云科技現(xiàn)已上線OpenAI開放權(quán)重模型
美泰與OpenAI聯(lián)手,共探生成式AI智能玩具新領(lǐng)域
百度重磅發(fā)布!全球首創(chuàng)中文音視頻模型
一種基于擴(kuò)散模型的視頻生成框架RoboTransfer
OpenAI 在 AI 生成視頻領(lǐng)域扔出一枚“王炸”,視頻生成模型“Sora”
評(píng)論