91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌DeepMind重磅發(fā)布了基礎世界模型:Genie(精靈)

vliwulianw ? 來源:軟件質量報道 ? 2024-02-28 10:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大家都喜歡玩游戲吧?因為游戲最大的吸引力是讓我們逃避現(xiàn)實、幻想一個遠離我們眼前現(xiàn)實的世界,掌控這個虛擬的現(xiàn)實世界?,F(xiàn)在,我們可以想象一下,如果我們有能力創(chuàng)造自己的世界,那該多好了。 讓我們激動的這一天來了! 北美時間26號下午,GoogleGenie團隊的負責人Tim Rockt?schel非常興奮地宣布:Google DeepMindOpen Endedness團隊開發(fā)的基于互聯(lián)網(wǎng)視頻訓練的基礎世界模型(foundation world model)——Genie

(幽靈)發(fā)布了,它可以根據(jù)圖像提示生成無窮無盡的可控動作2D世界的各種變化。這個110億參數(shù)大模型Genie,能從一張圖片就能創(chuàng)造出可玩的虛擬世界,動作可控,這也預示著,AI已經(jīng)真正殺到視頻游戲領域了。

084845f0-d5db-11ee-a297-92fbcf53809c.png

0853455e-d5db-11ee-a297-92fbcf53809c.png

什么是Genie(精靈)?

根據(jù) Google DeepMind 的官方博客文章,Genie 是一個基礎世界模型,它是根據(jù)來自互聯(lián)網(wǎng)的視頻進行訓練的。該模型可以“從合成圖像、照片甚至草圖中生成無窮無盡的可玩(動作可控)世界”。 研究論文 “Genie:Generative Interactive Environments” 指出,Genie是第一個從未標記的互聯(lián)網(wǎng)視頻中以無監(jiān)督方式訓練的生成式交互式環(huán)境。在大小方面,Genie 的參數(shù)為 11B,由時空視頻標記器(spatiotemporal videotokenizer)、自回歸動力學模型(autoregressive dynamics model)和簡單且可擴展的潛在動作模型(simple and scalable latent action model)組成。

這些技術規(guī)范允許 Genie 在生成的環(huán)境中逐幀運行,即使在沒有訓練、標注或任何其他特定領域要求的情況下也是如此。

Genie 能做什么的?

根據(jù)這篇研究論文,Genie是一種新型的生成式人工智能,它使任何人(甚至是兒童)都能夢想并進入類似于人類設計的模擬環(huán)境的生成世界。可以提示 Genie 生成一組不同的交互式和可控環(huán)境,盡管它是在純視頻數(shù)據(jù)上訓練的。

簡而言之,我們已經(jīng)看到了許多生成式 AI 模型,它們使用語言、圖像甚至視頻生成創(chuàng)意內(nèi)容。Genie 是一個突破,因為它可以從單個圖像提示中創(chuàng)建可玩的環(huán)境。

試著記住《哈利·波特與魔法石》中哈利和他的朋友們在前往格蘭芬多公共休息室的路上進入霍格沃茨城堡的場景。年輕的學生們看到一面墻上掛滿了畫作,每個角色都在他們的畫面中慢慢地移動,這些畫作栩栩如生。Genie能使靜止圖像栩栩如生,賦予我們一個自己的世界。

根據(jù) Google DeepMind 的說法,Genie 可以收到它從未見過的圖像提示,這包括現(xiàn)實世界的照片、草圖,允許人們與他們想象的虛擬世界互動,這就是稱之為“基礎世界模型”。在培訓方面,研究論文強調,他們更關注2D平臺游戲和機器人技術的視頻。Genie 使用通用方法進行訓練,使其能夠在任何類型的域上運行,并且可以擴展到更大的 Internet 數(shù)據(jù)集。

為什么Genie很重要?

Genie 的突出之處在于它能夠從互聯(lián)網(wǎng)視頻中學習和重現(xiàn)游戲中角色的控制。這是值得注意的,因為互聯(lián)網(wǎng)視頻沒有關于視頻中執(zhí)行的動作的標簽,甚至沒有關于應該控制圖像的哪一部分的標簽。

Google 博客文章寫道:“Genie不僅可以學習觀察的哪些部分通常是可控的,還可以推斷出在生成的環(huán)境中一致的各種潛在行為。請注意,相同的潛在動作如何在不同的提示圖像中產(chǎn)生相似的行為,“ 根據(jù) Google DeepMind 的說法,該模型最獨特的方面是:它允許您從單個圖像創(chuàng)建一個全新的交互式環(huán)境。這開辟了許多可能性,尤其是創(chuàng)建和進入虛擬世界的新方法。為了證明這一點,研究人員使用文本到圖像模型Imagen 2創(chuàng)建了一個圖像,然后將其用作創(chuàng)建虛擬世界的提示。草圖也可以做同樣的事情。

有了 Genie,任何人都可以創(chuàng)建自己完全想象的虛擬世界。此外,該模型學習和開發(fā)新世界模型的能力標志著向通用人工智能代理(一個獨立的程序或實體,通過傳感器感知其周圍環(huán)境來與環(huán)境交互)的重大飛躍。 開啟另一個旅程:




審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6254

    瀏覽量

    111624
  • 人工智能
    +關注

    關注

    1819

    文章

    50164

    瀏覽量

    266023
  • 大模型
    +關注

    關注

    2

    文章

    3689

    瀏覽量

    5213

原文標題:基礎世界模型Google Genie誕生了:根據(jù)提示生成無窮無盡的、可交互的2D世界

文章出處:【微信號:軟件質量報道,微信公眾號:軟件質量報道】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    大曉機器人開源實時生成世界模型Kairos 3.0-4B

    近日,大曉機器人重磅開源開悟世界模型3.0(Kairos 3.0)-4B 系列具身原生世界模型。作為業(yè)內(nèi)首個實現(xiàn) “多模態(tài)理解 — 生成 —
    的頭像 發(fā)表于 03-14 16:54 ?1850次閱讀
    大曉機器人開源實時生成<b class='flag-5'>世界</b><b class='flag-5'>模型</b>Kairos 3.0-4B

    如何構建適合自動駕駛的世界模型?

    [首發(fā)于智駕最前沿微信公眾號]世界模型經(jīng)歷系統(tǒng)動力學階段(1960年~2000年)、認知科學階段(2001年~2017年)、深度學習階段(2018年至今),但將其應用到自動駕駛汽車上,還是近幾年才
    的頭像 發(fā)表于 02-18 08:14 ?1.1w次閱讀
    如何構建適合自動駕駛的<b class='flag-5'>世界</b><b class='flag-5'>模型</b>?

    云知聲山海知音大模型2.0重磅發(fā)布

    隨著智能體時代到來,云知聲在“山海·Atlas”通用智算基座持續(xù)演進基礎上,年前實現(xiàn)“山?!ぶt(yī)”5.0醫(yī)療大模型升級,今天迎來了“山?!ぶ簟?.0的重磅發(fā)布,正在完成“一基兩翼”
    的頭像 發(fā)表于 01-27 14:08 ?250次閱讀
    云知聲山海知音大<b class='flag-5'>模型</b>2.0<b class='flag-5'>重磅</b><b class='flag-5'>發(fā)布</b>

    谷歌正式發(fā)布Gemma Scope 2模型

    大語言模型 (LLM) 具備令人驚嘆的推理能力,但其內(nèi)部決策過程在很大程度上仍然不透明。如果系統(tǒng)未按預期運行,對其內(nèi)部運作機制缺乏可見性將難以準確定位問題根源。過去,我們通過發(fā)布 Gemma
    的頭像 發(fā)表于 01-24 14:01 ?603次閱讀

    VLA與世界模型有什么不同?

    [首發(fā)于智駕最前沿微信公眾號]當前自動駕駛行業(yè),各車企的技術路徑普遍選擇單車智能方向。而在實際落地過程中,不同企業(yè)選擇差異化的技術實現(xiàn)方式,部分車企側重于視覺—語言—動作模型(Vision
    的頭像 發(fā)表于 12-17 09:13 ?690次閱讀
    VLA與<b class='flag-5'>世界</b><b class='flag-5'>模型</b>有什么不同?

    泰凌微:布局端側AI,產(chǎn)品支持谷歌LiteRT、TVM開源模型

    。 ? 公司發(fā)布的基于TL721X系列芯片的TL-EdgeAI平臺,支持谷歌LiteRT、TVM等開源模型,是目前世界上功耗最低的智能物聯(lián)網(wǎng)連接協(xié)議平臺。其芯片已在
    的頭像 發(fā)表于 12-15 08:21 ?1w次閱讀

    Gemini AI 再進化:谷歌聯(lián)合XREAL發(fā)布Project Aura, 打開“看見世界”的新能力

    [2025年12月9日,美國加利福尼亞州山景城]?—— 在今日舉行的 The Android Show 上,谷歌首次公布 Project Aura產(chǎn)品和 Android XR系統(tǒng)的關鍵細節(jié),該產(chǎn)品
    發(fā)表于 12-09 11:06 ?1296次閱讀
    Gemini AI 再進化:<b class='flag-5'>谷歌</b>聯(lián)合XREAL<b class='flag-5'>發(fā)布</b>Project Aura, 打開“看見<b class='flag-5'>世界</b>”的新能力

    利用NVIDIA Cosmos開放世界基礎模型加速物理AI開發(fā)

    NVIDIA 最近發(fā)布 NVIDIA Cosmos 開放世界基礎模型(WFM)的更新,旨在加速物理 AI 模型的測試與驗證數(shù)據(jù)生成。借助
    的頭像 發(fā)表于 12-01 09:25 ?1228次閱讀

    中科曙光助力紫東太初4.0大模型重磅發(fā)布

    近日,全球首個“深度推理+多模態(tài)”大模型——“紫東太初”4.0在2025東湖國際人工智能高峰論壇上正式發(fā)布。中科曙光作為核心生態(tài)伙伴,依托中國首個AI計算開放架構,為“紫東太初”4.0提供圖文多模態(tài)模型訓推、大語言
    的頭像 發(fā)表于 09-24 09:33 ?695次閱讀

    谷歌DeepMind重磅發(fā)布Genie 3,首次實現(xiàn)世界模型實時交互

    電子發(fā)燒友網(wǎng)綜合報道 當?shù)貢r間2025年8月5日,谷歌DeepMind正式推出第三代通用世界模型Genie3。這款被英偉達科學家Jim Fa
    的頭像 發(fā)表于 08-13 08:27 ?6999次閱讀

    商湯大裝置重磅發(fā)布多項標志性成果

    在2025世界人工智能大會(WAIC 2025)期間,作為“最懂大模型的AI基礎設施”,商湯大裝置重磅發(fā)布多項標志性成果,持續(xù)打造AI基礎設施發(fā)展新范式,力推動產(chǎn)業(yè)生態(tài)與應用場景的系統(tǒng)
    的頭像 發(fā)表于 08-05 10:07 ?1103次閱讀

    愛芯元智重磅發(fā)布邊緣計算戰(zhàn)略

    近日,愛芯元智在2025世界人工智能大會上重磅發(fā)布邊緣計算戰(zhàn)略。展會現(xiàn)場匯聚了眾多行業(yè)精英,共同見證愛芯元智邊緣計算與AI融合發(fā)展的新路徑,為AI普惠美好生活擘畫新的藍圖。
    的頭像 發(fā)表于 08-01 10:45 ?1369次閱讀

    Genie:產(chǎn)品級Agent開源產(chǎn)品

    京東前兩天發(fā)布一個開源的Agent產(chǎn)品-JoyAgent-JDGenie,在GAIA榜單上分數(shù)達到了75.15%,超越眾多開源的AI Agent項目。 該開源項目提供一個在線體驗
    的頭像 發(fā)表于 07-27 12:40 ?777次閱讀
    <b class='flag-5'>Genie</b>:產(chǎn)品級Agent開源產(chǎn)品

    三張圖深入分析京東開源Genie的8大亮點

    京東開源的Genie智能體的8大亮點: 可插拔多Agent和多種工具 迭代式規(guī)劃 跨任務上下文和文件共享 數(shù)字員工提升用戶體驗 大模型+搜索構建深度搜素 CodeTool構建智能代碼生命周期管理 精心打磨的System Prompt 可配置的MCP Server 審核編輯
    的頭像 發(fā)表于 07-27 12:40 ?518次閱讀
    三張圖深入分析京東開源<b class='flag-5'>Genie</b>的8大亮點

    genie nano c2020無法顯示畫面

    一開始顯示“the packet size may be too large for the network setup”后面減小了數(shù)據(jù)包大小,沒有報錯,但是點擊grab之后沒有畫面 NI MAX和labview都試過了,換另外一個鏡頭就有畫面,genie nano c2020應該沒有壞,請問是為什么呢
    發(fā)表于 04-16 14:19