91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

智能體已經(jīng)能像人一樣刷視頻了?國內(nèi)聯(lián)匯科技OmAgent智能體試用!

新眾報 ? 來源:jf_48880855 ? 作者:jf_48880855 ? 2024-11-22 18:59 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

智能體已經(jīng)能像人一樣刷視頻了?國內(nèi)知名大模型獨角獸級別公司,資深AI玩家聯(lián)匯科技退出了OmAgent智能體,已經(jīng)開啟試用。


當你正在觀看一部緊張刺激的動作電影,忽然好奇:

“那個角色到底是在哪一集說的那句話?”

“這里的背景音樂是什么?”

又或者在一場足球比賽中,你錯過了那個決定性的進球,卻又想再次回放。諸如此類的需求,如果僅憑人力尋找,無疑存在極大的工作量。

但是 AI 能夠為機器配置雙眼與大腦,讓它們能夠看懂視頻、理解劇情,對于普通人來說,這不僅是提高了搜索效率,更是擴展我們與數(shù)字世界的互動方式。

英偉達最新發(fā)布的 NVIDIA AI Blueprint 希望幫助人們解決這一問題。這是一種預訓練的、可自定義 AI 工作流,他為開發(fā)者構(gòu)建和部署用于典型用例的生成式 AI 應用程序提供了一套完整的解決方案。

比如在英偉達提供的試用界面中,你可以選擇三個視頻片段中的一個進行內(nèi)容問答。

wKgaoWdAZACAAiaPAAEkwiGwqls755.png

在幾輪測試過后,我們發(fā)現(xiàn) Blueprint 對視頻問答還是有不錯的效果的。你可以提問某個事件發(fā)生的時間,也可以提問某個對象的狀態(tài)。
例如當我們提問 “工人在什么時候掉落了箱子”,Blueprint 可以正確的回答出時間區(qū)間。二類似于 “叉車往哪個方向開” 這種基于連續(xù)過程的問題,Blueprint 也可以輕松應答。
不過對于某些細節(jié),例如 “誰撿起了掉在地上的箱子”,Blueprint 則給出了錯誤的答案。

wKgZoWdAZACAbe6-AADGVe1SurQ102.png

尤其令人遺憾的是,在試用過程中我們不斷遇到流量限制,無限驗證等問題,試用體驗可以說一言難盡。并且目前 Blueprint 仍然處于早期申請使用制階段,沒有辦法快速進行使用。

wKgaoWdAZAGAL0xhAAFFNrr4ZdM801.png

Blueprint 之外,我們還有什么選擇?

經(jīng)過一番搜索和調(diào)研,我們在 Github 上發(fā)現(xiàn)了 OmAgent 這個項目,這是一個多模態(tài)智能體框架,提供了同樣強大的視頻問答功能。

wKgZoWdAZAGAS8aLAAFgY5obiRk207.png

項目地址:https://github.com/om-ai-lab/OmAgent

OmAgent 是什么

OmAgent 是一個開源的智能體框架,支持簡單快速地面向設(shè)備進行智能體系統(tǒng)的開發(fā),為智能手機、智能可穿戴設(shè)備、智能攝像頭乃至機器人等各類硬件設(shè)備賦能。OmAgent 為各種類型的設(shè)備創(chuàng)建了一個抽象概念,并大大簡化了將這些設(shè)備與最先進的多模態(tài)基礎(chǔ)模型和智能體算法相結(jié)合的過程,使每個人都能基于設(shè)備建立最有趣的 AI 應用。

wKgaoWdAZAKAaM5MAADlcoPXPys526.png

OmAgent 的設(shè)計架構(gòu)遵循三個基本原則:
1. 基于圖的工作流編排,支持分支、循環(huán)、并行等復雜邏輯操作;2. 原生多模態(tài),提供對音視圖文等多種模態(tài)數(shù)據(jù)的支持;3. 設(shè)備中心化,提供便捷的設(shè)備連接和交互方法。
簡單來說,開發(fā)者可以基于 OmAgent 設(shè)計開發(fā)基于圖工作流編排的面向設(shè)備的原生多模態(tài)智能體。這里的設(shè)備不光包含智能手機,智能可穿戴設(shè)備(智能眼鏡等),智能家居,還包括命令行以及 web 端,開發(fā)者只需要專注于智能體本身,而不用分神處理設(shè)備。
OmAgent 項目里提供了 6 個示例項目,由淺入深展示了如何搭建一個智能體的完整過程,其中視頻理解智能體工作流被 EMNLP 2024 主會收錄,實現(xiàn)了和 Blueprint Demo 相似的功能。


OmAgent 表現(xiàn)如何?


根據(jù)項目文檔只需要進行簡單的配置就可以將 OmAgent 部署運行在本地環(huán)境。我們首先對 Blueprint 提供的測試視頻進行預處理,在這個階段視頻會被分解為若干個片段,每個片段會被大模型進行總結(jié),并向量化存儲在數(shù)據(jù)庫中。接下來使用之前的問題對 OmAgent 進行測試,可以看到智能體可以正確定位事件以及發(fā)生的時間。
Q: When did the worker drop the box?

A:

wKgZoWdAZAOAD3bnAAFzkSYaMrs552.png

Q: Which direction did the forklift go?

A:

wKgaoWdAZAOASgm2AAGehcmUwq4016.png


Q: Who picked up the box that fell on the ground?

A:

wKgZoWdAZAOARBJBAADmjQr1png710.png

接下來我們進行更復雜的測試,OmAgent 可以支持音頻信息以及超長視頻索引。我們選取了最近大火的劇集《雙城之戰(zhàn)》第二季第一集作為素材,基于其中的畫面和劇情進行提問。
Q: 凱特琳收到的鑰匙代表了什么?

A:

wKgaoWdAZASAcdA1AAEdrKqU-UI948.png


Q: 凱特琳和蔚在爭執(zhí)些什么?

A:

wKgZoWdAZASAV-WbAAFZb73r65Q400.png

Q: 視頻最后幾個議員在討論什么?

A:

wKgaoWdAZASATh9wAAEBsHz15Rs437.png


Q: 議員開會的時候誰闖入了進來?

A:

wKgZoWdAZAWARw98AAFgj5fdgO8724.png

可以看到,即使面對如此復雜的視頻素材,OmAgent 依然可以游刃有余。
除了視頻問答之外,OmAgent 的最大特點是可以將智能體直接應用在硬件設(shè)備上,我們也對此進行了測試。使用項目提供的 app,我們可以運行示例項目中的穿衣搭配推薦智能體。智能體會根據(jù)你的需求,以及你已有的衣櫥信息,為你推薦合適的穿衣建議。在這個過程中智能體會和用戶進行多輪溝通以確定用戶需求,并最終返回最合適的搭配。

如果想了解更多OmAgent智能體技術(shù)信息,可以通過聯(lián)匯科技官網(wǎng)聯(lián)系!

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 智能體
    +關(guān)注

    關(guān)注

    1

    文章

    496

    瀏覽量

    11612
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3672

    瀏覽量

    5199
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    歡迎使用中國香河英茂科工豆包智能

    中國香河英茂科工 - 豆包智能 創(chuàng)建分身,分兩種:AI智能分身(替你干活) 和數(shù)字分身(替你出鏡),零基礎(chǔ)也快速上手。 ?
    發(fā)表于 02-14 07:22

    鴻蒙智能上/下架、升級流程介紹

    執(zhí)行上架操作,并且已經(jīng)審核通過的智能,才能被其他用戶搜索并使用。 升級審核未通過的智能,線上依舊保留上
    發(fā)表于 02-10 10:38

    開發(fā)智能調(diào)試與預覽---真機測試

    1、開發(fā)者可在智能調(diào)試與預覽區(qū)域,點擊真機測試圖標-點擊【白名單】跳轉(zhuǎn)至智能白名單配置頁面。 2、勾選用于測試的群組,點擊屏幕左側(cè)【編排】返回
    發(fā)表于 02-09 15:37

    開發(fā)智能配置-隱私協(xié)議服務(wù)

    1.已有描述隱私政策和用戶隱私權(quán)利的隱私網(wǎng)址:在智能【配置】-【隱私協(xié)議服務(wù)】頁面,隱私聲明處選擇“自定義隱私政策”,在隱私政策網(wǎng)址中直接填寫隱私網(wǎng)址。 2.沒有自定義隱私網(wǎng)址,平臺提供隱私
    發(fā)表于 02-03 15:54

    小藝開放平臺鴻蒙智能開發(fā)智能配置-基礎(chǔ)信息

    創(chuàng)建智能后,開發(fā)者可以進入智能配置頁面對智能基礎(chǔ)信息進行編輯。支持編輯
    發(fā)表于 02-02 16:47

    小藝智能調(diào)試與預覽---真機測試

    1、開發(fā)者可在智能調(diào)試與預覽區(qū)域,點擊真機測試圖標-點擊【白名單】跳轉(zhuǎn)至智能白名單配置頁面。 2、勾選用于測試的群組,點擊屏幕左側(cè)【編排】返回
    發(fā)表于 01-28 14:16

    CW32L012小型機器控制評估板活動 四足機器+智能小車 開箱評測

    社區(qū),已經(jīng)提供好了相關(guān)的組裝視頻教程,大家基本上可以按照上面視頻組裝即可。 我就只來點不一樣或者說要注意的地方,現(xiàn)在這樣裝的小車看起來會比較清爽整潔、線束不會顯得零亂。 4、源程
    發(fā)表于 11-24 23:44

    什么智能才能稱為具身智能?

    節(jié)目中拋個手絹,走路還磕磕絆絆,不到年,就已經(jīng)發(fā)展到接近真人的步伐,具身智能時代或許真的來了! 為什么身體對智能很重要 具身智能,說白
    的頭像 發(fā)表于 11-19 09:29 ?815次閱讀
    什么<b class='flag-5'>樣</b>的<b class='flag-5'>智能</b><b class='flag-5'>體</b>才能稱為具身<b class='flag-5'>智能</b>?

    智能設(shè)計模式和智能框架,你會了么?

    、新聞 先播放條最新新聞,通義團隊官宣開源兩個智能 Alias-Agent 和 Data-Juicer Agent 。 Alias-
    的頭像 發(fā)表于 11-12 16:30 ?1251次閱讀
    多<b class='flag-5'>智能</b><b class='flag-5'>體</b>設(shè)計模式和<b class='flag-5'>智能</b><b class='flag-5'>體</b>框架,你會了么?

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+具身智能芯片

    具身智能芯片:說白就是能夠感知、思考推理以及決策的體式可達人類智能水平的智能-----就跟
    發(fā)表于 09-18 11:45

    現(xiàn)場解決EMC電磁輻射干擾:“望聞問切”,中醫(yī)一樣

    南柯電子|現(xiàn)場解決EMC電磁輻射干擾:“望聞問切”,中醫(yī)一樣
    的頭像 發(fā)表于 09-04 09:47 ?861次閱讀

    STM32一樣輕松玩轉(zhuǎn)MPU】睿擎SDK V1.1.0重磅升級:內(nèi)核性能與開發(fā)能力雙重突破

    睿擎工業(yè)平臺是為工業(yè)場景設(shè)計的軟硬件一體化開發(fā)方案,全棧自主可控,賦客戶聚焦核心業(yè)務(wù)創(chuàng)新,開發(fā)效率提升70%,STM32一樣玩轉(zhuǎn)MPU。平臺整合
    的頭像 發(fā)表于 08-06 18:45 ?5012次閱讀
    【<b class='flag-5'>像</b>STM32<b class='flag-5'>一樣</b>輕松玩轉(zhuǎn)MPU】睿擎SDK V1.1.0重磅升級:內(nèi)核性能與開發(fā)能力雙重突破

    天吃透條產(chǎn)業(yè)鏈:具身智能(AI+機器

    伙伴,它可不只是手機里的智能助手那樣,只能在屏幕上跟你交流。這個機器是有實體的,它能一樣
    的頭像 發(fā)表于 06-19 09:21 ?2260次閱讀
    <b class='flag-5'>一</b>天吃透<b class='flag-5'>一</b>條產(chǎn)業(yè)鏈:具身<b class='flag-5'>智能</b>(AI+機器<b class='flag-5'>人</b>)

    從感知到運控:具身智能機器控制器的雙腦協(xié)同設(shè)計與場景適配

    ,則是協(xié)調(diào)全身的“大腦”與“小腦”,既要大腦一樣思考決策,又要小腦一樣精準控制運動。作為具身智能機器
    的頭像 發(fā)表于 05-11 17:42 ?1152次閱讀
    從感知到運控:具身<b class='flag-5'>智能</b>機器<b class='flag-5'>人</b>控制器的雙腦協(xié)同設(shè)計與場景適配

    學習智能開發(fā)

    智能是大模型的應用落地,正在學習中,這本書太及時,非常想看看。
    發(fā)表于 03-27 15:48