91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

蘋(píng)果發(fā)布研究論文:揭示Ferret-UI AI系統(tǒng),破解MLLMs移動(dòng)應(yīng)用理解難題

微云疏影 ? 來(lái)源:綜合整理 ? 作者:綜合整理 ? 2024-04-10 10:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

據(jù)悉,Apple近期發(fā)表了有關(guān)于Ferret-UI AI系統(tǒng)的研究論文,這款新型AI系統(tǒng)可理解應(yīng)用程序屏幕上的內(nèi)容。

目前圍繞人工智能(AI)技術(shù),出現(xiàn)了如ChatGPT這樣的大語(yǔ)言模型(LLMs),這些模型擅長(zhǎng)處理文本資料。然而,對(duì)于像圖片、視頻和聲音等多媒體類(lèi)型的非文本n內(nèi)容,就需要擴(kuò)大AI模型的適用范圍,相應(yīng)地,多模態(tài)大語(yǔ)言模型(MLLMs)也就應(yīng)運(yùn)而生。

盡管MLLMs已表現(xiàn)出對(duì)移動(dòng)應(yīng)用程序的理解不足,具體表現(xiàn)在以下幾點(diǎn):

首先,智能手機(jī)屏幕的寬高比和大多數(shù)訓(xùn)練視覺(jué)模型所使用的比例不同;其次,MLLMs需要識(shí)別出較小的圖標(biāo)和按鈕。

針對(duì)以上問(wèn)題,Apple提出了名為“Ferret-UI”的MLLM系統(tǒng),以應(yīng)對(duì)這些挑戰(zhàn)。系統(tǒng)通過(guò)引入WMDR(任意分辨率),提升模型在處理用戶(hù)界面任務(wù)時(shí)的辨識(shí)度,使其能更好地識(shí)別和理解小圖標(biāo)、文字等元素。

此外,我們專(zhuān)門(mén)采集了大量與初級(jí)用戶(hù)界面任務(wù)相關(guān)的樣本,包括圖標(biāo)識(shí)別、文本查找和小部件列表等。所有樣本均按照區(qū)域注釋指令進(jìn)行設(shè)計(jì),以便于精確解釋和實(shí)用化。

為了提高模型的認(rèn)知水平,我們進(jìn)一步定制了高級(jí)任務(wù)數(shù)據(jù)集,含括詳細(xì)描寫(xiě)、感官/互交互對(duì)話及功能推理等方面。

該項(xiàng)研究表明,與現(xiàn)行的GPT-4V以及其他MLLMs模型相比,F(xiàn)erret-UI AI模型具有顯著優(yōu)勢(shì)。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50103

    瀏覽量

    265528
  • 語(yǔ)言模型
    +關(guān)注

    關(guān)注

    0

    文章

    571

    瀏覽量

    11322
  • ChatGPT
    +關(guān)注

    關(guān)注

    31

    文章

    1598

    瀏覽量

    10280
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    GSMA聯(lián)合華為等產(chǎn)業(yè)伙伴發(fā)布大上行網(wǎng)絡(luò)倡議

    在MWC26 巴塞羅那期間由全球移動(dòng)通信系統(tǒng)協(xié)會(huì)(GSMA)主辦的移動(dòng)AI峰會(huì)上,面向全球運(yùn)營(yíng)商的大上行網(wǎng)絡(luò)倡議正式發(fā)布。該倡議以泛在20M
    的頭像 發(fā)表于 03-10 10:48 ?147次閱讀

    軟通動(dòng)力攜手中國(guó)誠(chéng)通破解多業(yè)態(tài)財(cái)務(wù)風(fēng)險(xiǎn)管理難題

    誠(chéng)通”),以智能模型破解多業(yè)態(tài)財(cái)務(wù)風(fēng)險(xiǎn)管理難題,打造了從數(shù)據(jù)治理到風(fēng)險(xiǎn)處置的全流程穿透式監(jiān)管標(biāo)桿案例。
    的頭像 發(fā)表于 02-27 11:53 ?412次閱讀

    Transformer 入門(mén):從零理解 AI 大模型的核心原理

    \"看到\"其他詞,理解它們之間的關(guān)系。 舉個(gè)例子: arduino 體驗(yàn)AI代碼助手 代碼解讀 復(fù)制代碼 \"小明把蘋(píng)果給了小紅,她很開(kāi)心\" 當(dāng) AI
    發(fā)表于 02-10 16:33

    設(shè)備電磁兼容整改:硬軟件雙維度破解輻射超標(biāo)難題

    設(shè)備電磁兼容整改:硬軟件雙維度破解輻射超標(biāo)難題|深圳南柯電子
    的頭像 發(fā)表于 12-23 10:05 ?367次閱讀

    華為發(fā)布并開(kāi)源創(chuàng)新AI容器技術(shù)Flex:ai

    11月21日,2025AI容器應(yīng)用落地與發(fā)展論壇在上海舉行。華為公司副總裁、數(shù)據(jù)存儲(chǔ)產(chǎn)品線總裁周躍峰博士在論壇上正式發(fā)布AI容器技術(shù)——Flex:ai,同時(shí),華為聯(lián)合上海交通大學(xué)、西安
    的頭像 發(fā)表于 11-25 15:34 ?673次閱讀

    GMate發(fā)布《2025全球AI內(nèi)容營(yíng)銷(xiāo)趨勢(shì)報(bào)告》

    條社媒內(nèi)容樣本的深入研究,揭示AI營(yíng)銷(xiāo)如何重塑品牌增長(zhǎng)模式,成為2025年全球企業(yè)競(jìng)爭(zhēng)的核心驅(qū)動(dòng)力。 ? 一、A
    的頭像 發(fā)表于 11-18 19:42 ?688次閱讀

    新能源電子EMC整改:破解電磁兼容難題系統(tǒng)工程

    深圳南柯電子|新能源電子EMC整改:破解電磁兼容難題系統(tǒng)工程
    的頭像 發(fā)表于 11-13 09:27 ?599次閱讀

    新能源電子EMC整改:破解電磁兼容難題系統(tǒng)方案

    深圳南柯電子|新能源電子EMC整改:破解電磁兼容難題系統(tǒng)方案
    的頭像 發(fā)表于 11-04 09:56 ?526次閱讀

    海瑞思科技如何破解AI眼鏡密封檢測(cè)難題

    2025年,消費(fèi)電子賽道的最大黑馬無(wú)疑是AI眼鏡!根據(jù)調(diào)研機(jī)構(gòu)Counterpoint發(fā)布的《全球智能眼鏡型號(hào)出貨量追蹤》報(bào)告,2025年上半年國(guó)際智能眼鏡市場(chǎng)的出貨量同比增長(zhǎng)110%。隨著技術(shù)突破與場(chǎng)景剛需的雙重推動(dòng),AI眼鏡
    的頭像 發(fā)表于 09-26 10:46 ?978次閱讀

    實(shí)時(shí)監(jiān)測(cè)技術(shù)如何破解高溫巡檢難題

    持續(xù)高溫,電網(wǎng)負(fù)荷屢創(chuàng)新高。設(shè)備過(guò)熱引發(fā)故障風(fēng)險(xiǎn)激增,如何準(zhǔn)確防控?本文聚焦實(shí)時(shí)監(jiān)測(cè)技術(shù)如何破解高溫巡檢難題。
    的頭像 發(fā)表于 08-12 14:20 ?926次閱讀
    實(shí)時(shí)監(jiān)測(cè)技術(shù)如何<b class='flag-5'>破解</b>高溫巡檢<b class='flag-5'>難題</b>

    HarmonyOS AI輔助編程工具(CodeGenie)UI生成

    UI Generator基于BitFun Platform AI能力平臺(tái),用于快速生成可編譯、可運(yùn)行的HarmonyOS UI工程,支持基于已有UI布局文件(XML),快速生成
    發(fā)表于 07-10 11:51

    【「零基礎(chǔ)開(kāi)發(fā)AI Agent」閱讀體驗(yàn)】+Agent的案例解讀

    AI助手等功能,大大提升了古籍整理與研究利用的效率。? 業(yè)務(wù)特色? 在引入扣子前,識(shí)典古籍在古籍?dāng)?shù)字化過(guò)程中面臨以下的挑戰(zhàn):? 1)內(nèi)容理解難度高 古籍語(yǔ)言復(fù)雜晦澀,使普通用戶(hù)往往望而卻步,平臺(tái)
    發(fā)表于 05-14 11:23

    高校宿舍改造指南:智能水電計(jì)費(fèi)系統(tǒng)如何破解管理難題

    安科瑞解決方案,校園管理難題一應(yīng)俱全,全方位破解。采用智能硬件+云平臺(tái),實(shí)現(xiàn)高效管理閉環(huán)精準(zhǔn)計(jì)量,安全防控,一鍵拉合閘,多支付,后付費(fèi)模式,能耗分析,賦能綠色校園實(shí)時(shí)監(jiān)測(cè),成功案例,降低管理難度,提高學(xué)生滿意度。
    的頭像 發(fā)表于 04-25 16:30 ?837次閱讀
    高校宿舍改造指南:智能水電計(jì)費(fèi)<b class='flag-5'>系統(tǒng)</b>如何<b class='flag-5'>破解</b>管理<b class='flag-5'>難題</b>?

    企業(yè)通過(guò)AI技術(shù)定制提升營(yíng)業(yè)收入

    生成式AI技術(shù)正在重塑我們的生活場(chǎng)景,而商業(yè)戰(zhàn)場(chǎng)上已掀起AI定制的浪潮。MIT最新報(bào)告揭示,50%企業(yè)通過(guò)AI定制實(shí)現(xiàn)效率躍升,49%借此構(gòu)筑競(jìng)爭(zhēng)壁壘,但數(shù)據(jù)隱私與人才缺口等仍是最大挑
    的頭像 發(fā)表于 04-16 12:48 ?996次閱讀

    Banana Pi 發(fā)布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計(jì)算與嵌入式開(kāi)發(fā)

    RZ/V2N——近期在嵌入式世界2025上新發(fā)布,為 AI 計(jì)算、嵌入式系統(tǒng)及工自動(dòng)化提供強(qiáng)大支持。這款全新的計(jì)算平臺(tái)旨在滿足開(kāi)發(fā)者和企業(yè)用戶(hù)對(duì)高性能、低功耗和靈活擴(kuò)展的需求。 []() 領(lǐng)先的計(jì)算
    發(fā)表于 03-19 17:54