91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

IBM發(fā)布最新AI模型,幫視障者“看”到更多

DR2b_Aiobservat ? 來(lái)源:YXQ ? 2019-06-25 08:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在IBM最新的論文中,研究人員提出了一種能自主制作多樣化、創(chuàng)造性和符合人類(lèi)語(yǔ)境的圖片文字說(shuō)明的模型。實(shí)驗(yàn)證明,圖片的文字說(shuō)明取得了“良好”的性能,未來(lái)可以為強(qiáng)大的新計(jì)算機(jī)視覺(jué)系統(tǒng)奠定了基礎(chǔ)。

無(wú)論是報(bào)社、雜志社還是新媒體,編輯們最不愿意干得事情就是為圖片搭配文字說(shuō)明。事實(shí)上這項(xiàng)工作必要且重要但實(shí)際操作上又非常枯燥。

不過(guò),一個(gè)振奮人心的消息是,AI可能很快就能處理大部分工作。6月18日在加州長(zhǎng)灘舉行的2019年計(jì)算機(jī)視覺(jué)和模式識(shí)別會(huì)議(CVPR)上,Pierre L. Dognin, Igor Melnyk, Youssef Mroueh, Jarret Ross, Tom Sercu發(fā)表了一篇論文《改進(jìn)圖像說(shuō)明的對(duì)抗性語(yǔ)義對(duì)齊》,提出了一種能夠自主制作多樣化、創(chuàng)造性和符合人類(lèi)語(yǔ)境的圖片文字說(shuō)明的模型。

在論文中,他們將圖像說(shuō)明作為一種有條件的GAN(生成式對(duì)抗網(wǎng)絡(luò))訓(xùn)練進(jìn)行研究,提出了一種上下文感知的LSTM字幕器和共同注意鑒別器,它們加強(qiáng)了圖像和字幕之間的語(yǔ)義對(duì)齊。

研究人員根據(jù)經(jīng)驗(yàn)著重研究了SCST和ST兩種訓(xùn)練方法的可行性。他們發(fā)現(xiàn)即使沒(méi)有直接訪(fǎng)問(wèn)鑒別器梯度,SCST也比ST顯示出更穩(wěn)定的梯度行為和更好的結(jié)果。進(jìn)而還解決了對(duì)這些模型進(jìn)行自動(dòng)評(píng)估的開(kāi)放性問(wèn)題,引入了一個(gè)新的語(yǔ)義評(píng)分,并證明了它與人類(lèi)判斷的強(qiáng)相關(guān)性。

作為評(píng)估范例,一個(gè)重要的標(biāo)準(zhǔn)是生成器能夠概括出平常不會(huì)一起出現(xiàn)的對(duì)象之間的組合關(guān)系。為此研究人員引入了一個(gè)小標(biāo)題能脫離上下文(OOC)測(cè)試集。OOC與常規(guī)語(yǔ)義評(píng)分相結(jié)合,為圖片搭配說(shuō)明文字得體系提出了新基準(zhǔn)。當(dāng)面向OOC和MS-COCO進(jìn)行測(cè)試時(shí),可以發(fā)現(xiàn)基于SCST的訓(xùn)練在語(yǔ)義評(píng)分和人類(lèi)評(píng)估方面都有很強(qiáng)的表現(xiàn),有望成為高效離散GAN訓(xùn)練的一種有價(jià)值的新方法。

目前,構(gòu)建系統(tǒng)需要解決自動(dòng)說(shuō)明文字系統(tǒng)的一個(gè)主要缺點(diǎn):順序語(yǔ)言生成導(dǎo)致語(yǔ)法正確—但同質(zhì)、非自然和語(yǔ)義不相關(guān)的結(jié)構(gòu)。

研究者的方法是通過(guò)一個(gè)注意力文字說(shuō)明模型來(lái)解決這個(gè)問(wèn)題,模型使用它正在觀(guān)察的照片中的場(chǎng)景片段來(lái)造句。在每一個(gè)生成步驟中,團(tuán)隊(duì)的AI都可以選擇關(guān)注最后一步的視覺(jué)或文本提示。

為了確保生成的文字說(shuō)明聽(tīng)起來(lái)不太機(jī)械化,研究團(tuán)隊(duì)在訓(xùn)練時(shí)使用了生成對(duì)抗網(wǎng)絡(luò)(GANs)——由生成樣本的生成器和試圖區(qū)分生成樣本和現(xiàn)實(shí)世界樣本的鑒別器組成的兩部分神經(jīng)網(wǎng)絡(luò)。共同注意鑒別器通過(guò)一個(gè)在像素級(jí)匹配場(chǎng)景和生成單詞的模型對(duì)新句子的“自然度”進(jìn)行評(píng)分,使文字說(shuō)明者能夠通過(guò)圖像和句子成對(duì)來(lái)進(jìn)行合成。

文字說(shuō)明系統(tǒng)中的另一個(gè)常見(jiàn)問(wèn)題是,如何避免訓(xùn)練數(shù)據(jù)集的偏差,即經(jīng)常遭受過(guò)度擬合(特定數(shù)據(jù)集過(guò)于接近的分析)就需要構(gòu)建診斷工具,否則并不適合推廣到學(xué)習(xí)對(duì)象(“床和臥室”)出現(xiàn)在看不見(jiàn)的環(huán)境(“床和森林”)中的場(chǎng)景。為此,研究人員提出了一種標(biāo)題圖像的測(cè)試語(yǔ)料庫(kù),其設(shè)計(jì)方式使得不良模型性能表明過(guò)度擬合。

在實(shí)驗(yàn)中,Amazon's Mechanical Turk評(píng)估人員負(fù)責(zé)識(shí)別AI模型生成的文字說(shuō)明,并判斷每句話(huà)對(duì)相應(yīng)圖像的描述程度,給出幾個(gè)真實(shí)的和合成的樣本,研究人員表示,他們的文字說(shuō)明總體上取得了“良好”的性能。他們相信他們的工作為強(qiáng)大的新計(jì)算機(jī)視覺(jué)系統(tǒng)奠定了基礎(chǔ),并打算在未來(lái)的工作中繼續(xù)探索這些系統(tǒng)。另外,銜接語(yǔ)言和視覺(jué)語(yǔ)義的鴻溝表明需要將常識(shí)和推理融入場(chǎng)景理解中。

未來(lái),圖像文字說(shuō)明的自動(dòng)生成和場(chǎng)景理解的進(jìn)步,使AI系統(tǒng)可以作為視覺(jué)障礙者的助理改善他們的日常生活。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • IBM
    IBM
    +關(guān)注

    關(guān)注

    3

    文章

    1872

    瀏覽量

    77070
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40201

    瀏覽量

    301841

原文標(biāo)題:IBM發(fā)布最新AI模型,幫視障者“看”到更多

文章出處:【微信號(hào):Aiobservation,微信公眾號(hào):人工智能觀(guān)察】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI輔助編程設(shè)計(jì)之道:從SpecCode工程實(shí)踐

    大語(yǔ)言模型正在重塑軟件開(kāi)發(fā)的日常。從Copilot各種編程助手,AI生成代碼的能力已經(jīng)滲透許多開(kāi)發(fā)的工作流中。但在實(shí)際應(yīng)用中,一個(gè)現(xiàn)象
    發(fā)表于 03-16 13:33

    深蘭科技發(fā)布AI法務(wù)大模型產(chǎn)品

    近日,深蘭科技發(fā)布面向律所與企業(yè)法務(wù)部門(mén)的AI法務(wù)大模型產(chǎn)品——“深蘭律師辦公自動(dòng)化系統(tǒng)(AI版)”。通過(guò)AI技術(shù)賦能法律服務(wù)行業(yè),它能夠顯
    的頭像 發(fā)表于 10-23 17:58 ?1143次閱讀

    HarmonyOS 6正式發(fā)布,超能小藝一用就愛(ài)!

    景終端設(shè)備上帶來(lái)真人感對(duì)話(huà)、小藝世界、小藝接、AI修圖、小藝慧記等行業(yè)領(lǐng)先的AI智慧體驗(yàn),深受消費(fèi)喜愛(ài)。升級(jí)
    的頭像 發(fā)表于 10-22 17:43 ?1593次閱讀

    AI模型的配置AI模型該怎么做?

    STM32可以跑AI,這個(gè)AI模型怎么搞,知識(shí)盲區(qū)
    發(fā)表于 10-14 07:14

    重磅!騰科技新官網(wǎng)正式上線(xiàn),AI算力與智能解決方案一鍵直達(dá)

    AI算力模組全棧智能解決方案,從技術(shù)研發(fā)到場(chǎng)景落地,騰科技始終以 “前沿技術(shù)落地” 為定位,助力產(chǎn)業(yè)智能化升級(jí)。新官網(wǎng)的上線(xiàn),是我們與世界對(duì)話(huà)的新起點(diǎn),未來(lái),我們期待與
    的頭像 發(fā)表于 10-11 10:57 ?905次閱讀
    重磅!騰<b class='flag-5'>視</b>科技新官網(wǎng)正式上線(xiàn),<b class='flag-5'>AI</b>算力與智能解決方案一鍵直達(dá)

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片AGI芯片

    、現(xiàn)階段更智能、更接近AGI的6中算法與模型 1、MoE模型 MoE模型作為T(mén)ransfomer模型的后繼,代表著
    發(fā)表于 09-18 15:31

    IBM聯(lián)合NASA發(fā)布開(kāi)源AI模型重要突破

    近日,IBM(紐交所代碼:IBM)與美國(guó)國(guó)家航空航天局 (NASA) 聯(lián)合發(fā)布了一款開(kāi)創(chuàng)性的開(kāi)源基礎(chǔ)模型,可理解高分辨率的太陽(yáng)觀(guān)測(cè)數(shù)據(jù),從而預(yù)測(cè)太陽(yáng)活動(dòng)對(duì)地球和太空技術(shù)的影響。該
    的頭像 發(fā)表于 09-02 09:16 ?962次閱讀

    OpenAI開(kāi)源模型登陸IBM watsonx.ai開(kāi)發(fā)平臺(tái)

    OpenAI 已向公眾發(fā)布了兩款 AI 模型,允許開(kāi)發(fā)和企業(yè)可自由下載、運(yùn)行并進(jìn)行定制。其中一款模型現(xiàn)已部署在
    的頭像 發(fā)表于 08-26 15:36 ?1045次閱讀

    科技AI模型應(yīng)用:提效、破局與落地,重塑智能新生態(tài)

    在這場(chǎng)數(shù)字化轉(zhuǎn)型的浪潮中,騰科技AI模型憑借其強(qiáng)大的提效能力、破局的創(chuàng)新思維以及切實(shí)的落地實(shí)踐,已然成為重塑智能新生態(tài)的重要力量。從企業(yè)辦公中的高效決策支持,教育科研里的學(xué)術(shù)探索
    的頭像 發(fā)表于 08-18 14:06 ?1723次閱讀
    騰<b class='flag-5'>視</b>科技<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>應(yīng)用:提效、破局與落地,重塑智能新生態(tài)

    Nordic收購(gòu) Neuton.AI 關(guān)于產(chǎn)品技術(shù)的分析

    與 Nordic 的 nRF54 系列超低功耗無(wú)線(xiàn) SoC 結(jié)合,使得即使是資源極為有限的設(shè)備也能高效運(yùn)行邊緣 AI。Nordic 目前正在將 Neuton 深度集成自身開(kāi)發(fā)生態(tài)中,未來(lái)會(huì)提供更多工具、固件
    發(fā)表于 06-28 14:18

    科技梧桐大模型賦能交通治理

    AI模型技術(shù)正驅(qū)動(dòng)交通行業(yè)智能化升級(jí)。千方科技子公司宇科技于2023年發(fā)布“梧桐”AIoT(人工智能物聯(lián))行業(yè)大模型,采用“通用大
    的頭像 發(fā)表于 05-16 17:23 ?1132次閱讀

    DevEco Studio AI輔助開(kāi)發(fā)工具兩大升級(jí)功能 鴻蒙應(yīng)用開(kāi)發(fā)效率再提升

    隨著搭載HarmonyOS 5的Pura X發(fā)布,鴻蒙生態(tài)進(jìn)入快車(chē)道,各應(yīng)用正在加速適配開(kāi)發(fā),越來(lái)越多開(kāi)發(fā)加入鴻蒙應(yīng)用開(kāi)發(fā)浪潮中。為提升鴻蒙應(yīng)用開(kāi)發(fā)效率,華為前不久上線(xiàn)了首款開(kāi)發(fā)
    發(fā)表于 04-18 14:43

    海康威發(fā)布多模態(tài)大模型AI融合巡檢超腦

    基于??涤^(guān)瀾大模型技術(shù)體系,??低?b class='flag-5'>視推出新一代多模態(tài)大模型AI融合巡檢超腦,全面升級(jí)人、車(chē)、行為、事件等算法,為行業(yè)帶來(lái)全新的多模態(tài)大模型
    的頭像 發(fā)表于 04-17 17:12 ?1669次閱讀

    首創(chuàng)開(kāi)源架構(gòu),天璣AI開(kāi)發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    生態(tài)和天璣AI生態(tài)的全面打通。這意味著,天璣開(kāi)發(fā)將有機(jī)會(huì)獲取更多NVIDIA TAO生態(tài)的AI開(kāi)發(fā)資源,TAO生態(tài)開(kāi)發(fā)可將開(kāi)發(fā)成果輕松移
    發(fā)表于 04-13 19:52

    IBM攜手英偉達(dá)AI數(shù)據(jù)平臺(tái)推動(dòng)企業(yè)級(jí)AI創(chuàng)新

    近日,IBM(紐約證券交易所:IBM)宣布與英偉達(dá)(納斯達(dá)克股票代碼:NVDA)開(kāi)展全新合作,雙方將基于英偉達(dá) AI 數(shù)據(jù)平臺(tái)參考架構(gòu)(reference architecture)進(jìn)行產(chǎn)品集成
    發(fā)表于 03-24 19:20 ?537次閱讀