91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

微軟開發(fā)了一種新的AI圖像字幕算法

姚小熊27 ? 來源:cnBeta.COM ? 作者:cnBeta.COM ? 2020-10-15 14:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

微軟開發(fā)了一種新的圖像字幕算法,在某些有限的測試中,其準(zhǔn)確率超過了人類。該人工智能系統(tǒng)已被用于更新該公司為視障人士提供的助理應(yīng)用程序 “Seeing AI”,并將很快被納入Word、Outlook和PowerPoint等其他微軟產(chǎn)品中。在那里,它將被用于為圖像創(chuàng)建alt文本等任務(wù),這一功能對于提高無障礙性尤為重要。

這些應(yīng)用包括微軟自己的Seeing AI,該公司于2017年首次發(fā)布。Seeing AI利用計算機視覺為視障人士描述通過智能手機攝像頭看到的世界。它可以識別家庭物品,閱讀和掃描文本,描述場景,甚至識別朋友。它還可以用來描述其他應(yīng)用中的圖像,包括電子郵件客戶端、社交媒體應(yīng)用和WhatsApp等消息應(yīng)用。

微軟沒有披露Seeing AI的用戶數(shù)量,但Azure AI的企業(yè)副總裁Eric Boyd告訴The Verge,該軟件是 “為盲人或低視力人士提供的領(lǐng)先應(yīng)用之一”。Seeing AI已經(jīng)連續(xù)三年被盲人和低視力iOS用戶社區(qū)AppleVis評選為最佳應(yīng)用或最佳輔助應(yīng)用。

微軟新的圖像字幕算法將顯著提高Seeing AI的性能,因為它不僅能識別物體,還能更精確地描述它們之間的關(guān)系。因此,該算法可以在看一張圖片時,不僅能說出圖片中包含哪些物品和物體(如 “一個人、一把椅子、一個手風(fēng)琴”),還能說出它們之間的互動關(guān)系(如 “一個人坐在椅子上,正在拉手風(fēng)琴”)。微軟表示,該算法是其之前自2015年開始使用的圖像字幕系統(tǒng)的兩倍。

該算法在9月份發(fā)表的一篇預(yù)印論文中進行了描述,在一個被稱為 “nocaps ”的圖像字幕基準(zhǔn)測試上取得了有史以來最高的分數(shù)。這是一個業(yè)界領(lǐng)先的圖像字幕評分板,不過它有自己的限制條件。nocaps基準(zhǔn)測試由超過166,000個人類生成的字幕組成,描述了從Open Images Dataset中提取的約15,100張圖片。這些圖片涵蓋了一系列場景,從運動到假日抓拍,再到美食攝影等等。
責(zé)任編輯:YYX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6741

    瀏覽量

    107870
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39794

    瀏覽量

    301456
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    使用Firebase AI Logic生成圖像模型的兩新功能

    為您的應(yīng)用添加自定義圖像,能夠顯著改善和個性化用戶體驗,有效提高用戶參與度。本文將探討使用 Firebase AI Logic 生成圖像的兩新功能: 其
    的頭像 發(fā)表于 11-30 09:28 ?431次閱讀

    【飛凌OK-MX9596-C開發(fā)板試用】③云端AI拍照識別

    【飛凌OK-MX9596-C開發(fā)板試用】②體驗WIFI、藍牙、音頻、視頻,為AI應(yīng)用打下基礎(chǔ) - 飛凌嵌入式 - 電子技術(shù)論壇 - 廣受歡迎的專業(yè)電子論壇! 在上帖子中,我們測試了攝像頭拍照
    發(fā)表于 11-01 22:12

    使用Otsu閾值算法將灰度圖像二值化

    Otsu 算法是由日本學(xué)者OTSU于1979年提出的一種圖像進行二值化的高效算法,又稱“最大類間方差法”。當(dāng)我們對個圖象進行二值化操作的
    發(fā)表于 10-28 06:49

    基于FPGA的CLAHE圖像增強算法設(shè)計

    CLAHE圖像增強算法又稱為對比度有限的自適應(yīng)直方圖均衡算法,其算法原理是通過有限的調(diào)整圖像局部對比度來增強有效信號和抑制噪聲信號。
    的頭像 發(fā)表于 10-15 10:14 ?655次閱讀
    基于FPGA的CLAHE<b class='flag-5'>圖像</b>增強<b class='flag-5'>算法</b>設(shè)計

    微軟Visual Studio 2026 發(fā)布!AI 深度融合、性能提升

    與高效開發(fā)體驗。? ” ?? 微軟剛剛放出了個重磅炸彈: Visual Studio 2026 Insiders 預(yù)覽版 ?已經(jīng)正式發(fā)布! 這是次雄心勃勃的進化,
    的頭像 發(fā)表于 09-16 11:17 ?1966次閱讀
    <b class='flag-5'>微軟</b>Visual Studio 2026 發(fā)布!<b class='flag-5'>AI</b> 深度融合、性能提升

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現(xiàn)深度學(xué)習(xí)AI芯片的創(chuàng)新方法與架構(gòu)

    的時間縮短、效率提升的硬件架構(gòu)非常重要。因此存內(nèi)加速方案,X-Former應(yīng)運而生。它是一種混合存內(nèi)計算架構(gòu),結(jié)合了NVM和基于互補金屬氧化物半導(dǎo)體(CMOS)的處理元件。 架構(gòu)如下: 2.2 閃存AI
    發(fā)表于 09-12 17:30

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)

    的我我們講解了這幾種芯片的應(yīng)用場景,設(shè)計流程、結(jié)構(gòu)等。 CPU: 還為我們講解了一種算法:哈希表算法 GPU: 介紹了英偉達H100GPU芯片。使用了下關(guān)鍵技術(shù): ①張量
    發(fā)表于 09-12 16:07

    模板驅(qū)動 無需訓(xùn)練數(shù)據(jù) SmartDP解決小樣本AI算法模型開發(fā)難題

    算法作為軟實力,其水平直接影響著目標(biāo)檢測識別的能力。兩年前,慧視光電推出了零基礎(chǔ)的基于yolo系列算法架構(gòu)的AI算法開發(fā)平臺SpeedDP,
    的頭像 發(fā)表于 09-09 17:57 ?1407次閱讀
    模板驅(qū)動  無需訓(xùn)練數(shù)據(jù)  SmartDP解決小樣本<b class='flag-5'>AI</b><b class='flag-5'>算法</b>模型<b class='flag-5'>開發(fā)</b>難題

    【Sipeed MaixCAM Pro開發(fā)板試用體驗】基于MaixCAM-Pro的AI生成圖像鑒別系統(tǒng)

    能夠有效捕捉AI生成圖像與真實手繪掃描圖像在紋理、筆觸、光影、全局致性等方面的細微差異。 邊緣端部署:將模型量化、編譯,最終高效運行在算力有限的MaixCAM-Pro
    發(fā)表于 08-21 13:59

    Nordic收購 Neuton.AI 關(guān)于產(chǎn)品技術(shù)的分析

    Nordic Semiconductor 于 2025 年收購了 Neuton.AI,這是家專注于超小型機器學(xué)習(xí)(TinyML)解決方案的公司。 Neuton 開發(fā)了一種獨特的神經(jīng)網(wǎng)
    發(fā)表于 06-28 14:18

    新思科技攜手微軟借助AI技術(shù)加速芯片設(shè)計

    近日,微軟Build大會在西雅圖盛大開幕,聚焦AI在加速各行業(yè)(包括芯片設(shè)計行業(yè))科學(xué)突破方面的變革潛力。作為Microsoft Discovery平臺發(fā)布的啟動合作伙伴,新思科技亮相本次大會,并攜手微軟
    的頭像 發(fā)表于 06-27 10:23 ?1090次閱讀

    在 KiCad 中添加AI 助手是一種什么體驗?

    一種什么體驗? 文章出處:【微信公眾號:KiCad】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
    的頭像 發(fā)表于 05-15 14:28 ?945次閱讀

    【「零基礎(chǔ)開發(fā)AI Agent」閱讀體驗】+讀《零基礎(chǔ)開發(fā)AI Agent》掌握扣子平臺開發(fā)智能體方法

    收到發(fā)燒友網(wǎng)站寄來的《零基礎(chǔ)開發(fā)AI Agent》這本書已經(jīng)有好些天了,這段時間有幸拜讀了下全書,掌握了開發(fā)智能體的方法。 該書充分從
    發(fā)表于 05-14 19:51

    基于RV1126開發(fā)板的AI算法開發(fā)流程

    AI算法開發(fā)流程由需求分析到準(zhǔn)備數(shù)據(jù),然后到選取模型,訓(xùn)練模型,接著模型轉(zhuǎn)換后進行模型部署
    的頭像 發(fā)表于 04-18 14:03 ?2366次閱讀
    基于RV1126<b class='flag-5'>開發(fā)</b>板的<b class='flag-5'>AI</b><b class='flag-5'>算法</b><b class='flag-5'>開發(fā)</b>流程

    基于RV1126開發(fā)板的AI算法開發(fā)流程

    AI算法開發(fā)流程由需求分析到準(zhǔn)備數(shù)據(jù),然后到選取模型,訓(xùn)練模型,接著模型轉(zhuǎn)換后進行模型部署
    的頭像 發(fā)表于 04-18 10:47 ?1103次閱讀
    基于RV1126<b class='flag-5'>開發(fā)</b>板的<b class='flag-5'>AI</b><b class='flag-5'>算法</b><b class='flag-5'>開發(fā)</b>流程