91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

微軟新AI項目為文檔和電子郵件的圖像添加字幕

姚小熊27 ? 來源:人工智能實驗室 ? 作者:人工智能實驗室 ? 2020-11-18 10:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

微軟的一項新AI項目旨在自動為文檔和電子郵件中的圖像添加字幕,以便視覺障礙軟件讀取圖像。

微軟的研究人員在有關(guān)預印本存儲庫arXiv的論文中解釋了他們的機器學習模型的原理。

該模型使用可視語音詞匯預訓練(VIVO),它利用大量成對的圖像標簽數(shù)據(jù)來學習視覺詞匯。然后,使用帶有適當字幕的圖像的第二個數(shù)據(jù)以幫助教AI如何最好地描述圖片。

“理想情況下,每個人都應在文檔,網(wǎng)絡,社交媒體中為所有圖像添加替代文本,因為這可以使盲人訪問內(nèi)容并參與對話。但是,可惜,人們卻沒有?!蔽④汚I平臺小組的軟件工程經(jīng)理Saqib Shaikh說。

總體而言,研究人員希望AI能夠提供Microsoft現(xiàn)有字幕系統(tǒng)兩倍的性能。

為了對新AI的性能進行基準測試,研究人員將其納入了“無上限”挑戰(zhàn)。在撰寫本文時,Microsoft的AI現(xiàn)在在其排行榜上排名第一。

“無上限的挑戰(zhàn)實際上是如何描述您在訓練數(shù)據(jù)中沒有看到的那些新穎的物體?”微軟研究實驗室的首席研究經(jīng)理王麗娟評論道。

希望使用Microsoft自動字幕AI來構(gòu)建應用程序的開發(fā)人員已經(jīng)可以這樣做,因為Azure Cognitive Services的Computer Vision軟件包中提供了該功能。

微軟令人印象深刻的SeeingAI應用程序?qū)⑹褂眯碌腁I進行更新,該應用程序使用計算機視覺描述視力障礙者的周圍環(huán)境。

“圖像字幕是可以實現(xiàn)廣泛服務的核心計算機視覺功能之一,”Azure AI認知服務的CTO黃表示。

黃繼續(xù)說:“我們AI的這一突破以Azure為平臺,以服務于更多客戶。” “這不僅是研究上的突破;在Azure上將突破轉(zhuǎn)化為生產(chǎn)所需的時間也是突破?!?/p>

改進的自動字幕功能也有望在今年晚些時候在Outlook,Word和PowerPoint中使用。
責任編輯:YYX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6741

    瀏覽量

    107891
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39866

    瀏覽量

    301508
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    AI功能(SC171開發(fā)套件V2-FAS)

    AI功能(SC171開發(fā)套件V2-FAS) 序列 課程名稱 視頻課程時長 視頻課程鏈接 課件鏈接 工程源碼 1 圖像語義分割(deeplabv3)案例----基于SC171開發(fā)套件V2-FAS
    發(fā)表于 02-11 14:33

    使用NORDIC AI的好處

    提升能效,適合音頻、圖像和高采樣率傳感器等更重的 AI 負載。[Axon NPU 技術(shù)頁] 模型更小、更快、更省電 Neuton 模型相較 TensorFlow Lite:* 內(nèi)存占用可小 10
    發(fā)表于 01-31 23:16

    AI功能(SC171開發(fā)套件V3)2026版

    https://t.elecfans.com/v/28528.html *附件:文檔:人體目標檢測(Yolov5)案例_V2.0.pdf *附件:工程源碼:人體目標檢測案例_V2.0.zip 2 圖像語義
    發(fā)表于 01-15 11:18

    20個常用服務端口及對應服務信息

    和執(zhí)行命令。 (3) 端口號:23 服務名稱:Telnet 服務描述:用于遠程登錄到遠程主機并執(zhí)行命令。 (4) 端口號:25 服務名稱:SMTP 服務描述:簡單郵件傳輸協(xié)議,用于發(fā)送電子郵件
    發(fā)表于 12-03 06:07

    使用Firebase AI Logic生成圖像模型的兩種新功能

    您的應用添加自定義圖像,能夠顯著改善和個性化用戶體驗,有效提高用戶參與度。本文將探討使用 Firebase AI Logic 生成圖像的兩
    的頭像 發(fā)表于 11-30 09:28 ?432次閱讀

    微軟Visual Studio 2026 發(fā)布!AI 深度融合、性能提升

    “ ?微軟發(fā)布 Visual Studio 2026 預覽版,新版本以深度融合的 AI Copilot 核心,結(jié)合全新的 Fluent Design 界面與顯著的性能提升,旨在打造前所未有的智能
    的頭像 發(fā)表于 09-16 11:17 ?1991次閱讀
    <b class='flag-5'>微軟</b>Visual Studio 2026 發(fā)布!<b class='flag-5'>AI</b> 深度融合、性能提升

    NVIDIA硅光技術(shù)助力邁向百萬GPU AI工廠

    在全球范圍內(nèi),AI 工廠正在崛起 —— 大量的這些新型數(shù)據(jù)中心并非提供網(wǎng)頁或電子郵件服務而建,而是用于訓練和部署智能本身?;ヂ?lián)網(wǎng)巨頭們已經(jīng)其客戶在
    的頭像 發(fā)表于 08-27 12:34 ?1220次閱讀

    【Sipeed MaixCAM Pro開發(fā)板試用體驗】基于MaixCAM-Pro的AI生成圖像鑒別系統(tǒng)

    圖像的快速鑒別,滿足實時或準實時的應用需求。 3. 數(shù)據(jù)采集 AI圖片數(shù)據(jù)集,本項目使用gemini生成圖片,使用的是gem來實現(xiàn)的。 提示詞如下 你是一個能夠生成美術(shù)繪本風格插畫的智能Agent
    發(fā)表于 08-21 13:59

    AI 芯片浪潮下,職場晉升新契機?

    芯片設計例,從最初的架構(gòu)選型,到算法適配、性能優(yōu)化,每個環(huán)節(jié)都考驗著工程師的專業(yè)素養(yǎng)。在設計一款面向智能安防領(lǐng)域的 AI 芯片時,需要深入研究安防場景下圖像識別算法的特點,針對性地優(yōu)化芯片架構(gòu),提升
    發(fā)表于 08-19 08:58

    任正非說 AI已經(jīng)確定是第四次工業(yè)革命 那么如何從容地加入進來呢?

    實踐。 開源項目貢獻代碼或者文檔。比如,幫助完善一個機器學習數(shù)據(jù)集的加載模塊的代碼,或者撰寫某個AI算法的使用說明文檔。這不僅可以提升自己
    發(fā)表于 07-08 17:44

    新思科技攜手微軟借助AI技術(shù)加速芯片設計

    近日,微軟Build大會在西雅圖盛大開幕,聚焦AI在加速各行業(yè)(包括芯片設計行業(yè))科學突破方面的變革潛力。作為Microsoft Discovery平臺發(fā)布的啟動合作伙伴,新思科技亮相本次大會,并攜手微軟
    的頭像 發(fā)表于 06-27 10:23 ?1100次閱讀

    Arm 與微軟合作,基于 Arm 架構(gòu)的 PC 和移動設備應用提供超強 AI 體驗

    ArmKleidiAI與ONNXRuntime的集成,Windows和安卓操作系統(tǒng)帶來了顯著的AI性能優(yōu)化,實現(xiàn)高達2.6倍的AI推理速度提升,從而加速應用體驗。聯(lián)合作者:Arm終端事業(yè)部產(chǎn)品
    的頭像 發(fā)表于 06-03 16:47 ?878次閱讀
    Arm 與<b class='flag-5'>微軟</b>合作,<b class='flag-5'>為</b>基于 Arm 架構(gòu)的 PC 和移動設備應用提供超強 <b class='flag-5'>AI</b> 體驗

    微軟推出多項革新性AI工具

    模型;多智能體協(xié)同編排功能重新定義協(xié)作模式,支持跨部門智能體團隊協(xié)同處理復雜任務。微軟正將AI技術(shù)從工具升級組織核心生產(chǎn)力,重新定義人機協(xié)作的未來。
    的頭像 發(fā)表于 05-26 09:47 ?1168次閱讀

    在 KiCad 中添加一個 AI 助手是一種什么體驗?

    原文標題:在 KiCad 中添加一個 AI 助手
    的頭像 發(fā)表于 05-15 14:28 ?953次閱讀

    【「零基礎(chǔ)開發(fā)AI Agent」閱讀體驗】+讀《零基礎(chǔ)開發(fā)AI Agent》掌握扣子平臺開發(fā)智能體方法

    儲備。然后介紹AI Agen的主流平臺,接著說明了扣子平臺開發(fā)AI Agent的流程和策略,然后對其插件、工作流、圖像流、知識庫等功能模塊進行了詳細概述。并就5大場景,11個開發(fā)案例分別從功能,使用場
    發(fā)表于 05-14 19:51