91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用 Vision Transformer 和 NVIDIA TAO,提高視覺 AI 應(yīng)用的準(zhǔn)確性和魯棒性

NVIDIA英偉達 ? 來源:未知 ? 2023-08-04 17:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

wKgaomToPL6AR5_FAHaFzxWEe4k031.gif

Vision Transformer(ViT)正在席卷計算機視覺領(lǐng)域,提供令人難以置信的準(zhǔn)確性、復(fù)雜現(xiàn)實場景下強大的解決方案,以及顯著提升的泛化能力。這些算法對于推動計算機視覺應(yīng)用的發(fā)展發(fā)揮了關(guān)鍵作用,而 NVIDIA 則通過 NVIDIA TAO Toolkit NVIDIA L4 GPU,使應(yīng)用集成ViT 變得輕而易舉。

ViT 的不同之處

ViT 是一種將原本用于自然語言處理的 Transformer 架構(gòu)應(yīng)用于視覺數(shù)據(jù)的機器學(xué)習(xí)模型。相比基于 CNN 的同類模型具有一些優(yōu)勢,并能夠并行處理大規(guī)模輸入的數(shù)據(jù)。CNN 采用的是局部操作,因而缺乏對圖像的全局理解;而 ViT 則以并行和基于自注意的方式來有效地處理圖像,使得所有圖像塊之間能夠相交互,從而提供了長程依賴和全局上下文的能力。

圖 1 展示了 ViT 模型中的圖像處理流程。輸入圖像被分為較小的固定尺寸的圖塊,之后這些圖塊被展平并轉(zhuǎn)換為一系列的標(biāo)記 (tokens) 。這些標(biāo)記連同位置編碼一起被輸入到 Transformer 編碼器中,該編碼器由多個自注意力和前饋神經(jīng)網(wǎng)絡(luò)組成。

wKgaomToPL6AXQOnAAFu83nqZ0w667.png

圖 1. 包含位置編碼器和編碼器的 ViT 模型處理圖像

通過自注意力機制,每個標(biāo)記或圖塊與其他標(biāo)記進行交互,以決定哪些標(biāo)記是重要的。這有助于模型捕捉標(biāo)記之間的關(guān)系和依賴,并學(xué)習(xí)哪些標(biāo)記是更重要的。

例如在有一只鳥的圖像中,模型會更關(guān)注重要的特征,比如眼睛、鳥嘴和羽毛等,而不是背景。這使得訓(xùn)練更加高效,增強了對圖像損壞和噪聲情況的魯棒性,并在未見過的物體上表現(xiàn)出更優(yōu)越的泛化能力。

為何 ViT 對計算機

視覺應(yīng)用至關(guān)重要

真實世界的環(huán)境具有多樣且復(fù)雜的視覺模式。與 CNN 不同,ViT 憑借自身的可擴展性和適應(yīng)性,能夠處理各種任務(wù),而且無需針對具體的任務(wù)調(diào)整架構(gòu)。

wKgaomToPL6AZ6y6AAXFPe2hYdU465.png

圖 2. 各種不完美和嘈雜的

現(xiàn)實數(shù)據(jù)給圖像分析帶來了難題

在下面的視頻中,我們比較了基于 CNN 和 ViT 的模型的噪聲視頻。在任何情況下,ViT 模型表現(xiàn)都優(yōu)于 CNN 模型。

視頻 1. 了解 SegFormer,這是一個

結(jié)合高效率和穩(wěn)健語義分割能力的 ViT 模型

將 ViT 與 TAO Toolkit 5.0 集成

TAO 是一個低代碼 AI 工具包,用于構(gòu)建和加速視覺 AI 模型,可用于輕松地構(gòu)建和集成 ViT 到應(yīng)用和 AI 工作流程中。用戶可以通過簡單的界面和配置文件快速開始訓(xùn)練 ViT,無需深入了解模型架構(gòu)。

TAO Toolkit 5.0 提供幾種常用于計算機視覺任務(wù)的先進 ViT,包括:

全注意力網(wǎng)絡(luò)(FAN)

FAN 是由 NVIDIA 研究團隊開發(fā)的一系列基于 Transformer 架構(gòu)的神經(jīng)網(wǎng)絡(luò)主干模型。該系列模型在對抗各種干擾方面達到了當(dāng)前技術(shù)水平的最佳程度,如表格 1 所示。這些主干模型能夠輕松適應(yīng)新的領(lǐng)域,對抗噪聲和模糊。表格 1 展示了所有 FAN 模型在 ImageNet-1K 數(shù)據(jù)集上所達到的準(zhǔn)確率,無論是干凈版本還是經(jīng)過干擾處理后的版本。

wKgaomToPL6AVn7BAAAxlWxNk-4355.png

表 1. FAN 模型的大小和準(zhǔn)確性

全局上下文 Vision Transformer (GC-ViT)

GC-ViT 是 NVIDIA 研究部門開發(fā)的一種具有極高準(zhǔn)確性和計算效率的新型架構(gòu)。該架構(gòu)解決了 Vision Transformer 中缺乏歸納偏置的問題。通過使用局部自注意力機制,GC-ViT 在參數(shù)較少的情況下在 ImageNet 上取得更好的結(jié)果,同時結(jié)合全局自注意力,可以實現(xiàn)更好的局部和全局空間交互。

wKgaomToPL-AaAcLAAAwtKQJ92g384.png

表 2. GC-ViT 模型的大小和準(zhǔn)確性

帶有改進后去噪錨框的檢測 Transformer(DINO)

DINO 是最新一代的檢測變換器(DETR),其訓(xùn)練收斂速度比其他 ViT 和 CNN 更快。在 TAO 工具套件中,DINO 十分靈活,可以與傳統(tǒng) CNN(例如 ResNets)和基于 Transformer 的骨干網(wǎng)絡(luò)(如 FAN)和 GC-ViT 等相結(jié)合。

wKgaomToPL-ASKEWAADXYXf-6Sw823.png

圖 3. DINO 與其他模型的準(zhǔn)確性比較

Segformer

Segformer 是一個輕量級且具有魯棒性的基于 Transformer 的語義分割模型。其解碼器由輕量級的多頭感知層組成。它避免使用大多 Transformer 使用的位置編碼,可在不同分辨率下進行高效推理。

使用 NVIDIA L4 GPU

高效驅(qū)動 Transformer

NVIDIA L4 GPU 是為未來的視覺 AI 工作負(fù)載而打造的。它們采用 NVIDIA Ada Lovelace 架構(gòu),旨在加速具有變革性的 AI 技術(shù)。

L4 GPU 擁有高達 FP8 485 TFLOPs 的計算能力,適于運行 ViT 工作負(fù)載。相較更高精度的計算方式,FP8 的低精度計算可以減輕內(nèi)存壓力,還可以顯著提升 AI 的處理速度。

L4 是一款多功能、節(jié)能高效的設(shè)備,具有單槽、低調(diào)的外形,非常適合用于視覺 AI 部署(包括在邊緣位置)。

您可以觀看Metropolis Developer Meetuphttps://info.nvidia.com/metropolis-meetup-june2023.html),了解有關(guān) ViT、NVIDIA TAO Toolkit 5.0 以及 L4 GPU 的更多信息。

點擊“閱讀原文”,或掃描下方海報二維碼,在 8 月 8日聆聽NVIDIA 創(chuàng)始人兼 CEO 黃仁勛在 SIGGRAPH 現(xiàn)場發(fā)表的 NVIDIA 主題演講,了解 NVIDIA 的新技術(shù),包括屢獲殊榮的研究,OpenUSD 開發(fā),以及最新的 AI 內(nèi)容創(chuàng)作解決方案。


原文標(biāo)題:使用 Vision Transformer 和 NVIDIA TAO,提高視覺 AI 應(yīng)用的準(zhǔn)確性和魯棒性

文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英偉達
    +關(guān)注

    關(guān)注

    23

    文章

    4087

    瀏覽量

    99224

原文標(biāo)題:使用 Vision Transformer 和 NVIDIA TAO,提高視覺 AI 應(yīng)用的準(zhǔn)確性和魯棒性

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    瞻芯電子G2 650V SiC MOSFET的驗證試驗

    瞻芯電子(IVCT)基于經(jīng)典壽命模型,對大樣本量的第二代(G2)650V SiC MOSFET 進行了驗證試驗(Robustness-Validation)。該試驗嚴(yán)格遵循AEC-Q101
    的頭像 發(fā)表于 12-18 16:35 ?6532次閱讀
    瞻芯電子G2 650V SiC MOSFET的<b class='flag-5'>魯</b><b class='flag-5'>棒</b><b class='flag-5'>性</b>驗證試驗

    如何確保電能質(zhì)量在線監(jiān)測裝置運行日志的準(zhǔn)確性

    電能質(zhì)量在線監(jiān)測裝置運行日志的準(zhǔn)確性直接影響故障溯源、合規(guī)審計和運維決策,需從 “數(shù)據(jù)采集源頭、記錄過程、存儲傳輸、校驗維護、管理流程” 五大維度構(gòu)建閉環(huán)保障體系,結(jié)合技術(shù)手段與行業(yè)標(biāo)準(zhǔn),實現(xiàn)日志
    的頭像 發(fā)表于 12-17 11:08 ?586次閱讀
    如何確保電能質(zhì)量在線監(jiān)測裝置運行日志的<b class='flag-5'>準(zhǔn)確性</b>?

    確保X光設(shè)備檢測的有效準(zhǔn)確性的關(guān)鍵技巧

    在工業(yè)和安全領(lǐng)域,X光設(shè)備檢測已成為不可或缺的重要環(huán)節(jié)。然而,許多用戶常常面臨檢測效果不理想、準(zhǔn)確性不足的問題,影響生產(chǎn)效率和安全保障。如何確保X光檢測設(shè)備能夠發(fā)揮最大效能,準(zhǔn)確捕捉目標(biāo)信息,是當(dāng)前
    的頭像 發(fā)表于 11-18 11:27 ?402次閱讀

    如何降低環(huán)境干擾強度對諧波檢測設(shè)備準(zhǔn)確性的影響?

    ? 降低環(huán)境干擾強度對諧波檢測設(shè)備準(zhǔn)確性的影響,需圍繞 “ 阻斷干擾傳播路徑→優(yōu)化設(shè)備自身抗擾能力→修正干擾導(dǎo)致的誤差→合理布局規(guī)避干擾 ” 四大核心思路,從硬件防護、信號處理、安裝布局、設(shè)備
    的頭像 發(fā)表于 10-13 17:32 ?995次閱讀

    電能質(zhì)量在線監(jiān)測裝置的精度等級對其測量結(jié)果的準(zhǔn)確性有何影響?

    電能質(zhì)量在線監(jiān)測裝置的精度等級是衡量其測量結(jié)果準(zhǔn)確性的 核心量化指標(biāo) ,直接決定了測量值與 “真實值” 的偏差范圍。精度等級越高(如 A 級),誤差限值越嚴(yán)格,測量結(jié)果的準(zhǔn)確性越高;反之(如 B/C
    的頭像 發(fā)表于 09-26 17:40 ?1347次閱讀

    怎樣提高電能質(zhì)量在線監(jiān)測裝置定位諧波源的準(zhǔn)確性

    提高電能質(zhì)量在線監(jiān)測裝置定位諧波源的準(zhǔn)確性,需圍繞 “ 優(yōu)化監(jiān)測基礎(chǔ)條件→升級核心技術(shù)能力→適配電網(wǎng)動態(tài)工況→強化數(shù)據(jù)質(zhì)量管控 ” 四大維度,針對 “測點布局、同步精度、算法適配、干擾抑制” 等關(guān)鍵
    的頭像 發(fā)表于 09-26 15:24 ?642次閱讀

    電能質(zhì)量在線監(jiān)測裝置定位諧波源的準(zhǔn)確性有多高?

    電能質(zhì)量在線監(jiān)測裝置定位諧波源的準(zhǔn)確性 沒有固定數(shù)值 ,而是受 “ 監(jiān)測網(wǎng)絡(luò)設(shè)計、技術(shù)參數(shù)精度、算法適配、電網(wǎng)工況復(fù)雜 ” 四大核心因素影響,呈現(xiàn) “ 場景化差異 ”—— 在理想條件下(如低壓配
    的頭像 發(fā)表于 09-26 15:20 ?607次閱讀

    如何保障電能質(zhì)量監(jiān)測裝置的準(zhǔn)確性?

    保障電能質(zhì)量監(jiān)測裝置(以下簡稱 “裝置”)的準(zhǔn)確性,需貫穿其 “ 選型→安裝→運行維護→校準(zhǔn)→報廢 ” 全生命周期,核心是通過 “ 源頭把控硬件精度、過程規(guī)避干擾與退化、定期驗證與修正 ”,確保裝置
    的頭像 發(fā)表于 09-23 16:03 ?918次閱讀

    如何保證數(shù)據(jù)校驗系統(tǒng)的時間同步以提高準(zhǔn)確性?

    在電能質(zhì)量監(jiān)測的數(shù)據(jù)校驗系統(tǒng)中, 時間同步的準(zhǔn)確性直接決定了多監(jiān)測點數(shù)據(jù)的時空一致、暫態(tài)事件的時序匹配度,以及校驗結(jié)果的可信度 。要保證時間同步以提升數(shù)據(jù)校驗準(zhǔn)確性,需從 “協(xié)議選擇、硬件保障
    的頭像 發(fā)表于 09-19 11:28 ?664次閱讀

    電能質(zhì)量監(jiān)測中,有哪些方法可以提高數(shù)據(jù)校驗系統(tǒng)的準(zhǔn)確性?

    在電能質(zhì)量監(jiān)測中,數(shù)據(jù)校驗系統(tǒng)的準(zhǔn)確性是保障監(jiān)測數(shù)據(jù)可信度的核心,需從 “標(biāo)準(zhǔn)源精度、校準(zhǔn)流程、硬件適配、算法優(yōu)化、時間同步、運維管理” 等多維度構(gòu)建提升方案,針對解決 “信號失真、參數(shù)偏差、環(huán)境
    的頭像 發(fā)表于 09-19 10:03 ?631次閱讀

    如何確保電能質(zhì)量在線監(jiān)測裝置的數(shù)據(jù)校驗的準(zhǔn)確性?

    確保電能質(zhì)量在線監(jiān)測裝置(以下簡稱 “監(jiān)測裝置”)數(shù)據(jù)校驗的準(zhǔn)確性,需圍繞 “ 標(biāo)準(zhǔn)溯源、流程規(guī)范、環(huán)境控制、數(shù)據(jù)審核、全周期追溯 ” 五大核心環(huán)節(jié),建立全鏈條管控機制,覆蓋校驗前準(zhǔn)備、校驗過程執(zhí)行
    的頭像 發(fā)表于 09-18 11:05 ?604次閱讀
    如何確保電能質(zhì)量在線監(jiān)測裝置的數(shù)據(jù)校驗的<b class='flag-5'>準(zhǔn)確性</b>?

    如何使用運行數(shù)據(jù)趨勢分析驗證裝置準(zhǔn)確性?

    利用運行數(shù)據(jù)趨勢分析驗證電能質(zhì)量在線監(jiān)測裝置準(zhǔn)確性,核心邏輯是 通過長期采集的電網(wǎng)運行數(shù)據(jù),判斷其趨勢是否符合電網(wǎng)實際規(guī)律、是否具備穩(wěn)定性與一致 —— 若裝置準(zhǔn)確,其輸出的數(shù)據(jù)趨勢應(yīng)與電網(wǎng)工況(如
    的頭像 發(fā)表于 09-18 10:33 ?504次閱讀
    如何使用運行數(shù)據(jù)趨勢分析驗證裝置<b class='flag-5'>準(zhǔn)確性</b>?

    測縫計測量數(shù)據(jù)的準(zhǔn)確性和校準(zhǔn)方法解析

    在結(jié)構(gòu)物安全監(jiān)測領(lǐng)域,數(shù)據(jù)準(zhǔn)確性是評估工程健康狀態(tài)的核心依據(jù)。振弦式測縫計作為主流裂縫監(jiān)測設(shè)備,其測量精度直接影響裂縫發(fā)展趨勢的判斷。那么如何確保測縫計測量數(shù)據(jù)的準(zhǔn)確性以及如何校準(zhǔn)?下面是南京峟思給
    的頭像 發(fā)表于 07-07 13:56 ?672次閱讀
    測縫計測量數(shù)據(jù)的<b class='flag-5'>準(zhǔn)確性</b>和校準(zhǔn)方法解析

    必知!影響手機氣密檢測準(zhǔn)確性的重要因素

    移動設(shè)備防水防塵技術(shù)升級,手機氣密檢測成保障產(chǎn)品可靠的關(guān)鍵。但檢測準(zhǔn)確性受設(shè)備精度、環(huán)境穩(wěn)定性、操作規(guī)范性及手機結(jié)構(gòu)設(shè)計局限等因素干擾,影響測試結(jié)果、產(chǎn)品良品率和用戶體驗。影響手機氣密
    的頭像 發(fā)表于 07-04 14:26 ?930次閱讀
    必知!影響手機氣密<b class='flag-5'>性</b>檢測<b class='flag-5'>準(zhǔn)確性</b>的重要因素

    手表外殼氣密檢測儀:如何有效提升檢測效率與準(zhǔn)確性

    在手表制造行業(yè),手表外殼的氣密檢測至關(guān)重要。一款優(yōu)質(zhì)的氣密檢測儀能夠精準(zhǔn)判斷手表外殼的密封性能,確保手表在各種環(huán)境下正常運行。那么,怎樣才能有效提升手表外殼氣密檢測儀的檢測效率與準(zhǔn)確性
    的頭像 發(fā)表于 06-07 14:01 ?841次閱讀
    手表外殼氣密<b class='flag-5'>性</b>檢測儀:如何有效提升檢測效率與<b class='flag-5'>準(zhǔn)確性</b>