91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

MLPerf 聯(lián)盟公布7項(xiàng)測(cè)試構(gòu)成了當(dāng)前機(jī)器學(xué)習(xí)領(lǐng)域的全新行業(yè)基準(zhǔn)測(cè)試

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:lq ? 2018-12-24 14:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,MLPerf 聯(lián)盟公布了其7項(xiàng)測(cè)試的首批結(jié)果,此7項(xiàng)測(cè)試構(gòu)成了當(dāng)前機(jī)器學(xué)習(xí)領(lǐng)域的全新行業(yè)基準(zhǔn)測(cè)試。NVIDIA參與了其中6個(gè)類別的測(cè)試,在這6項(xiàng)測(cè)試中,從單節(jié)點(diǎn)測(cè)試到大規(guī)模測(cè)試,NVIDIA平臺(tái)的測(cè)試結(jié)果都遙遙領(lǐng)先,證明了NVIDIA平臺(tái)方法在加速機(jī)器學(xué)習(xí)領(lǐng)域的強(qiáng)大實(shí)力。

MLPerf 聯(lián)盟的宗旨是“ 致力于確立一套通用的基準(zhǔn)測(cè)試,助力機(jī)器學(xué)習(xí) (ML) 領(lǐng)域跨移動(dòng)設(shè)備和云服務(wù)測(cè)量系統(tǒng)的訓(xùn)練和推理性能?!盢VIDIA 一直以來(lái)都是 MLPerf 聯(lián)盟的主要成員,與其他成員一同積極構(gòu)建、完善和發(fā)展首套商定一致的工作負(fù)載,以便可以跨用例范圍地直接比較各平臺(tái)性能。

作為快速成長(zhǎng)的新興市場(chǎng),機(jī)器學(xué)習(xí)領(lǐng)域缺少用來(lái)評(píng)估平臺(tái)性能的行業(yè)測(cè)試基準(zhǔn)。雖然 ResNet-50 等網(wǎng)絡(luò)經(jīng)常用作訓(xùn)練和推理的性能代理,但其仍是一套主要基于圖像任務(wù)的單一CNN,不能提供機(jī)器學(xué)習(xí)平臺(tái)的完整性能圖景。機(jī)器學(xué)習(xí)還包含許多其他用例,例如語(yǔ)音、翻譯和推薦系統(tǒng)等。

認(rèn)識(shí) MLPerf

MLPerf 的關(guān)鍵設(shè)計(jì)目標(biāo)之一是工作負(fù)載的多樣化。因此,它涵蓋了對(duì)圖像和自然語(yǔ)言的使用,以及推薦系統(tǒng)和強(qiáng)化學(xué)習(xí)等,共 7 項(xiàng)測(cè)試。目前,這些工作負(fù)載僅可用于測(cè)試訓(xùn)練,未來(lái)版本的工作負(fù)載將計(jì)劃以推理為重點(diǎn)。

NVIDIA最初致力于研究封閉組,旨在針對(duì)ML訓(xùn)練系統(tǒng)(包括硬件和軟件)提供有價(jià)值的對(duì)比。為實(shí)現(xiàn)這一目標(biāo),封閉組要求所有提交成果均使用相同的數(shù)據(jù)準(zhǔn)備和訓(xùn)練程序來(lái)訓(xùn)練相同的神經(jīng)網(wǎng)絡(luò)模型架構(gòu)。從應(yīng)用程序角度看,這將確保所有條目盡可能等同,性能的差異只歸因于軟件、硬件或規(guī)模不同。選擇封閉組的網(wǎng)絡(luò)模型、數(shù)據(jù)集和訓(xùn)練程序作為當(dāng)今機(jī)器學(xué)習(xí)社區(qū)中的通用計(jì)算方法。另一方面,公開組不用于系統(tǒng)對(duì)比,而是用于鼓勵(lì)網(wǎng)絡(luò)模型架構(gòu)和其算法方面的創(chuàng)新。

NVIDIA提交了7項(xiàng)測(cè)試類別中的6類測(cè)試結(jié)果,未提交強(qiáng)化學(xué)習(xí)測(cè)試,是因?yàn)檫@項(xiàng)測(cè)試基于戰(zhàn)略游戲《GO》,該游戲最初在配備Tesla P100 GPU的服務(wù)器上進(jìn)行開發(fā)。但目前情況是,服務(wù)器中包含重要的CPU組件,因此只能提供有限的擴(kuò)展。

MLPerf分?jǐn)?shù)的計(jì)算方法是,首先測(cè)量訓(xùn)練到達(dá)指定目標(biāo)精度的時(shí)間,然后歸一化為參考平臺(tái)上未執(zhí)行優(yōu)化所需的時(shí)間。歸一化的目的是將不同的基準(zhǔn)測(cè)試轉(zhuǎn)化為相似的分?jǐn)?shù)量級(jí),因?yàn)楦骰鶞?zhǔn)測(cè)試所需的訓(xùn)練時(shí)間不同。訓(xùn)練時(shí)間和 MLPerf 分?jǐn)?shù)均發(fā)布在 MLPerf 網(wǎng)站上,為此我們以分鐘為單位公布訓(xùn)練時(shí)間。以下是 NVIDIA 達(dá)到收斂結(jié)果的時(shí)間,包括單節(jié)點(diǎn)和大規(guī)模的實(shí)現(xiàn):

單節(jié)點(diǎn)封閉組 GPU 性能:

測(cè)試平臺(tái):DGX-2H – 雙路Xeon Platinum 8174、1.5TB 系統(tǒng) RAM、16 個(gè) 32GB Tesla V100 SXM-3 GPU通過(guò)NVSwitch互通。

大規(guī)模封閉組 GPU 性能:

測(cè)試平臺(tái):DGX-1V 集群,適用于圖像分類和非重復(fù)性翻譯。DGX-2H 集群,適用于重型物體檢測(cè)和輕量型物體檢測(cè)、重復(fù)性翻譯。每個(gè)DGX-1V配備雙路 Xeon E5-2698 V4、512GB 系統(tǒng) RAM、8 個(gè)16GB Tesla V100 SXM-2 GPU。每個(gè)DGX-2H配備雙路Xeon Platinum 8174、1.5TB系統(tǒng)RAM、16個(gè)32GB Tesla V100 SXM-3 GPU通過(guò)NVSwitch互通。

從以上數(shù)字可以看出:?jiǎn)蝹€(gè)DGX-2節(jié)點(diǎn)能夠在20分鐘內(nèi)完成多數(shù)工作負(fù)載。在大規(guī)模提交中,除1次測(cè)試外,都在7分鐘內(nèi)完成這些任務(wù)。與第二快的提交相比,GPU的交付速度提高達(dá) 5.3 倍。鑒于深度學(xué)習(xí)早期階段的訓(xùn)練以天和周計(jì)算,上述完成時(shí)間證明我們?cè)谶^(guò)去幾年中取得了巨大進(jìn)步。以下圖表說(shuō)明我們?cè)谟?xùn)練 ResNet-50 模型方面取得的進(jìn)步程度:

很顯然,因?yàn)橐幌盗衅脚_(tái)創(chuàng)新,過(guò)去幾年里性能提升巨大。這些創(chuàng)新包括:

NVLink 結(jié)構(gòu)技術(shù):Pascal 架構(gòu)中引入NVLink允許GPU以300GB/秒的速度進(jìn)行通信,比PCIe快近10倍。

Tensor Cores:Volta架構(gòu)中引入Tensor Cores,加速了大型矩陣運(yùn)算(這是AI的核心),在單次運(yùn)算中執(zhí)行混合精度矩陣乘法和累加計(jì)算。

NVSwitch:首款節(jié)點(diǎn)交換架構(gòu),在單個(gè)服務(wù)器節(jié)點(diǎn)中支持16個(gè)全互聯(lián)GPU,并驅(qū)動(dòng)全部8對(duì)GPU 分別以300GB/s的速度同時(shí)通信。這16個(gè)GPU 還可作為單個(gè)大型加速器,擁有0.5TB的統(tǒng)一內(nèi)存空間和每秒2千萬(wàn)億次的深度學(xué)習(xí)計(jì)算性能。

全棧優(yōu)化:方法得當(dāng)

NVIDIA的加速深度學(xué)習(xí)方法包含整套平臺(tái),并在硬件、軟件和生態(tài)系統(tǒng)支持下持續(xù)創(chuàng)新。這種方法為深度學(xué)習(xí)社區(qū)帶來(lái)巨大的優(yōu)勢(shì),允許開發(fā)人員在任何提供商的云服務(wù)上使用任何熱門框架,或者使用自己的GPU基礎(chǔ)架構(gòu)實(shí)現(xiàn)卓越的性能。NVIDIA向MLPerf提交的測(cè)試使用MXNet處理圖像分類工作負(fù)載(ResNet-50),使用PyTorch提交涵蓋翻譯、對(duì)象檢測(cè)和實(shí)例分割以及推薦器的工作負(fù)載。谷歌的TernsorFlow團(tuán)隊(duì)也展示了在谷歌云平臺(tái)上使用NVIDIA V100 GPU處理ResNet-50的出色表現(xiàn)。

這些框架均可在NVIDIA GPU云(NGC)容器注冊(cè)服務(wù)器中免費(fèi)獲取,并且每月更新一次,性能持續(xù)改進(jìn)。此前發(fā)表的一篇博客中說(shuō)明 11 月 18.11 版本的容器中對(duì) NVIDIA 深度學(xué)習(xí)軟件堆棧的最新改進(jìn)。以下將簡(jiǎn)述這些改進(jìn):

MXNet

添加了 Horovod,改進(jìn)跨多個(gè)節(jié)點(diǎn)訓(xùn)練的性能。

借助小批量 (<= 32) 優(yōu)化大規(guī)模多節(jié)點(diǎn)訓(xùn)練的性能

有關(guān)更多詳細(xì)信息,請(qǐng)參閱AWS上的博客,其中具體概述了MXNet的最新改進(jìn)。

TensorFlow

更新了XLA圖形編譯器,優(yōu)化了運(yùn)算符融合以節(jié)省內(nèi)存帶寬,優(yōu)化了Tensor Core數(shù)據(jù)布局。谷歌最近的一篇博客詳細(xì)介紹了更具體的細(xì)節(jié)。

PyTorch

Apex中新添實(shí)用程序,并融合實(shí)施Adam優(yōu)化器,通過(guò)減少冗余GPU設(shè)備內(nèi)存通道、改進(jìn)卷積翻譯模型的層歸一化性能以及為多進(jìn)程和多節(jié)點(diǎn)訓(xùn)練改進(jìn)DistributedDataParallel包裝器,以提高性能。

cuDNN

多方面顯著性改進(jìn)了卷積性能,尤其在每個(gè)GPU 小批量處理數(shù)據(jù)之時(shí);優(yōu)化了Tensor Core的Persistent RNNs算法。

DALI

對(duì)象檢測(cè)模型所需的各種圖像預(yù)處理例程提速,現(xiàn)在它們可在GPU上運(yùn)行,而無(wú)需CPU。

結(jié)束語(yǔ)

NVIDIA對(duì)第一組公布結(jié)果感到深受鼓舞,并對(duì)在AI社區(qū)中與各個(gè)框架開發(fā)團(tuán)隊(duì)的合作深感自豪。MLPerf作為一種工具,允許AI平臺(tái)制造商使用一組商定的用例來(lái)比較他們的產(chǎn)品,我們將繼續(xù)與MLPerf聯(lián)盟合作,并隨AI工作負(fù)載的進(jìn)展,迭代這一基準(zhǔn)。以上這些技術(shù)現(xiàn)已面向AI開發(fā)者社區(qū)開放,可從我們的 NGC容器注冊(cè)服務(wù)器獲取。敬請(qǐng)關(guān)注我們的開發(fā)者博客更新,了解有關(guān) TensorFlow、PyTorch和MXNet框架中的具體優(yōu)化的更多信息。www.mlperf.org 上提供MLPerf基準(zhǔn)模型,可根據(jù)相關(guān)基準(zhǔn)目錄中的自述文件運(yùn)行。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5594

    瀏覽量

    109743
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8553

    瀏覽量

    136953
  • 自然語(yǔ)言
    +關(guān)注

    關(guān)注

    1

    文章

    292

    瀏覽量

    13989
  • MLPerf
    +關(guān)注

    關(guān)注

    0

    文章

    37

    瀏覽量

    970

原文標(biāo)題:NVIDIA 在全球首個(gè)全行業(yè) AI 基準(zhǔn)測(cè)試中拔得頭籌

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    如何評(píng)估憶聯(lián)Gen5 eSSD UH812a在AI場(chǎng)景中的性能表現(xiàn)

    隨著AI大模型進(jìn)入萬(wàn)億參數(shù)時(shí)代,傳統(tǒng)存儲(chǔ)性能測(cè)試已難以真實(shí)反映存儲(chǔ)系統(tǒng)在實(shí)際訓(xùn)練場(chǎng)景中對(duì)成本與效率的核心影響。為此,全球權(quán)威AI基準(zhǔn)測(cè)評(píng)組織MLCommons正式推出MLPerf Storage
    的頭像 發(fā)表于 02-05 09:56 ?1003次閱讀
    如何評(píng)估憶聯(lián)Gen5 eSSD UH812a在AI場(chǎng)景中的性能表現(xiàn)

    人工智能與機(jī)器學(xué)習(xí)在這些行業(yè)的深度應(yīng)用

    自人工智能和機(jī)器學(xué)習(xí)問(wèn)世以來(lái),多個(gè)在線領(lǐng)域的數(shù)字化格局迎來(lái)了翻天覆地的變化。這些技術(shù)從誕生之初就為企業(yè)賦予了競(jìng)爭(zhēng)優(yōu)勢(shì),而在線行業(yè)正是受其影響最為顯著的
    的頭像 發(fā)表于 02-04 14:44 ?478次閱讀

    時(shí)間基準(zhǔn)的核心力量:低相噪銣原子振蕩時(shí)鐘的多領(lǐng)域應(yīng)用解析

    夠?yàn)橥ㄐ畔到y(tǒng)提供統(tǒng)一的時(shí)間基準(zhǔn),保障多設(shè)備協(xié)同工作的協(xié)調(diào)性,助力通信網(wǎng)絡(luò)向更高速度、更高容量、更高可靠性演進(jìn)。二、航天航空:護(hù)航極端環(huán)境下的精準(zhǔn)操控 航天航空領(lǐng)域的每一項(xiàng)任務(wù)都關(guān)乎生命安全與國(guó)
    發(fā)表于 01-16 10:20

    重磅發(fā)布 | 泰克(Tektronix)推出全新7系列DPO示波器與MP5000系列模塊化精密測(cè)試

    重磅新品發(fā)布2025年9月16日,俄勒岡州比弗頓時(shí)間今天是泰克科技(Tektronix)發(fā)展史上的里程碑時(shí)刻。我們正式發(fā)布兩項(xiàng)突破性成果——全新7系列DPO示波器與MP5000系列模塊化精密測(cè)
    的頭像 發(fā)表于 09-19 17:17 ?1452次閱讀
    重磅發(fā)布 | 泰克(Tektronix)推出<b class='flag-5'>全新</b><b class='flag-5'>7</b>系列DPO示波器與MP5000系列模塊化精密<b class='flag-5'>測(cè)試</b>

    泰克科技推出全新7系列DPO示波器與MP5000系列模塊化精密測(cè)試系統(tǒng)

    今天是泰克科技(Tektronix)發(fā)展史上的里程碑時(shí)刻。我們正式發(fā)布兩項(xiàng)突破性成果——全新7系列DPO示波器與MP5000系列模塊化精密測(cè)試系統(tǒng),它們將重新定義
    的頭像 發(fā)表于 09-17 09:13 ?2159次閱讀

    全屋WiFi強(qiáng)電款WiFi6 86面板一站式測(cè)試解決方案

    WiFi6 86面板一站式測(cè)試方案,以精益生產(chǎn)邏輯重構(gòu)測(cè)試流程,破解行業(yè)痛點(diǎn),為智能硬件測(cè)試環(huán)節(jié)的提效、降本、安全升級(jí)提供全新思路 。 一、
    發(fā)表于 08-21 14:49

    RWC2500A Plus音頻廣播測(cè)試領(lǐng)域全新解決方案

    在音頻廣播領(lǐng)域,測(cè)試設(shè)備是確保通信質(zhì)量、優(yōu)化廣播發(fā)射機(jī)性能以及排查故障的關(guān)鍵工具。FMAB 作為一款經(jīng)典的音頻廣播測(cè)試設(shè)備,憑借其穩(wěn)定的性能和廣泛的應(yīng)用場(chǎng)景,長(zhǎng)期以來(lái)在行業(yè)內(nèi)占據(jù)重要地
    的頭像 發(fā)表于 08-18 09:42 ?3863次閱讀
    RWC2500A Plus音頻廣播<b class='flag-5'>測(cè)試</b><b class='flag-5'>領(lǐng)域</b><b class='flag-5'>全新</b>解決方案

    登頂!華為OceanStor A系列存儲(chǔ)再登MLPerf全球性能之巔

    2025年8月5日,全球權(quán)威AI性能評(píng)測(cè)組織公布最新MLPerf? Storage v2.0基準(zhǔn)測(cè)試結(jié)果,華為OceanStor A系列存儲(chǔ)聯(lián)合濟(jì)南超級(jí)計(jì)算技術(shù)研究院(簡(jiǎn)稱“JNIST
    的頭像 發(fā)表于 08-07 14:02 ?829次閱讀

    愛(ài)立信攜手Telstra創(chuàng)下全新行業(yè)里程碑

    愛(ài)立信近日攜手Telstra創(chuàng)下全新行業(yè)里程碑,在悉尼北部50多個(gè)商用5G-A站點(diǎn)成功部署自動(dòng)載波聚合技術(shù),使Telstra成為首個(gè)在商用網(wǎng)絡(luò)環(huán)境中應(yīng)用該功能的運(yùn)營(yíng)商。
    的頭像 發(fā)表于 08-06 16:45 ?1.7w次閱讀

    西部數(shù)據(jù)通過(guò) MLPerfa Storage V2 測(cè)試結(jié)果,驗(yàn)證其真實(shí)場(chǎng)景下的AI存儲(chǔ)性能

    。西部數(shù)據(jù)(NASDAQ: WDC)近日公布MLPerf? Storage V2?測(cè)試結(jié)果,驗(yàn)證了旗下 OpenFlex? Data24 4000?系列?NVMe-oF??存儲(chǔ)平臺(tái)
    發(fā)表于 08-05 18:15 ?929次閱讀

    橫掃葵花獎(jiǎng)14項(xiàng)大獎(jiǎng),德施曼刷新行業(yè)記錄!領(lǐng)航AI時(shí)代!

    2025年7月9日,中國(guó)建博會(huì)現(xiàn)場(chǎng)——全球智能家居最高榮譽(yù)“第九屆葵花獎(jiǎng)?lì)C獎(jiǎng)盛典”圓滿落幕。德施曼憑借顛覆性的技術(shù)突破與全球化的品牌勢(shì)能,一舉斬獲14項(xiàng)頂級(jí)大獎(jiǎng),成為行業(yè)獲獎(jiǎng)最多的品牌,包攬最高榮譽(yù)
    的頭像 發(fā)表于 07-10 21:49 ?1514次閱讀
    橫掃葵花獎(jiǎng)14<b class='flag-5'>項(xiàng)</b>大獎(jiǎng),德施曼刷<b class='flag-5'>新行業(yè)</b>記錄!領(lǐng)航AI時(shí)代!

    慧通測(cè)控的協(xié)作機(jī)器人有哪些測(cè)試項(xiàng)目?

    在智能制造與自動(dòng)化浪潮席卷全球的當(dāng)下,協(xié)作機(jī)器人(Cobots)以其能夠與人類安全、高效協(xié)同作業(yè)的特性,成為工業(yè)、醫(yī)療、物流等領(lǐng)域的 “新寵”。然而,要確保協(xié)作機(jī)器人在復(fù)雜場(chǎng)景中穩(wěn)定運(yùn)行,一系列嚴(yán)格且全面的
    的頭像 發(fā)表于 06-05 14:30 ?586次閱讀
    慧通測(cè)控的協(xié)作<b class='flag-5'>機(jī)器</b>人有哪些<b class='flag-5'>測(cè)試</b>項(xiàng)目?

    電纜耐壓測(cè)試儀誰(shuí)家比較好?

    “一帶一路” 沿線 18 國(guó)重點(diǎn)項(xiàng)目中,其工頻耐壓試驗(yàn)裝置單套設(shè)備完成 8 公里電纜串聯(lián)耐壓測(cè)試,刷新行業(yè)效率紀(jì)錄,還能通過(guò)云端數(shù)據(jù)管理平臺(tái),支持 10 萬(wàn)組波形智能分析,自動(dòng)生成設(shè)備健康度三維圖
    發(fā)表于 04-28 09:54

    手動(dòng)檢測(cè)的終結(jié)者:機(jī)器人氣密性測(cè)試設(shè)備來(lái)襲

    在制造業(yè)的精密檢測(cè)領(lǐng)域,氣密性測(cè)試一直是保證產(chǎn)品質(zhì)量的關(guān)鍵環(huán)節(jié)。然而,傳統(tǒng)的手動(dòng)檢測(cè)方法存在效率低下、誤差較大等問(wèn)題,已經(jīng)無(wú)法滿足現(xiàn)代工業(yè)對(duì)高質(zhì)量和高效率的追求。隨著科技的進(jìn)步,機(jī)器人氣密性測(cè)
    的頭像 發(fā)表于 04-16 14:50 ?702次閱讀
    手動(dòng)檢測(cè)的終結(jié)者:<b class='flag-5'>機(jī)器</b>人氣密性<b class='flag-5'>測(cè)試</b>設(shè)備來(lái)襲

    1.9倍性能提升!英特爾至強(qiáng)6在MLPerf基準(zhǔn)測(cè)試中表現(xiàn)卓越

    與第五代至強(qiáng)處理器相比,英特爾至強(qiáng)6性能核的性能平均提高了1.9倍。 今日,MLCommons公布了最新的MLPerf推理v5.0基準(zhǔn)測(cè)試結(jié)果,其中,英特爾??至強(qiáng)??6性能核處理器在
    的頭像 發(fā)表于 04-07 10:58 ?676次閱讀