91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI硬件反超英偉達(dá)?跑分來看尚不現(xiàn)實(shí)

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚(yáng) ? 2022-07-06 09:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

推理和訓(xùn)練作為AI/ML關(guān)鍵的一環(huán),無論是通用的GPU,還是專用的推理/訓(xùn)練加速器,都想在各大流行模型和機(jī)器學(xué)習(xí)庫上跑出優(yōu)秀的成績(jī),以展示自己的硬件實(shí)力。業(yè)界需要一個(gè)統(tǒng)一的跑分標(biāo)準(zhǔn),為此,各大廠商在2018年根據(jù)業(yè)內(nèi)指標(biāo)聯(lián)合打造的MLPerf就承擔(dān)了這一重任。

不過隨著時(shí)間的推移,MLPerf幾乎已經(jīng)成了英偉達(dá)一家獨(dú)大的跑分基準(zhǔn),這家GPU廠商憑借自己的產(chǎn)品幾乎統(tǒng)治著整個(gè)AI硬件市場(chǎng)。這不,近日公布的MLPerf Training 2.0,就將這些AI硬件公司和服務(wù)器廠商提交的具體AI訓(xùn)練成績(jī)公布了出來,其中既有一些新晉成員,也有一些出人意料的結(jié)果。

谷歌的反超

這次跑分結(jié)果中,最驚艷的還是谷歌的TPU v4系統(tǒng),谷歌憑借這一架構(gòu)的系統(tǒng),在五個(gè)基準(zhǔn)測(cè)試中都打破了性能記錄,平均訓(xùn)練速度比第二名的英偉達(dá)A100系統(tǒng)快了1.42倍左右,哪怕是與自己在1.0測(cè)試下的成績(jī)相比,也提升了1.5倍。

能實(shí)現(xiàn)這樣的成績(jī)自然離不開谷歌自己的TPU芯片設(shè)計(jì),谷歌的每個(gè)TPU v4 Pod都由4096個(gè)芯片組成,且?guī)捵龅搅?Tbps。除此之外,谷歌有著豐富的用例經(jīng)驗(yàn),相較其他公司而言,谷歌是唯一一個(gè)在搜索和視頻領(lǐng)域都已經(jīng)大規(guī)模普及AI/ML應(yīng)用的。

TPU v4與A100的對(duì)比 / 谷歌

不過谷歌與英偉達(dá)并不是直接競(jìng)爭(zhēng)關(guān)系,他們對(duì)標(biāo)的還是使用英偉達(dá)GPU系統(tǒng)的云服務(wù)公司,比如微軟的Azure,谷歌也為此特地做了成本對(duì)比。如上圖所示,在BERT模型的訓(xùn)練中,4096個(gè)TPU v4芯片與Azure 4096個(gè)A100芯片對(duì)比,谷歌的方案可以節(jié)省35%,ResNet模型的訓(xùn)練下更是可以節(jié)省近50%。

不過以上的成績(jī)?cè)谒?項(xiàng)測(cè)試中也只是和英偉達(dá)平分秋色,而且隨著系統(tǒng)規(guī)模的不同,其結(jié)果或許會(huì)有更多的變化。再者,谷歌的TPU僅限于其自己的云服務(wù),所以總的來說并不算一個(gè)通用方案,至少微軟和亞馬遜這樣的競(jìng)爭(zhēng)對(duì)手肯定是用不上。

英偉達(dá)地位不保?

除了谷歌之外,還取得了不錯(cuò)的成績(jī)的就是英特爾旗下Habana Labs的Gaudi2訓(xùn)練加速器。這款今年5月推出的處理器,從上一代的16nm換成了臺(tái)積電7nm,Tensor處理器內(nèi)核的數(shù)量因此增加了兩倍,使其在ResNet-50的訓(xùn)練吞吐量上實(shí)現(xiàn)了3倍提升,BERT的訓(xùn)練吞吐量提升了4.7倍。

Gaudi 2訓(xùn)練處理器 / 英特爾

在與英偉達(dá)提交的A100-80GB GPU系統(tǒng)成績(jī)相比,Gaudi2在ResNet-50上的訓(xùn)練時(shí)間縮短了36%;與戴爾提交的A100-40GB GPU系統(tǒng)成績(jī)相比,Gaudi2在BERT上的訓(xùn)練時(shí)間縮短了45%。

從結(jié)果來看,已經(jīng)有不少廠商的AI硬件已經(jīng)可以在訓(xùn)練上對(duì)標(biāo)甚至超過英偉達(dá)的GPU生態(tài)了,但這并不代表全部機(jī)器學(xué)習(xí)訓(xùn)練領(lǐng)域。比如在測(cè)試中,廠商是不需要將每個(gè)項(xiàng)目的測(cè)試結(jié)果都提交上去的。從這個(gè)角度來看,RetinaNet輕量型目標(biāo)檢測(cè)、COCO重型目標(biāo)檢測(cè)、語音識(shí)別數(shù)據(jù)集Librispeech和強(qiáng)化學(xué)習(xí)Minigo這幾個(gè)項(xiàng)目中,只有基于英偉達(dá)GPU的系統(tǒng)提交了成績(jī)。

不僅如此,如果你看所有提交成績(jī)的服務(wù)器和云服務(wù)公司來看,他們用到的CPU或是AMD的EPYC處理器,或是英特爾的Xeon處理器,但加速器卻是幾乎清一色的英偉達(dá)A100。這也證明了在百度、戴爾、H3C、浪潮和聯(lián)想這些廠商的眼中,英偉達(dá)的GPU依然是最具競(jìng)爭(zhēng)力的那個(gè)。

不可小覷的軟件

還有一點(diǎn)需要指出,那就是以上都是封閉組的成績(jī),他們所用到的都是標(biāo)準(zhǔn)的機(jī)器學(xué)習(xí)庫,比如TensorFlow 2.8.0和Pytorch 22.04等。而開放組則不受此限制,可以用到他們自己定制的庫或優(yōu)化器,這一組中三星和Graphcore都根據(jù)不同的軟件配置提交了成績(jī),但最亮眼的還是MosaicML。
?
Composer在ResNet-50下的訓(xùn)練時(shí)間對(duì)比 / MosaicML

這家公司所用的加速器硬件同樣是和諸多提交者一樣的英偉達(dá)A100-SXM-80GB GPU,但他們用到的是自己用Pytorch編寫的庫Composer。這家公司于今年4月推出了Composer,并聲稱可讓模型訓(xùn)練速度提升2到4倍。在MLPerf Training 2.0的跑分中,使用MosaicML Composer的對(duì)比組在ResNet訓(xùn)練速度上實(shí)現(xiàn)了近4.6倍的提升。不過Composer雖說支持任何模型,但這個(gè)提速的表現(xiàn)目前還是體現(xiàn)在ResNet上比較明顯,所以本次也并沒有提交其他模型下的成績(jī)。

考慮到英特爾等公司為了提升其軟件開發(fā)實(shí)力,已經(jīng)在收購Codeplay這樣的軟件開發(fā)公司,MosaicML作為剛公開不久的初創(chuàng)公司,創(chuàng)始人又是英特爾的前AI實(shí)驗(yàn)室骨干,如果能在未來展現(xiàn)出更優(yōu)秀的成績(jī),說不定也會(huì)被英偉達(dá)這樣的公司看中。

結(jié)語

英偉達(dá)常年在MLPerf上霸榜,也有不少人認(rèn)為MLPerf跑分成了英偉達(dá)的宣傳工具,然而事實(shí)是英特爾、谷歌等同樣重視AI的公司也將其視為一個(gè)公平的基準(zhǔn)測(cè)試,而且MLPerf還有同行評(píng)審環(huán)節(jié),進(jìn)一步驗(yàn)證測(cè)試結(jié)果。從以上結(jié)果來看,AI訓(xùn)練硬件上的創(chuàng)新仍未停止,無論是GPU、TPU還是IPU都在推陳出新,但跑分結(jié)果并不代表任何用例都能達(dá)到高性能,還需要廠商自己去調(diào)校模型和軟件才能達(dá)成最好的成績(jī)。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39944

    瀏覽量

    301572
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4091

    瀏覽量

    99255
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    中國(guó)AI芯片市場(chǎng):華為將占半壁江山,英偉達(dá)跌落,這家第二

    2026年華為將占據(jù)中國(guó)AI芯片市場(chǎng)50%的份額,成為該領(lǐng)域的絕對(duì)領(lǐng)導(dǎo)者。 ? 目前,英偉達(dá)(NVIDIA)以39%的市場(chǎng)份額位居中國(guó)AI芯片市場(chǎng)首位,華為以相近的份額緊隨其后。 ?
    的頭像 發(fā)表于 12-07 11:04 ?9406次閱讀
    中國(guó)<b class='flag-5'>AI</b>芯片市場(chǎng):華為將占半壁江山,<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>跌落,這家第二

    套現(xiàn)413億!軟銀清倉英偉達(dá),AI硬件泡沫破裂?

    )。 ? 這也并非軟銀首次減持英偉達(dá),從2017年以40億美元購買英偉達(dá)近5%股份,成為其最大股東之一,不過隨后分批賣出了英偉
    的頭像 發(fā)表于 11-13 09:19 ?5752次閱讀

    AI推理需求井噴!英偉達(dá)Q1營(yíng)收大漲,H20禁售難擋增長(zhǎng)步伐

    電子發(fā)燒友原創(chuàng) 章鷹 在中美科技企業(yè)爭(zhēng)奪人工智能高地的競(jìng)爭(zhēng)中,處于第一方陣的美國(guó)AI芯片公司英偉達(dá)公司最新交出了讓市場(chǎng)滿意的答卷。 5月28日,英偉
    的頭像 發(fā)表于 05-31 01:13 ?8232次閱讀
    <b class='flag-5'>AI</b>推理需求井噴!<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>Q1營(yíng)收大漲,H20禁售難擋增長(zhǎng)步伐

    企業(yè)級(jí)AI Agent王炸! 英偉達(dá)GTC將開源 NemoClaw

    消息人士透露,英偉達(dá)計(jì)劃在下周在美國(guó)圣荷西舉行的年度開發(fā)者大會(huì)前后正式公布 NemoClaw。據(jù)知情人士向 WIRED 透露,該平臺(tái)允許企業(yè)部署 AI 代理為內(nèi)部團(tuán)隊(duì)執(zhí)行任務(wù),且不限于使用英偉
    的頭像 發(fā)表于 03-10 11:35 ?7934次閱讀
    企業(yè)級(jí)<b class='flag-5'>AI</b> Agent王炸! <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>GTC將開源 NemoClaw

    英偉達(dá)電話會(huì)看Agentic AI推理與FPGA價(jià)值

    2026年2月,英偉達(dá)發(fā)布2026財(cái)年Q4財(cái)報(bào):營(yíng)收681億美元,同比增長(zhǎng)73%,數(shù)據(jù)中心業(yè)務(wù)增長(zhǎng)75%——預(yù)期中的預(yù)期。更值得關(guān)注的,是電話會(huì)中反復(fù)出現(xiàn)的幾個(gè)關(guān)鍵詞:Agentic AI
    的頭像 發(fā)表于 03-04 17:07 ?1082次閱讀
    從<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>電話會(huì)看Agentic <b class='flag-5'>AI</b>推理與FPGA價(jià)值

    羅德與施瓦茨攜手英偉達(dá)推進(jìn)基于數(shù)字孿生技術(shù)的AI-RAN測(cè)試

    羅德與施瓦茨(以下簡(jiǎn)稱“R&S”)與英偉達(dá)持續(xù)深化合作,共同推動(dòng)面向5G-Advanced與6G的AI-RAN技術(shù)創(chuàng)新。雙方將于2026年巴塞羅那世界移動(dòng)通信大會(huì)(以下簡(jiǎn)稱“MWC 2026
    的頭像 發(fā)表于 03-03 13:45 ?407次閱讀
    羅德與施瓦茨攜手<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>推進(jìn)基于數(shù)字孿生技術(shù)的<b class='flag-5'>AI</b>-RAN測(cè)試

    英偉達(dá)重磅出手!AI 推理存儲(chǔ)全面覺醒

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)近日,有消息稱,英偉達(dá)將以大約200億美元收購人工智能芯片初創(chuàng)公司Groq,這將是英偉達(dá)迄今為止規(guī)模最大的一筆收購。但
    的頭像 發(fā)表于 12-26 08:44 ?1.2w次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>重磅出手!<b class='flag-5'>AI</b> 推理存儲(chǔ)全面覺醒

    黃仁勛:英偉達(dá)AI芯片訂單排到2026年 英偉達(dá)上季營(yíng)收加速增長(zhǎng)62%再預(yù)期

    AI芯片總龍頭英偉達(dá)的財(cái)報(bào)終于帶來了驚喜;英偉達(dá)公司發(fā)布財(cái)報(bào)數(shù)據(jù)顯示,上季營(yíng)收加速增長(zhǎng)62%;再
    的頭像 發(fā)表于 11-20 11:36 ?1274次閱讀

    NVIDIA新聞:英偉達(dá)10億美元入股諾基亞 英偉達(dá)推出全新量子設(shè)備

    給大家分享一些NVIDIA新聞: 英偉達(dá)10億美元入股諾基亞 在當(dāng)?shù)貢r(shí)間10月28日,英偉達(dá)正式宣布將以10億美元入股諾基亞;據(jù)悉英偉
    的頭像 發(fā)表于 10-29 17:12 ?1736次閱讀

    施耐德電氣與英偉達(dá)深化合作

    近日,施耐德電氣宣布與英偉達(dá)深化合作,旨在滿足市場(chǎng)對(duì)可持續(xù)、AI就緒基礎(chǔ)設(shè)施日益增長(zhǎng)的需求。
    的頭像 發(fā)表于 06-24 15:02 ?1253次閱讀

    英偉達(dá)AI人才,去了華為

    電子發(fā)燒友網(wǎng)綜合報(bào)道 近日,英偉達(dá)首席科學(xué)家比爾·戴利(Bill Dally)表示,美國(guó)對(duì)中國(guó)實(shí)施的人工智能出口管制禁令,讓中國(guó)獲得很大的發(fā)展空間,過去替英偉達(dá)撰寫程序的中國(guó)人工智能研
    的頭像 發(fā)表于 06-06 00:05 ?7345次閱讀

    英偉達(dá)、高通布局AI投資版圖,這些明星企業(yè)被收入囊中!

    電子發(fā)燒友原創(chuàng) 章鷹 今年以來,AI界新秀DeepSeek帶來的大模型平權(quán)推動(dòng)AI應(yīng)用,云計(jì)算市場(chǎng)景氣度上行,推動(dòng)資本開支增長(zhǎng)。對(duì)于DeepSeek的橫空出世,英偉達(dá)CEO黃仁勛表示,
    的頭像 發(fā)表于 03-25 09:22 ?2122次閱讀

    IBM攜手英偉達(dá)AI數(shù)據(jù)平臺(tái)推動(dòng)企業(yè)級(jí)AI創(chuàng)新

    近日,IBM(紐約證券交易所:IBM)宣布與英偉達(dá)(納斯達(dá)克股票代碼:NVDA)開展全新合作,雙方將基于英偉達(dá) AI 數(shù)據(jù)平臺(tái)參考架構(gòu)(re
    發(fā)表于 03-24 19:20 ?520次閱讀

    英偉達(dá)GTC25亮點(diǎn):NVIDIA Blackwell Ultra 開啟 AI 推理新時(shí)代

    英偉達(dá)GTC25亮點(diǎn):NVIDIA Blackwell Ultra 開啟 AI 推理新時(shí)代
    的頭像 發(fā)表于 03-20 15:35 ?1591次閱讀