91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

英偉達地位不保?BERT訓練吞吐量提升4.7倍

lPCU_elecfans ? 來源:電子發(fā)燒友網(wǎng) ? 作者:電子發(fā)燒友網(wǎng) ? 2022-07-06 11:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/周凱揚)推理和訓練作為AI/ML關鍵的一環(huán),無論是通用的GPU,還是專用的推理/訓練加速器,都想在各大流行模型和機器學習庫上跑出優(yōu)秀的成績,以展示自己的硬件實力。業(yè)界需要一個統(tǒng)一的跑分標準,為此,各大廠商在2018年根據(jù)業(yè)內指標聯(lián)合打造的MLPerf就承擔了這一重任。

不過隨著時間的推移,MLPerf幾乎已經成了英偉達一家獨大的跑分基準,這家GPU廠商憑借自己的產品幾乎統(tǒng)治著整個AI硬件市場。這不,近日公布的MLPerf Training 2.0,就將這些AI硬件公司和服務器廠商提交的具體AI訓練成績公布了出來,其中既有一些新晉成員,也有一些出人意料的結果。

谷歌的反超這次跑分結果中,最驚艷的還是谷歌的TPU v4系統(tǒng),谷歌憑借這一架構的系統(tǒng),在五個基準測試中都打破了性能記錄,平均訓練速度比第二名的英偉達A100系統(tǒng)快了1.42倍左右,哪怕是與自己在1.0測試下的成績相比,也提升了1.5倍。

能實現(xiàn)這樣的成績自然離不開谷歌自己的TPU芯片設計,谷歌的每個TPU v4 Pod都由4096個芯片組成,且?guī)捵龅搅?Tbps。除此之外,谷歌有著豐富的用例經驗,相較其他公司而言,谷歌是唯一一個在搜索和視頻領域都已經大規(guī)模普及AI/ML應用的。

00f1a358-fcb8-11ec-ba43-dac502259ad0.png

TPU v4與A100的對比 / 谷歌

不過谷歌與英偉達并不是直接競爭關系,他們對標的還是使用英偉達GPU系統(tǒng)的云服務公司,比如微軟的Azure,谷歌也為此特地做了成本對比。如上圖所示,在BERT模型的訓練中,4096個TPU v4芯片與Azure 4096個A100芯片對比,谷歌的方案可以節(jié)省35%,ResNet模型的訓練下更是可以節(jié)省近50%。

不過以上的成績在所有8項測試中也只是和英偉達平分秋色,而且隨著系統(tǒng)規(guī)模的不同,其結果或許會有更多的變化。再者,谷歌的TPU僅限于其自己的云服務,所以總的來說并不算一個通用方案,至少微軟和亞馬遜這樣的競爭對手肯定是用不上。

英偉達地位不保?除了谷歌之外,還取得了不錯的成績的就是英特爾旗下Habana Labs的Gaudi2訓練加速器。這款今年5月推出的處理器,從上一代的16nm換成了臺積電7nm,Tensor處理器內核的數(shù)量因此增加了兩倍,使其在ResNet-50的訓練吞吐量上實現(xiàn)了3倍提升,BERT的訓練吞吐量提升了4.7倍。

在與英偉達提交的A100-80GB GPU系統(tǒng)成績相比,Gaudi2在ResNet-50上的訓練時間縮短了36%;與戴爾提交的A100-40GB GPU系統(tǒng)成績相比,Gaudi2在BERT上的訓練時間縮短了45%。

從結果來看,已經有不少廠商的AI硬件已經可以在訓練上對標甚至超過英偉達的GPU生態(tài)了,但這并不代表全部機器學習訓練領域。比如在測試中,廠商是不需要將每個項目的測試結果都提交上去的。從這個角度來看,RetinaNet輕量型目標檢測、COCO重型目標檢測、語音識別數(shù)據(jù)集Librispeech和強化學習Minigo這幾個項目中,只有基于英偉達GPU的系統(tǒng)提交了成績。

不僅如此,如果你看所有提交成績的服務器和云服務公司來看,他們用到的CPU或是AMD的EPYC處理器,或是英特爾的Xeon處理器,但加速器卻是幾乎清一色的英偉達A100。這也證明了在百度、戴爾、H3C、浪潮和聯(lián)想這些廠商的眼中,英偉達的GPU依然是最具競爭力的那個。

不可小覷的軟件還有一點需要指出,那就是以上都是封閉組的成績,他們所用到的都是標準的機器學習庫,比如TensorFlow 2.8.0和Pytorch 22.04等。而開放組則不受此限制,可以用到他們自己定制的庫或優(yōu)化器,這一組中三星和Graphcore都根據(jù)不同的軟件配置提交了成績,但最亮眼的還是MosaicML。

01187fc8-fcb8-11ec-ba43-dac502259ad0.png

Composer在ResNet-50下的訓練時間對比 / MosaicML

這家公司所用的加速器硬件同樣是和諸多提交者一樣的英偉達A100-SXM-80GB GPU,但他們用到的是自己用Pytorch編寫的庫Composer。這家公司于今年4月推出了Composer,并聲稱可讓模型訓練速度提升2到4倍。在MLPerf Training 2.0的跑分中,使用MosaicML Composer的對比組在ResNet訓練速度上實現(xiàn)了近4.6倍的提升。不過Composer雖說支持任何模型,但這個提速的表現(xiàn)目前還是體現(xiàn)在ResNet上比較明顯,所以本次也并沒有提交其他模型下的成績。

考慮到英特爾等公司為了提升其軟件開發(fā)實力,已經在收購Codeplay這樣的軟件開發(fā)公司,MosaicML作為剛公開不久的初創(chuàng)公司,創(chuàng)始人又是英特爾的前AI實驗室骨干,如果能在未來展現(xiàn)出更優(yōu)秀的成績,說不定也會被英偉達這樣的公司看中。

結語英偉達常年在MLPerf上霸榜,也有不少人認為MLPerf跑分成了英偉達的宣傳工具,然而事實是英特爾、谷歌等同樣重視AI的公司也將其視為一個公平的基準測試,而且MLPerf還有同行評審環(huán)節(jié),進一步驗證測試結果。從以上結果來看,AI訓練硬件上的創(chuàng)新仍未停止,無論是GPU、TPU還是IPU都在推陳出新,但跑分結果并不代表任何用例都能達到高性能,還需要廠商自己去調校模型和軟件才能達成最好的成績。

原文標題:AI硬件反超英偉達?跑分來看尚不現(xiàn)實

文章出處:【微信公眾號:電子發(fā)燒友網(wǎng)】歡迎添加關注!文章轉載請注明出處。

審核編輯:彭靜
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6254

    瀏覽量

    111494
  • 機器學習
    +關注

    關注

    66

    文章

    8556

    瀏覽量

    137000
  • TPU
    TPU
    +關注

    關注

    0

    文章

    170

    瀏覽量

    21665
  • 英偉達
    +關注

    關注

    23

    文章

    4091

    瀏覽量

    99252

原文標題:AI硬件反超英偉達?跑分來看尚不現(xiàn)實

文章出處:【微信號:elecfans,微信公眾號:電子發(fā)燒友網(wǎng)】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    羅德與施瓦茨攜手瑞昱展示藍牙低功耗高數(shù)據(jù)吞吐量測試解決方案

    羅德與施瓦茨(以下簡稱“R&S”)與瑞昱半導體已成功驗證了業(yè)界首個針對即將推出的藍牙 低功耗高數(shù)據(jù)吞吐量(HDT)功能的測試解決方案。雙方將聯(lián)合在2026年巴塞羅那世界移動通信大會(以下簡稱
    的頭像 發(fā)表于 03-09 13:57 ?243次閱讀
    羅德與施瓦茨攜手瑞昱展示藍牙低功耗高數(shù)據(jù)<b class='flag-5'>吞吐量</b>測試解決方案

    麥格納宣布擴大與英偉的戰(zhàn)略合作

    麥格納宣布擴大與英偉的戰(zhàn)略合作,為整車廠基于英偉DRIVE Hyperion平臺的項目落地提供支持。
    的頭像 發(fā)表于 01-09 12:59 ?375次閱讀

    用“分區(qū)”來面對超大數(shù)據(jù)集和超大吞吐量

    分區(qū)(partitions) 也被稱為 分片(sharding),通常采用對數(shù)據(jù)進行分區(qū)的方式來增加系統(tǒng)的 可伸縮性,以此來面對非常大的數(shù)據(jù)集或非常高的吞吐量,避免出現(xiàn)熱點。
    的頭像 發(fā)表于 12-30 16:40 ?214次閱讀
    用“分區(qū)”來面對超大數(shù)據(jù)集和超大<b class='flag-5'>吞吐量</b>

    KIOXIA推出全新開源軟件,提升RocksDB中閃存存儲的壽命和性能

    放大系數(shù)(WAF)降低了約46%,吞吐量提升至MDRAID性能的8.221。在2驅動器鏡像配置中,WAF降至約三分之一,吞吐量則達到MDRAID的1.45
    的頭像 發(fā)表于 10-13 11:15 ?404次閱讀

    NVIDIA推出多語種語音AI開放數(shù)據(jù)集與模型

    新發(fā)布的 Granary 數(shù)據(jù)集包含約 100 萬小時音頻,可用于訓練高精度、高吞吐量的 AI 音頻轉錄與翻譯模型。
    的頭像 發(fā)表于 09-23 15:34 ?981次閱讀

    今日看點:蘋果認證中國快充品牌遭美調查;英偉擬向OpenAI投資最高1000億美元

    系統(tǒng)建設并部署至少10吉瓦的人工智能(AI)數(shù)據(jù)中心,用于訓練和運行下一代模型。這一耗電量相當于800萬戶美國家庭的用電量。 英偉CEO黃仁勛曾表示,10吉瓦相當于400萬至500萬塊圖形處理器(GPU),約等于
    發(fā)表于 09-23 10:09 ?461次閱讀

    使用羅德與施瓦茨CMX500的吞吐量應用層測試方案

    5G NR(New Radio)吞吐量應用層測試是評估5G網(wǎng)絡性能的一個重要方面,它主要關注的是在實際應用條件下,用戶能夠體驗到的數(shù)據(jù)傳輸速率。這種測試通常包括了對下行鏈路和上行鏈路的吞吐量進行測量,以確保網(wǎng)絡可以滿足各種應用場景的需求,比如高清視頻流、虛擬現(xiàn)實、增強現(xiàn)實
    的頭像 發(fā)表于 09-02 13:56 ?7970次閱讀
    使用羅德與施瓦茨CMX500的<b class='flag-5'>吞吐量</b>應用層測試方案

    2天40%漲停!深圳傳感器公司豪恩汽電 與英偉合作

    的飛躍。與上一代Jetson Orin相比,Jetson Thor 的 AI 計算性能提升多達 7.5 ,能效提升多達3.5 ,CPU性能提升
    的頭像 發(fā)表于 08-28 19:20 ?3674次閱讀
    2天40%漲停!深圳傳感器公司豪恩汽電 與<b class='flag-5'>英偉</b><b class='flag-5'>達</b>合作

    CY7C65211 作為 SPI 從機模式工作時每秒的最大吞吐量是多少?

    CY7C65211 作為 SPI 從機模式工作時每秒的最大吞吐量是多少? 有實際的測試數(shù)據(jù)嗎?
    發(fā)表于 05-27 07:38

    如何在Visual Studio 2022中運行FX3吞吐量基準測試工具?

    我正在嘗試運行 John Hyde 的書“SuperSpeed by Design”中的 FX3 吞吐量基準測試工具。 但是,我面臨一些困難,希望得到任何指導。 具體來說,我正在使用 Visual
    發(fā)表于 05-13 08:05

    FX3進行讀或寫操作時CS信號拉低,在讀或寫完成后CS置高,對吞吐量有沒有影響?

    從盡可能提高吞吐量的角度看,在進行讀或寫操作時CS信號拉低,在讀或寫完成后CS置高,對吞吐量有沒有影響,還是應該CS一直拉低比較好。
    發(fā)表于 05-08 07:13

    特朗普要叫停英偉對華特供版 英偉H20出口限制 或損失55億美元

    是“中國特供版”人工智能芯片;是英偉公司為符合美國出口規(guī)定專門為中國市場開發(fā)的定制芯片,H20芯片在訓練AI模型方面不如英偉其他芯片速度
    的頭像 發(fā)表于 04-16 16:59 ?2108次閱讀

    新思科技攜手英偉加速芯片設計,提升芯片電子設計自動化效率

    宣布在英偉 Grace Blackwell 平臺上實現(xiàn)高達 30 的預期性能提升,加速下一代半導體的電路仿真 ? 摘要: 在今年GTC主題演講中,新思科技作為生態(tài)系統(tǒng)的一部分,展示
    發(fā)表于 03-19 17:59 ?508次閱讀

    新思科技亮相英偉GTC 2025大會

    為了實現(xiàn)這一速度提升,新思科技在GTC全球AI大會上宣布,正在使用英偉 CUDA-X庫優(yōu)化其下一代半導體開發(fā)解決方案。公司還在擴大對英偉
    的頭像 發(fā)表于 03-19 17:53 ?1327次閱讀