91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AMD甩出最強(qiáng)AI芯片 單個(gè)GPU跑大模型

jf_GctfwYN7 ? 來源:芯東西 ? 2023-06-20 10:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

專為生成式AI設(shè)計(jì)的GPU:HBM密度是英偉達(dá)H100的2.4倍,帶寬是英偉達(dá)H100的1.6倍。

英偉達(dá)的頭號(hào)勁敵AMD,終于放出了令人期待已久的AI大招。

2014年,蘇姿豐成為AMD CEO時(shí),這家芯片企業(yè)正瀕臨生存危機(jī),裁員約1/4,股價(jià)徘徊在2美元。隨后在蘇姿豐的掌舵之下,AMD完成了漂亮的轉(zhuǎn)身,9年來股價(jià)飆升近30倍,對(duì)英偉達(dá)和英特爾兩家頂級(jí)芯片巨頭形成了制衡。 隨著生成式AI颶風(fēng)席卷全球,英偉達(dá)GPU被各家大廠爭相搶購,焦點(diǎn)很快轉(zhuǎn)移到AMD身上——AMD能否生產(chǎn)出足夠強(qiáng)大的AI芯片來打破英偉達(dá)近乎壟斷的市場地位,抓住新一波AI浪潮? 今日,AMD交出階段性答卷。

在展示下一代AI芯片MI300X加速器時(shí),蘇姿豐滿面笑容地說:“我愛這顆芯片”。 MI300X是一個(gè)純GPU版本,采用AMD CDNA 3技術(shù),使用多達(dá)192 GB的HBM3高帶寬內(nèi)存來加速大型語言模型和生成式AI計(jì)算。 AMD主要客戶將在第三季度開始試用MI300X,第四季度開始全面生產(chǎn)。另一種型號(hào)Instinct MI300A現(xiàn)在正在向客戶發(fā)售。 蘇姿豐說,人工智能是AMD“最大、最具戰(zhàn)略意義的長期增長機(jī)會(huì)”。 現(xiàn)場,AMD與明星AI獨(dú)角獸企業(yè)Hugging Face宣布了一項(xiàng)新的合作伙伴關(guān)系,為AMD的CPU、GPU和其他AI硬件優(yōu)化他們的模型。

除了AI芯片外,AMD還推出專為云計(jì)算和超大規(guī)模用戶設(shè)計(jì)的全新EPYC服務(wù)器處理器,代號(hào)為Bergamo,每個(gè)插槽最多包含128個(gè)內(nèi)核,并針對(duì)各種容器化工作負(fù)載進(jìn)行了優(yōu)化。 亞馬遜旗下云計(jì)算部門AWS、甲骨文云、Meta、微軟Azure的高管均來到現(xiàn)場,分享在其數(shù)據(jù)中心使用AMD芯片及軟件的感受。

01. 加速生成式AI: 192GB HBM3,單個(gè)GPU跑大模型

此前,AMD Instinct GPU已經(jīng)被許多世界上最快的超級(jí)計(jì)算機(jī)采用。

MI300X加速器是AMD Instinct MI300系列的新成員,提供一個(gè)僅有GPU配置的芯片版本。

MI300X及其CDNA架構(gòu)專為大型語言模型和其他先進(jìn)AI模型而設(shè)計(jì),將12個(gè)5nm chiplets封裝在一起,共有1530億晶體管。

這款全新AI芯片舍棄了APU的24個(gè)Zen內(nèi)核和I/O芯片,轉(zhuǎn)而采用更多的CDNA 3 GPU和更大的192GB HBM3,提供5.2 TB/s的內(nèi)存帶寬和896GB/s的無限帶寬。

MI300X的HBM密度是英偉達(dá)H100的2.4倍,帶寬是英偉達(dá)H100的1.6倍,這意味著AMD可以運(yùn)行比英偉達(dá)芯片更大的模型。

AMD演示了在單個(gè)MI300X GPU上運(yùn)行擁有400億個(gè)參數(shù)的Falcon-40B大型語言模型,讓它寫了一首關(guān)于舊金山的詩。

“模型尺寸變得越來越大,你需要多個(gè)GPU來運(yùn)行最新的大型語言模型,”蘇姿豐說,隨著AMD芯片上內(nèi)存增加,開發(fā)者將不需要那么多GPU。

另一款MI300A被蘇姿豐稱作“面向AI和高性能計(jì)算的全球首款A(yù)PU加速器”,將多個(gè)CPU、GPU和高帶寬內(nèi)存封在一起,在13個(gè)chiplets上擁有1460億顆晶體管。

MI300A采用5nm和6nm制程、CDNA 3 GPU架構(gòu),搭配24個(gè)Zen 4核心、128GB HBM3,相比MI250提供了8倍以上的性能和5倍以上的效率。 AMD還公布了一種AMD Infinity架構(gòu)。該架構(gòu)將8個(gè) MI300X加速器連接在一個(gè)考慮了AI推理和訓(xùn)練的標(biāo)準(zhǔn)系統(tǒng)中,提供共1.5TB HBM3內(nèi)存。

據(jù)臺(tái)媒報(bào)道,AMD的Instinct MI300系列以及英偉達(dá)的H100/H800系列GPU都在采用臺(tái)積電先進(jìn)的后端3D封裝方法CoWoS,導(dǎo)致臺(tái)積電CoWoS產(chǎn)能短缺將持續(xù)存在。臺(tái)積電目前有能力每月處理大約8000片CoWoS晶圓,其中英偉達(dá)和AMD合計(jì)占了大約70%到80%。

此外,英偉達(dá)近年備受開發(fā)者偏愛的一大關(guān)鍵護(hù)城河是CUDA軟件。AMD 總裁Victor Peng也展示了AMD在開發(fā)軟件生態(tài)方面所做的努力。 AMD計(jì)劃在AI軟件生態(tài)系統(tǒng)開發(fā)中采用“開放(Open)、成熟(Proven)、就緒(Ready)”的理念。

AMD的ROCm是一套完整的庫和工具,用于優(yōu)化AI軟件棧。不同于CUDA,這是一個(gè)開放的平臺(tái)。

AMD還分享了PyTorch與ROCm的合作。新的PyTorch 2.0的速度幾乎是之前版本的兩倍。AMD是PyTorch基金會(huì)的創(chuàng)始成員之一。

AMD正在不斷優(yōu)化ROCm。Victor Peng說:“雖然這是一段旅程,但我們?cè)跇?gòu)建可與模型、庫、框架和工具的開放生態(tài)系統(tǒng)協(xié)同工作的強(qiáng)大軟件棧方面取得了真正的巨大進(jìn)步。”

02. 云原生處理器Bergamo: 128核,256個(gè)線程,最高vCPU密度

再來看下AMD的數(shù)據(jù)中心CPU。 蘇姿豐首先分享了AMD EPYC處理器的進(jìn)展,特別是在全球范圍內(nèi)可用的云計(jì)算實(shí)例方面。

她強(qiáng)調(diào)說,AMD第四代EPYC Genoa處理器在云計(jì)算工作負(fù)載方面的性能是英特爾競品的1.8倍,在企業(yè)工作負(fù)載方面的性能提高到1.9倍。

絕大多數(shù)AI都在CPU上運(yùn)行,AMD稱,與英特爾至強(qiáng)8490H相比,第四代EPYC在性能上遙遙領(lǐng)先,性能優(yōu)勢高出1.9倍。

蘇姿豐說,云原生處理器以吞吐量為導(dǎo)向,需要最高的性能、可擴(kuò)展性、計(jì)算密度和能效。

新發(fā)布的Bergamo,便是云原生處理器市場的入口。

該芯片有820億顆晶體管,提供了最高的vCPU密度。

在大散熱器下,有一個(gè)表面看起來非常像以前的EPYC的芯片,跟與Rome或Milan一樣有中央I/O芯片和8個(gè)核心復(fù)合芯片(CCD)。

Bergamo的每個(gè)插槽有多達(dá)128個(gè)核心、256個(gè)線程,分布在8個(gè)CCD上,每個(gè)CCD的核心數(shù)量是Genoa 16個(gè)核心的兩倍,采用比標(biāo)準(zhǔn)Zen 4內(nèi)核提供更高密度的全新Zen 4c核心設(shè)計(jì),并支持一致的x86 ISA。

“Zen 4c針對(duì)性能和功耗的最佳平衡點(diǎn)進(jìn)行了優(yōu)化,這為我們提供了更好的密度和能效,”蘇姿豐在演講中談道,“結(jié)果設(shè)計(jì)面積縮小了35%,每瓦性能顯著提高?!?/p>

Bergamo現(xiàn)在正在向AMD的云客戶發(fā)貨。AMD還分享了第四代EPYC 9754與英特爾至強(qiáng)8490H的性能、密度和能效和對(duì)比:

除了Bergamo的新核心和Chiplet架構(gòu)之外,該處理器與Genoa有很多共同之處,包括支持12通道DDR5內(nèi)存、最新PCIe 5.0、單插槽或雙插槽配置等等。 不過,多核心不再只是AMD處理器獨(dú)有的特色。

不久之前,數(shù)據(jù)中心處理器新起之秀Ampere Computing剛推出擁有多達(dá)192個(gè)單線程Ampere核心的Ampere One系列處理器。

英特爾也計(jì)劃在2024年初推出內(nèi)核優(yōu)化的至強(qiáng)處理器Sierra Forest,將內(nèi)置144個(gè)高效能核心。 AMD還展示了其最新的緩存堆疊X芯片,代號(hào)為Genoa-X,現(xiàn)已上市。

該芯片針對(duì)高性能計(jì)算工作負(fù)載,包括計(jì)算流體動(dòng)力學(xué)、電子設(shè)計(jì)自動(dòng)化、有限元分析、地震層析成像及其他帶寬敏感型工作負(fù)載,這些工作負(fù)載受益于大量共享緩存。

Genoa-X CPU基于AMD的標(biāo)準(zhǔn)Genoa平臺(tái),采用AMD 3D V-Cache技術(shù),通過在每個(gè)CCD上垂直堆疊SRAM模塊來提高可用的L3緩存。

該芯片可提供多達(dá)96個(gè)內(nèi)核和總計(jì)1.1GB的L3高速緩存,每個(gè)CCD上堆疊了一個(gè)64MB SRAM塊。 據(jù)AMD披露的數(shù)據(jù),在各種計(jì)算流體動(dòng)力學(xué)和有限元分析工作負(fù)載方面,與英特爾最高規(guī)格的60核Sapphire Rapids至強(qiáng)相比,Genoa-X緩存提升的性能提高到2.2倍2.9倍。

03. 即將推出全新DPU

最后,AMD簡要介紹了其網(wǎng)絡(luò)基礎(chǔ)設(shè)施。 去年AMD以19億美元收購Pensando,進(jìn)入DPU賽道。AMD解釋了如何使用其DPU來減少數(shù)據(jù)中心的網(wǎng)絡(luò)開銷。

AMD將其P4 DPU架構(gòu)稱作“世界上最智能的DPU”,并稱其Pensando SmartNIC是新數(shù)據(jù)中心架構(gòu)不可或缺的一部分。

AMD還在現(xiàn)場展示了與Aruba Networks共同開發(fā)的智能交換機(jī)。AMD計(jì)劃將P4 DPU卸載集成到網(wǎng)絡(luò)交換機(jī)本身,從而提供機(jī)架級(jí)服務(wù)。

AMD最新的DPU旨在從CPU卸載網(wǎng)絡(luò)、安全和虛擬化任務(wù),與當(dāng)前一代P4 DPU相比將提供更高的性能和能效。 其DPU已得到微軟、IBM云、甲骨文云等許多主要云提供商以及VMware虛擬機(jī)管理程序等軟件套件的支持。 AMD打算在今年晚些時(shí)候推出Giglio DPU之前擴(kuò)大兼容軟件列表,推出“芯片軟件開發(fā)工具包”,以便用戶更輕松地在其DPU上部署工作負(fù)載。

04. 結(jié)語:到2027年,數(shù)據(jù)中心AI加速器 市場規(guī)模將超過1500億美元

全球數(shù)據(jù)中心GPU和CPU的頭部企業(yè)英偉達(dá)和英特爾均在強(qiáng)調(diào)其加速AI的實(shí)力。作為這兩條賽道“萬年老二”的AMD,也在競相滿足對(duì)AI計(jì)算日益增長的需求,并通過推出適應(yīng)最新需求的數(shù)據(jù)中心GPU來挑戰(zhàn)英偉達(dá)在新興市場的主導(dǎo)地位。

生成式AI和大型語言模型的應(yīng)用熱潮正在將數(shù)據(jù)中心推向極限。截至目前,英偉達(dá)在提供處理這些工作負(fù)載所需的技術(shù)方面具有優(yōu)勢。根據(jù)市場調(diào)研機(jī)構(gòu)New Street Research的數(shù)據(jù),英偉達(dá)占據(jù)了可用于機(jī)器學(xué)習(xí)的GPU市場的95%。 “我們?nèi)蕴幱贏I生命周期的非常、非常早的階段,”蘇姿豐預(yù)測,到2027年,數(shù)據(jù)中心AI加速器總潛在市場規(guī)模將增長5倍,從今年的300億美元左右以超過50%的復(fù)合年增長率增長到2027年的1500億美元以上。

AMD并未透露兩款MI300新芯片的價(jià)格,但這可能會(huì)給英偉達(dá)帶來一定價(jià)格壓力,之前H100價(jià)格據(jù)傳高達(dá)30000美元乃至更多。




審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5690

    瀏覽量

    140034
  • 加速器
    +關(guān)注

    關(guān)注

    2

    文章

    839

    瀏覽量

    40111
  • 晶體管
    +關(guān)注

    關(guān)注

    78

    文章

    10396

    瀏覽量

    147882
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4091

    瀏覽量

    99251
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    2130

    瀏覽量

    36798

原文標(biāo)題:1530億顆晶體管!AMD甩出最強(qiáng)AI芯片,單個(gè)GPU跑大模型

文章出處:【微信號(hào):IC修真院,微信公眾號(hào):IC修真院】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AMD獲Meta千億美元芯片大單,AI芯片市場格局生變

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)近日,Meta與AMD共同宣布達(dá)成一項(xiàng)重磅的多年期協(xié)議。Meta將在其AI數(shù)據(jù)中心大規(guī)模部署6吉瓦的AMD GPU,并配套使用
    的頭像 發(fā)表于 02-26 09:19 ?5502次閱讀
    <b class='flag-5'>AMD</b>獲Meta千億美元<b class='flag-5'>芯片</b>大單,<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>市場格局生變

    Robotec.aiAMD Silo AI的合作實(shí)踐

    AMD Silo AI 正與領(lǐng)先的機(jī)器人應(yīng)用仿真平臺(tái)開發(fā)商 Robotec.ai 合作,優(yōu)化和擴(kuò)展基于 AMD GPU 和 ROCm 軟件堆
    的頭像 發(fā)表于 01-28 16:23 ?722次閱讀

    AMD 推出銳龍 AI 嵌入式處理器產(chǎn)品組合,為汽車、工業(yè)和物理 AI 領(lǐng)域提供 AI 驅(qū)動(dòng)的沉浸式體驗(yàn)

    新聞亮點(diǎn) ·?全新 AMD 銳龍 AI 嵌入式 P100 和 X100 系列處理器融入了高性能“Zen 5”CPU 核心、AMD RDNA 3.5 GPU
    的頭像 發(fā)表于 01-07 14:30 ?525次閱讀
    <b class='flag-5'>AMD</b> 推出銳龍 <b class='flag-5'>AI</b> 嵌入式處理器產(chǎn)品組合,為汽車、工業(yè)和物理 <b class='flag-5'>AI</b> 領(lǐng)域提供 <b class='flag-5'>AI</b> 驅(qū)動(dòng)的沉浸式體驗(yàn)

    AI硬件全景解析:CPU、GPU、NPU、TPU的差異化之路,一文看懂!?

    CPU作為“通用基石”,支撐所有設(shè)備的基礎(chǔ)運(yùn)行;GPU憑借并行算力,成為AI訓(xùn)練與圖形處理的“主力”;TPU在Google生態(tài)中深耕云端大模型訓(xùn)練;NPU則讓AI從“云端”走向“身邊”
    的頭像 發(fā)表于 12-17 17:13 ?1809次閱讀
    <b class='flag-5'>AI</b>硬件全景解析:CPU、<b class='flag-5'>GPU</b>、NPU、TPU的差異化之路,一文看懂!?

    AMD Vitis AI 5.1測試版發(fā)布

    AMD Vitis AI 5.1全新發(fā)布——新增了對(duì) AMD Versal AI Edge 系列神經(jīng)網(wǎng)絡(luò)處理單元 (NPU) 的支持。Vitis A
    的頭像 發(fā)表于 10-31 12:46 ?810次閱讀

    蘋果AI革命:M5芯片10核GPU、AI處理速度翻倍,Apple Glass在路上

    三款核心設(shè)備。這一場蘋果圍繞M5芯片AI硬件的革新,也成為蘋果邁進(jìn)AI時(shí)代以端側(cè)大模型和空間計(jì)算的又一成績。 ? ? 3nm+10核GPU
    的頭像 發(fā)表于 10-19 01:13 ?1.1w次閱讀
    蘋果<b class='flag-5'>AI</b>革命:M5<b class='flag-5'>芯片</b>10核<b class='flag-5'>GPU</b>、<b class='flag-5'>AI</b>處理速度翻倍,Apple Glass在路上

    AI模型的配置AI模型該怎么做?

    STM32可以AI,這個(gè)AI模型怎么搞,知識(shí)盲區(qū)
    發(fā)表于 10-14 07:14

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

    、分布式群體智能 1)物聯(lián)網(wǎng)AGI系統(tǒng) 優(yōu)勢: 組成部分: 2)分布式AI訓(xùn)練 7、發(fā)展重點(diǎn):基于強(qiáng)化學(xué)習(xí)的后訓(xùn)練與推理 8、超越大模型:神經(jīng)符號(hào)計(jì)算 三、AGI芯片的實(shí)現(xiàn) 1、技術(shù)需求 AI
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用

    流體芯片AI計(jì)算平臺(tái) ⑥基于AI的自主決策系統(tǒng) ⑦基于AI的自主學(xué)習(xí)系統(tǒng) 2、面臨的挑戰(zhàn) ①需要造就一個(gè)跨學(xué)科、全面性覆蓋的知識(shí)庫和科學(xué)基礎(chǔ)模型
    發(fā)表于 09-17 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+第二章 實(shí)現(xiàn)深度學(xué)習(xí)AI芯片的創(chuàng)新方法與架構(gòu)

    、Transformer 模型邊緣部署 3、智能手機(jī)AI芯片 3.1概述 智能手機(jī)中最大的一塊芯片就是應(yīng)用處理器(AP)。AP中集成了CPU、GPU
    發(fā)表于 09-12 17:30

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片的需求和挑戰(zhàn)

    的工作嗎? 從書中也了解到了AI芯片都有哪些?像CPU、GPU、FPGA、ASIC都是AI芯片。 其他的還是知道的,F(xiàn)PGA屬于
    發(fā)表于 09-12 16:07

    AI 芯片浪潮下,職場晉升新契機(jī)?

    職場、渴望在專業(yè)領(lǐng)域更進(jìn)一步的人來說,AI 芯片與職稱評(píng)審之間,實(shí)則有著千絲萬縷的聯(lián)系,為職業(yè)晉升開辟了新的路徑。 AI 芯片領(lǐng)域細(xì)分與職稱對(duì)應(yīng) 目前,
    發(fā)表于 08-19 08:58

    【書籍評(píng)測活動(dòng)NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》

    計(jì)算等類別AI芯片的及時(shí)、全面而富有遠(yuǎn)見的書?!?那么時(shí)至今日,這個(gè)世界發(fā)生了什么變化呢? 在這四年間,最重大的技術(shù)變革無疑就是大模型的橫空出世,人類的時(shí)間仿佛被裝上了加速器,從ChatGPT到
    發(fā)表于 07-28 13:54

    八天三次收購!AMD收購AI芯片制造商Untether AI團(tuán)隊(duì),刺激創(chuàng)新

    電子發(fā)燒友原創(chuàng) 章鷹 6月6日,美國芯片大廠AMD宣布收購加拿大AI推理芯片公司Untether AI。這是
    的頭像 發(fā)表于 06-08 07:01 ?6200次閱讀
    八天三次收購!<b class='flag-5'>AMD</b>收購<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>制造商Untether <b class='flag-5'>AI</b>團(tuán)隊(duì),刺激創(chuàng)新

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    科正將AI能力體系化并賦能終端生態(tài)。 大會(huì)上,聯(lián)發(fā)科定義了“智能體化用戶體驗(yàn)”的五大特征:主動(dòng)及時(shí)、知你懂你、互動(dòng)協(xié)作、學(xué)習(xí)進(jìn)化和專屬隱私信息守護(hù)。這五大特征需要跨越從芯片、模型、應(yīng)用、終端乃至整個(gè)
    發(fā)表于 04-13 19:52