91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英特爾Gaudi 3 AI芯片:5nm工藝設(shè)計,訓(xùn)練推理皆強(qiáng)

微云疏影 ? 來源:綜合整理 ? 作者:綜合整理 ? 2024-04-10 11:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

4 月 9 日,英特爾在 Vision 2024 大會上公布最新一代 Gaudi 3 AI 芯片并宣布將于同年第三季度批量上市。相較于英偉達(dá) H100,Gaudi 3 訓(xùn)練性能提升 170%,推理能力增幅 50%,效率提升 40%,而成本顯著降低。

此外,英特爾在發(fā)布會上還宣布更改旗下數(shù)據(jù)中心CPU產(chǎn)品名稱:原“Granite Rapids”和“Sierra Forest”將更名為“Xeon 6”系列。新品預(yù)計今年發(fā)售,并支持性能提升后的標(biāo)準(zhǔn)化 MXFP4 數(shù)據(jù)格式。

除此之外,英特爾正研發(fā)適用于以太網(wǎng)的 AI NIC ASIC 及 AI NIC 小芯片。這兩款產(chǎn)品尤其適合于其未來的 XPU 和 Gaudi 3 處理器,有望通過英特爾代工廠對外銷售。有關(guān)網(wǎng)絡(luò)產(chǎn)品的詳細(xì)信息尚未公開。

據(jù)悉,Gaudi 3 采用 5nm 制程,F(xiàn)P8性能較前代翻番,BF16性能增大至四倍,網(wǎng)絡(luò)帶寬增加一倍,內(nèi)存帶寬擴(kuò)大約 1.5 倍,能夠提供Mezz卡、板載以及PCIe三種形式。

Gaudi 3擁有64個第五代張量處理核心和8個矩陣計算引擎,并配備128GBHBM內(nèi)存和96MBSRAM。設(shè)計有24條200GBERoCE標(biāo)準(zhǔn)以太網(wǎng)總線和最多16條PCIe5.0總線。

在板載版,聚類產(chǎn)品型號為HLB-325。由八塊Gaudi 3 Mezz卡組成的模塊提供約14.6PFLOPS的FP8性能,極大的帶寬速率達(dá)29.6TB/s的HBM2e內(nèi)存,64個線性計算引擎,192條200GBE網(wǎng)絡(luò)總線和上述所有。

在PCIe版本,型號為HL-338的卡具有單卡達(dá)1835TFLOPS的FP8峰值性能,128GBHBM2e內(nèi)存,8個線性計算引擎,24條200GBE網(wǎng)絡(luò)總線,功率消耗600W,占兩卡槽的整體空間高度。

一個由8個Gaudi 3 AI加速器構(gòu)成的節(jié)點可提供14.7PF FP8計算性能,128GB的內(nèi)存,8.4TB/s的網(wǎng)絡(luò)讀寫速度,而64個節(jié)點的集群(512個AI加速器)能提供的最大計算性能為7.52EF FP8,525.3TB的內(nèi)存和614TB/s的網(wǎng)絡(luò)讀寫速度。更高的,1024個節(jié)點的集群可以達(dá)到15EF FP8的計算性能,1PB的內(nèi)存和1,229PB每秒的網(wǎng)絡(luò)讀寫速度。

在實際測試中,與英偉達(dá)的主流產(chǎn)品H100比較,Gaudi 3在相同節(jié)點數(shù)時的平均訓(xùn)練時間要高出約1.7倍,LLAMA2 70億的模型參數(shù)的情況下超過了H100的1.5倍,對于LLAMA2 130億參數(shù)的模型,Gaudi 3在最高時也超過了H100的1.7倍,同樣,GPT 3已達(dá)到1750億參數(shù),且Gaudi 3在推理速度和能效表現(xiàn)上均優(yōu)

英特爾近日發(fā)布了其下一代 GPU 路線規(guī)劃——Gaudi 3,包括風(fēng)冷和液冷版本,計劃于明年三至四季度相繼批量交付。Gaudi 3 由戴爾、惠普、聯(lián)想及超微等眾多合作伙伴負(fù)責(zé)生產(chǎn)和銷售,據(jù)稱下半年有望登陸英特爾自家的云服務(wù)——Developer Cloud。除了 Gaudi 3,英特爾還向我們展示了公司在各層面的 AI 產(chǎn)品線的最新進(jìn)展。

為了更好地優(yōu)化 AI 的表現(xiàn),英特爾發(fā)布了全新的 Xeon 6 處理器,主要用于大模型的訓(xùn)練。Xeon 6 采用了高效能的 E-core 核心和高性能的 P-core 核心,其中 E-core 核心代號為 Sierra Forest,能效較前一代提升了整整兩倍半,而 P-core 則代號為 Granite Rapids,支持 MXFP4。值得一提的是,比起前一代 Xeon 處理器,Xeon 6 的機(jī)身架構(gòu)擴(kuò)展了整整 2.7 倍,已經(jīng)開始被許多用戶用來升級老舊設(shè)備,以此達(dá)到節(jié)能減排的目的。

值得一提的還有物聯(lián)網(wǎng)的應(yīng)用。今年,英特爾預(yù)計將共售出超過 4000 萬臺基于酷睿 Ultra 處理器的 AI PC,除了消費級市場,AI 也正逐漸走進(jìn)人們生活的方方面面,如工業(yè)制造、醫(yī)療健康等領(lǐng)域。據(jù)悉,該公司將于年內(nèi)發(fā)布一系列新的邊緣芯片,這些產(chǎn)品將涵蓋酷睿 Ultra、酷睿、凌動處理器和 Arc GPU,旨在覆蓋多個不同行業(yè)的應(yīng)用需求。

另外,英特爾還透露計劃此次與Ultra Ethernet Consortium合作,推出一種名為 AI Ethernet 的網(wǎng)絡(luò)解決方案,專門解決海量數(shù)據(jù)遷移中的網(wǎng)絡(luò)擁堵問題。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10303

    瀏覽量

    180574
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11287

    瀏覽量

    225175
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    18

    文章

    5660

    瀏覽量

    75050
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    英特爾炮轟,AMD回?fù)?!掌機(jī)市場芯片之爭

    英特爾推出的才是專為掌機(jī)設(shè)計的最新處理器,信心源于新一代旗艦產(chǎn)品Panther Lake處理器。該處理器是首款基于英特爾18A工藝節(jié)點制造的消費級SoC,在“每瓦性能”數(shù)據(jù)上表現(xiàn)優(yōu)異,結(jié)合XeSS
    的頭像 發(fā)表于 01-12 09:09 ?5035次閱讀

    超越臺積電?英特爾首個18A工藝芯片邁向大規(guī)模量產(chǎn)

    Lake作為英特爾首款基于Intel 18A制程工藝打造的產(chǎn)品,意義非凡。這一制程是英特爾研發(fā)并制造的最先進(jìn)半導(dǎo)體工藝,標(biāo)志著英特爾在技術(shù)
    的頭像 發(fā)表于 10-11 08:14 ?9136次閱讀
    超越臺積電?<b class='flag-5'>英特爾</b>首個18A<b class='flag-5'>工藝</b><b class='flag-5'>芯片</b>邁向大規(guī)模量產(chǎn)

    歐洲之光!5nm,3200 TFLOPS AI推理芯片即將量產(chǎn)

    數(shù)據(jù)中心AI推理處理器的按時上市。通過此次合作,GUC展示了其在復(fù)雜芯片組架構(gòu)設(shè)計以及利用2.5D先進(jìn)封裝技術(shù)實現(xiàn)HBM3
    的頭像 發(fā)表于 11-29 13:52 ?5917次閱讀
    歐洲之光!<b class='flag-5'>5nm</b>,3200 TFLOPS <b class='flag-5'>AI</b><b class='flag-5'>推理</b><b class='flag-5'>芯片</b>即將量產(chǎn)

    發(fā)力圖形工作站和AI推理市場,英特爾大顯存GPU亮相灣芯展

    英特爾發(fā)布了面向?qū)I(yè)的銳炫Pro B50和B60。這兩款顯卡比較RTX2000和5660Ti,有哪些性能上的優(yōu)勢?在支持AI推理工作站和大模型部署上,B60有哪些獨到之處?10月16日,在深圳舉行的灣區(qū)半導(dǎo)體大會上,
    的頭像 發(fā)表于 10-22 13:40 ?1.1w次閱讀
    發(fā)力圖形工作站和<b class='flag-5'>AI</b><b class='flag-5'>推理</b>市場,<b class='flag-5'>英特爾</b>大顯存GPU亮相灣芯展

    18A工藝大單!英特爾將代工微軟AI芯片Maia 2

    電子發(fā)燒友網(wǎng)綜合報道 據(jù)科技媒體SemiAccurate報道,微軟已正式向英特爾晶圓代工(Intel Foundry)下達(dá)訂單,委托其使用先進(jìn)的18A工藝節(jié)點生產(chǎn)下一代AI加速器Maia 2
    的頭像 發(fā)表于 10-21 08:52 ?5641次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+半導(dǎo)體芯片產(chǎn)業(yè)的前沿技術(shù)

    MI300,是AMD首款數(shù)據(jù)中心HPC級的APU ③英特爾數(shù)據(jù)中心GPU Max系列 3)新粒技術(shù)的主要使用場景 4)IP即芯粒 IP即芯粒旨在以芯粒實現(xiàn)特殊功能IP的即插即用,解決5nm、
    發(fā)表于 09-15 14:50

    英特爾Gaudi 2E AI加速器為DeepSeek-V3.1提供加速支持

    英特爾? Gaudi 2EAI加速器現(xiàn)已為DeepSeek-V3.1提供深度優(yōu)化支持。憑借出色的性能和成本效益,英特爾Gaudi 2E以更低的投入、更高的效率,實現(xiàn)從模型
    的頭像 發(fā)表于 08-26 19:18 ?3052次閱讀
    <b class='flag-5'>英特爾</b><b class='flag-5'>Gaudi</b> 2E <b class='flag-5'>AI</b>加速器為DeepSeek-V3.1提供加速支持

    4450億美元!Edge AI市場大爆發(fā),英特爾布局哪些AI SoC芯片?

    AI是邊緣計算和IoT增長的最大驅(qū)動力,預(yù)計到2030年,AI將成為全球邊緣市場的重要驅(qū)動力,市場規(guī)模有望達(dá)到4450億美元。英特爾在邊緣AI領(lǐng)域布局哪些
    的頭像 發(fā)表于 08-04 08:46 ?7118次閱讀
    4450億美元!Edge <b class='flag-5'>AI</b>市場大爆發(fā),<b class='flag-5'>英特爾</b>布局哪些<b class='flag-5'>AI</b> SoC<b class='flag-5'>芯片</b>?

    主控CPU全能選手,英特爾至強(qiáng)6助力AI系統(tǒng)高效運轉(zhuǎn)

    2025年3月,英偉達(dá)發(fā)布了DGX B300 AI加速計算平臺。2025年5月,英特爾發(fā)布了三款全新英特爾至強(qiáng)6性能核處理器,其中一款677
    的頭像 發(fā)表于 06-27 11:44 ?910次閱讀
    主控CPU全能選手,<b class='flag-5'>英特爾</b>至強(qiáng)6助力<b class='flag-5'>AI</b>系統(tǒng)高效運轉(zhuǎn)

    英特爾發(fā)布邊緣AI控制器與邊緣智算一體機(jī),創(chuàng)造“AI新視界”

    在2025北京機(jī)器視覺展覽會(VisionChina)以“AI 視界:英特爾推動智能制造革新浪潮”為主題的英特爾論壇中,英特爾與諾達(dá)佳聯(lián)合發(fā)布了 基于
    發(fā)表于 06-24 17:50 ?1520次閱讀
    <b class='flag-5'>英特爾</b>發(fā)布邊緣<b class='flag-5'>AI</b>控制器與邊緣智算一體機(jī),創(chuàng)造“<b class='flag-5'>AI</b>新視界”

    英特爾銳炫Pro B系列,邊緣AI的“智能引擎”

    2025年6月19日,上?!?在MWC 25上海期間,英特爾展示了一幅由英特爾銳炫? Pro B系列GPU所驅(qū)動的“實時響應(yīng)、安全高效、成本可控”的邊緣AI圖景。 英特爾客戶端計算事
    的頭像 發(fā)表于 06-20 17:32 ?912次閱讀
    <b class='flag-5'>英特爾</b>銳炫Pro B系列,邊緣<b class='flag-5'>AI</b>的“智能引擎”

    直擊Computex 2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    B60和英特爾銳炫Pro B50 GPU,AI加速器產(chǎn)品—英特爾Gaudi 3 AI加速器。
    的頭像 發(fā)表于 05-21 00:57 ?7517次閱讀
    直擊Computex 2025:<b class='flag-5'>英特爾</b>重磅發(fā)布新一代GPU,圖形和<b class='flag-5'>AI</b>性能躍升3.4倍

    直擊Computex2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    5月19日,在Computex 2025上,英特爾發(fā)布了最新全新圖形處理器(GPU)和AI加速器產(chǎn)品系列。包括全新英特爾銳炫? Pro B系列GPU——
    的頭像 發(fā)表于 05-20 12:27 ?5468次閱讀
    直擊Computex2025:<b class='flag-5'>英特爾</b>重磅發(fā)布新一代GPU,圖形和<b class='flag-5'>AI</b>性能躍升3.4倍

    英特爾發(fā)布全新GPU,AI和工作站迎來新選擇

    英特爾推出面向準(zhǔn)專業(yè)用戶和AI開發(fā)者的英特爾銳炫Pro GPU系列,發(fā)布英特爾? Gaudi 3
    發(fā)表于 05-20 11:03 ?1851次閱讀

    英特爾先進(jìn)封裝:助力AI芯片高效集成的技術(shù)力量

    ),以靈活性強(qiáng)、能效比高、成本經(jīng)濟(jì)的方式打造系統(tǒng)級芯片(SoC)。因此,越來越多的AI芯片廠商青睞這項技術(shù)。 英特爾自本世紀(jì)70年代起持續(xù)創(chuàng)
    的頭像 發(fā)表于 03-28 15:17 ?907次閱讀
    <b class='flag-5'>英特爾</b>先進(jìn)封裝:助力<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>高效集成的技術(shù)力量