91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英特爾推出AI加速器性價比產(chǎn)品Gaudi2

IT葡萄皮 ? 來源:IT葡萄皮 ? 2023-07-14 16:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

日前,英特爾面向中國市場發(fā)布了HabanaGaudi2深度學(xué)習(xí)加速卡器。

新的Gaudi2直接給到了24個Tensor處理核心(TPC),是上代產(chǎn)品的三倍;而在對大模型應(yīng)用至關(guān)重要的顯存方面,Gaudi2也大方的配置了96GBHBM2e,顯存帶寬直接達(dá)到了2.4TB/s。而在連接方式上,Gaudi2則采用了OCPOAM接口形式,可擴(kuò)展出21個100G以太網(wǎng)連接,并支持RoCE(RDMAover Converged Ethernet)v2。同時,Gaudi2還集成了多媒體處理器引擎和48MB片上SRAM作為高速緩存。

在系統(tǒng)層面,英特爾則提供能夠同時安裝8塊Gaudi2的夾層基板,同樣遵循OCP標(biāo)準(zhǔn),可擴(kuò)展出24個100GRoCE網(wǎng)絡(luò)接口。

性能更好的新選擇

Gaudi2搭載的96GBHBM顯存的確令人眼前一亮,但真正能夠影響用戶購買行為的仍舊似乎加速卡本身的計算性能。

在HuggingFace工程師RégisPierrard去年底進(jìn)行的Gaudi2測試中,Gaudi2不僅在與前代產(chǎn)品的對比中表現(xiàn)出了近乎線性的性能提升,更大幅超越了對標(biāo)的A100加速卡。

5261f29a-2220-11ee-962d-dac502259ad0.png

BERT預(yù)訓(xùn)練,8卡

Gaudi2使用bf16/fp32混合精度,A100使用fp16精度

526f3b26-2220-11ee-962d-dac502259ad0.png

StableDiffusion測試,單卡

從RégisPierrard使用IntelDeveloper Cloud進(jìn)行的兩輪測試中我們不難發(fā)現(xiàn),無論是在BERT這樣的大模型應(yīng)用中,還是在StableDiffusion這樣的“傳統(tǒng)”AIGC應(yīng)用中,Gaudi2的性能表現(xiàn)均相當(dāng)亮眼;相對于前代產(chǎn)品展現(xiàn)出了至少3倍的性能優(yōu)勢(Gaudi2的TPC數(shù)量是前代的3倍),且比對標(biāo)的A100產(chǎn)品更具性能優(yōu)勢。

在兩項測試中,Gaudi2均使用了英特爾推出的SynapseAI1.10套件和OptimumHabana1.6;其中前者是面向Gaudi系列加速卡的SDK開發(fā)套件,能夠?qū)?a href="http://www.makelele.cn/tags/tensorflow/" target="_blank">TensorFlow和Pytorch等流行框架提供支持,而后者則是專門面向Transformers和Diffusers優(yōu)化的運行庫。

同時,在發(fā)布會的現(xiàn)場演示環(huán)節(jié),英特爾工作人員展示了StableDiffusion應(yīng)用中1至64張卡的計算性能,并實現(xiàn)了99%的近線性性能擴(kuò)展。換而言之,在更大規(guī)模的業(yè)務(wù)部署當(dāng)中,Gaudi2也能通過集群橫向擴(kuò)展獲得更加線性的性能增長。

目前,Gaudi系列AI加速器已經(jīng)在AWS的EC2DL1主機中進(jìn)行了實際的商業(yè)部署。AWS表示,相對于傳統(tǒng)GPU,Gaudi能夠在深度學(xué)習(xí)應(yīng)用中帶來40%的性價比提升。

在走量的市場做走心的產(chǎn)品

誠然,Gaudi2的競品并非性能無兩的H100,更無法對即將面市的H100NVL構(gòu)成性能威脅。但對于更加“走量”的A100而言,Gaudi2所展現(xiàn)出的性價比則對大多數(shù)用戶而言更有價值。

近兩年,“從中端入局”似乎已經(jīng)成為英特爾的慣用手段,消費級的Arc770顯卡和如今的Gaudi2均如此。

走量的中端市場對英特爾有足夠的吸引力,也更容易幫助英特爾用一兩款產(chǎn)品就建立口碑、站穩(wěn)腳跟;同時,能在中端市場為用戶提供先進(jìn)技術(shù)和優(yōu)勢性價比也證明英特爾對目標(biāo)用戶足夠走心,愿意把真正的實惠帶給最廣闊的用戶市場。

在走量的市場做走心的產(chǎn)品,這樣的英特爾令人喜聞樂見。

為Ai加速器市場打開一扇窗

近兩年,以AIGC為代表的AI應(yīng)用快速崛起,吸引了科技圈和投資界的廣泛關(guān)注,其中的語言類大模型更有望大幅降低企業(yè)在營銷、客服和售后方面的成本,實現(xiàn)生產(chǎn)效率的大幅提升。

在科技企業(yè)爭相進(jìn)行大模型“軍備競賽”的背后,GPU的需求也水漲船高。在GPU市場格局高度固化的當(dāng)下,這一現(xiàn)象很容易帶來終端市場的價格起伏,導(dǎo)致GPU價格畸高,進(jìn)而推高企業(yè)投身AI業(yè)務(wù)的成本并導(dǎo)致基礎(chǔ)架構(gòu)被綁定。

而英特爾Gaudi2加速卡的出現(xiàn)則意味著企業(yè)有了全新選擇。一方面,Gaudi2在絕對性能、顯存容量、集群性能等方面都比對標(biāo)產(chǎn)品有優(yōu)勢,能夠承接現(xiàn)有的市場需求;另一方面,伴隨oneAPI等算力調(diào)用工具的不斷成熟和完善,用戶也能在開發(fā)和應(yīng)用層面實現(xiàn)基礎(chǔ)架構(gòu)的透明化,更輕松的調(diào)用多元算力,繼而獲得算力和基礎(chǔ)架構(gòu)層面的靈活性。

528258aa-2220-11ee-962d-dac502259ad0.png

作為AI加速器市場的“追趕者”,Gaudi2證明英特爾能夠為用戶提供有競爭力的先進(jìn)產(chǎn)品。當(dāng)然,這還僅是在“獨立AI加速器”這一條賽道中。

在更廣闊的數(shù)據(jù)中心賽道中,英特爾還有并行的DataCenter Max和DataCenterFlex兩條產(chǎn)品線,以及更加獨立的FPGA賽道。此外,英特爾也在積極推動AI能力與傳統(tǒng)CPU的結(jié)合。從最初的AVX-512指令集和DLBoost到如今AMX-512指令集,英特爾正在為用戶構(gòu)建一條“用CPU靈活處理AI推理業(yè)務(wù)”的全新路徑。

很顯然,在英特爾的眼中,用戶在未來應(yīng)該針對不同場景和不同業(yè)務(wù)負(fù)載來規(guī)劃不同的基礎(chǔ)架構(gòu),用不同算力來滿足業(yè)務(wù)需求。而伴隨oneAPI的逐步成熟,底層算力的區(qū)別將被抹除,模型訓(xùn)練和多端部署不再需要特別調(diào)優(yōu)就能實現(xiàn)無縫遷移和高效調(diào)優(yōu)。

在產(chǎn)品層面,英特爾最新推出的Gaudi2對用戶而言有足夠的吸引力;在戰(zhàn)略層面,Gaud2則是英特爾站穩(wěn)獨立AI加速器市場并構(gòu)筑多元算力體系的重要一步。而在AI研究快速推進(jìn),技術(shù)落地如火如荼的當(dāng)下,Gaudi2的出現(xiàn)無疑為用戶帶來了全新選擇;而奮力前行的英特爾更有望為市場帶來AI與算力需求之間的全新平衡。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10302

    瀏覽量

    180523
  • 加速器
    +關(guān)注

    關(guān)注

    2

    文章

    839

    瀏覽量

    40111
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39820

    瀏覽量

    301496
  • Gaudi2
    +關(guān)注

    關(guān)注

    0

    文章

    13

    瀏覽量

    285

原文標(biāo)題:先得走心,才能走量!英特爾推出AI加速器性價比產(chǎn)品Gaudi2

文章出處:【微信號:IT葡萄皮,微信公眾號:IT葡萄皮】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    英特爾與華陽通用聯(lián)手推出全新AI Box解決方案

    英特爾宣布推出基于最新英特爾 酷睿 Ultra 架構(gòu)的AI Box解決方案,將PC級旗艦算力引入汽車、工業(yè)自動化、軌道交通、機器人等多種工業(yè)環(huán)境,為各行各業(yè)接入
    的頭像 發(fā)表于 03-02 14:15 ?355次閱讀

    英特爾創(chuàng)新引領(lǐng)AI NAS:軟硬結(jié)合引領(lǐng)本地數(shù)據(jù)智慧管理與多場景創(chuàng)新應(yīng)用

    展示面向中小企業(yè)、消費者和專業(yè)用戶,賦能新場景、加速產(chǎn)品落地的最新技術(shù)方案。會上,綠聯(lián)、極空間、鐵威馬、暢網(wǎng)、飛牛等AI NAS 廠商,發(fā)布和展示了一系列基于英特爾? 酷睿? Ultr
    的頭像 發(fā)表于 12-12 15:45 ?495次閱讀
    <b class='flag-5'>英特爾</b>創(chuàng)新引領(lǐng)<b class='flag-5'>AI</b> NAS:軟硬結(jié)合引領(lǐng)本地數(shù)據(jù)智慧管理與多場景創(chuàng)新應(yīng)用

    英特爾舉辦行業(yè)解決方案大會,共同打造機器人“芯”動脈

    11月19日,在2025英特爾行業(yè)解決方案大會上,英特爾展示了基于英特爾? 酷睿? Ultra平臺的最新邊緣AI產(chǎn)品及解決方案,并預(yù)覽了針對
    的頭像 發(fā)表于 11-19 21:51 ?6805次閱讀
    <b class='flag-5'>英特爾</b>舉辦行業(yè)解決方案大會,共同打造機器人“芯”動脈

    18A工藝大單!英特爾將代工微軟AI芯片Maia 2

    電子發(fā)燒友網(wǎng)綜合報道 據(jù)科技媒體SemiAccurate報道,微軟已正式向英特爾晶圓代工(Intel Foundry)下達(dá)訂單,委托其使用先進(jìn)的18A工藝節(jié)點生產(chǎn)下一代AI加速器Maia 2
    的頭像 發(fā)表于 10-21 08:52 ?5608次閱讀

    英特爾Gaudi 2E AI加速器為DeepSeek-V3.1提供加速支持

    英特爾? Gaudi 2EAI加速器現(xiàn)已為DeepSeek-V3.1提供深度優(yōu)化支持。憑借出色的性能和成本效益,英特爾
    的頭像 發(fā)表于 08-26 19:18 ?3038次閱讀
    <b class='flag-5'>英特爾</b><b class='flag-5'>Gaudi</b> <b class='flag-5'>2</b>E <b class='flag-5'>AI</b><b class='flag-5'>加速器</b>為DeepSeek-V3.1提供<b class='flag-5'>加速</b>支持

    主控CPU全能選手,英特爾至強6助力AI系統(tǒng)高效運轉(zhuǎn)

    2025年3月,英偉達(dá)發(fā)布了DGX B300 AI加速計算平臺。2025年5月,英特爾發(fā)布了三款全新英特爾至強6性能核處理,其中一款677
    的頭像 發(fā)表于 06-27 11:44 ?899次閱讀
    主控CPU全能選手,<b class='flag-5'>英特爾</b>至強6助力<b class='flag-5'>AI</b>系統(tǒng)高效運轉(zhuǎn)

    英特爾發(fā)布邊緣AI控制與邊緣智算一體機,創(chuàng)造“AI新視界”

    處理的邊緣 AI 控制 和 基于英特爾銳炫 ? 顯卡的邊緣智算一體機 ,為工業(yè)AI的規(guī)?;涞刈⑷霃妱艅恿Α?
    發(fā)表于 06-24 17:50 ?1520次閱讀
    <b class='flag-5'>英特爾</b>發(fā)布邊緣<b class='flag-5'>AI</b>控制<b class='flag-5'>器</b>與邊緣智算一體機,創(chuàng)造“<b class='flag-5'>AI</b>新視界”

    英特爾銳炫Pro B系列,邊緣AI的“智能引擎”

    CTO、高級首席AI工程師張宇博士 英特爾客戶端計算事業(yè)部邊緣計算CTO、高級首席AI工程師張宇博士在MWC AI終端峰會上指出,邊緣將崛起為AI
    的頭像 發(fā)表于 06-20 17:32 ?900次閱讀
    <b class='flag-5'>英特爾</b>銳炫Pro B系列,邊緣<b class='flag-5'>AI</b>的“智能引擎”

    直擊Computex 2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    B60和英特爾銳炫Pro B50 GPU,AI加速器產(chǎn)品英特爾Gaudi 3
    的頭像 發(fā)表于 05-21 00:57 ?7487次閱讀
    直擊Computex 2025:<b class='flag-5'>英特爾</b>重磅發(fā)布新一代GPU,圖形和<b class='flag-5'>AI</b>性能躍升3.4倍

    直擊Computex2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    5月19日,在Computex 2025上,英特爾發(fā)布了最新全新圖形處理(GPU)和AI加速器產(chǎn)品系列。包括全新
    的頭像 發(fā)表于 05-20 12:27 ?5459次閱讀
    直擊Computex2025:<b class='flag-5'>英特爾</b>重磅發(fā)布新一代GPU,圖形和<b class='flag-5'>AI</b>性能躍升3.4倍

    英特爾發(fā)布全新GPU,AI和工作站迎來新選擇

    英特爾推出面向準(zhǔn)專業(yè)用戶和AI開發(fā)者的英特爾銳炫Pro GPU系列,發(fā)布英特爾? Gaudi 3
    發(fā)表于 05-20 11:03 ?1849次閱讀

    英特爾首秀上海車展:以“芯”賦能,攜手合作伙伴推動全車智能化

    4月23日,在上海車展上,英特爾發(fā)布第二代英特爾AI增強軟件定義汽車(SDV)SoC,并披露全新合作伙伴關(guān)系。第二代英特爾AI增強SDV S
    的頭像 發(fā)表于 04-23 21:20 ?1340次閱讀
    <b class='flag-5'>英特爾</b>首秀上海車展:以“芯”賦能,攜手合作伙伴推動全車智能化

    英特爾酷睿Ultra AI PC上部署多種圖像生成模型

    全新英特爾酷睿Ultra 200V系列處理對比上代Meteor Lake,升級了模塊化結(jié)構(gòu)、封裝工藝,采用全新性能核與能效核、英特爾硬件線程調(diào)度、Xe
    的頭像 發(fā)表于 04-02 15:47 ?1505次閱讀
    在<b class='flag-5'>英特爾</b>酷睿Ultra <b class='flag-5'>AI</b> PC上部署多種圖像生成模型

    英特爾借助開放生態(tài)系統(tǒng),加速邊緣AI創(chuàng)新

    英特爾推出全新AI邊緣系統(tǒng)、邊緣AI套件和開放邊緣平臺軟件,賦能合作伙伴將AI無縫融入現(xiàn)有基礎(chǔ)設(shè)施 ?
    發(fā)表于 03-21 11:31 ?335次閱讀
    <b class='flag-5'>英特爾</b>借助開放生態(tài)系統(tǒng),<b class='flag-5'>加速</b>邊緣<b class='flag-5'>AI</b>創(chuàng)新

    英特爾至強6再推新品!打造最強AI“機頭引擎”

    產(chǎn)品矩陣,很好地滿足市場的多樣化需求;另一方面,憑借卓越的 AI 性能提升,英特爾為數(shù)據(jù)中心提供了性能強勁的機頭節(jié)點 CPU,助力企業(yè)在數(shù)字時代的浪潮中穩(wěn)步前行。 事實上,去年9月,英特爾
    的頭像 發(fā)表于 03-13 14:57 ?748次閱讀