91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

HPC領(lǐng)域的一款大殺器-HBX-G500大帶寬加速卡

傅里葉的貓 ? 來(lái)源:FPGA技術(shù)聯(lián)盟 ? 2023-11-29 09:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

HBX-G500是一款為AI、計(jì)算和網(wǎng)絡(luò)領(lǐng)域設(shè)計(jì)的高性能可編程加速器卡。它配備了多通道的高帶寬存儲(chǔ)和高效能計(jì)算能力,以及先進(jìn)的高速接口解決方案,特別適用于運(yùn)行大型模型。即便在小批量數(shù)據(jù)處理時(shí),它的性能也能媲美A100和H100。

該加速器卡搭載了兩組PCIe GEN5接口,并配備了兩個(gè)400GbE和一個(gè)200Gbe網(wǎng)絡(luò)接口,以及32GB的GDDR6存儲(chǔ)單元。

它還具備一個(gè)包含超過(guò)80個(gè)節(jié)點(diǎn)的2DNOC網(wǎng)絡(luò)和2560個(gè)高度可配置的MLP計(jì)算核心,以支持密集型計(jì)算任務(wù)。2DNOC不僅連接了高速接口和存儲(chǔ)單元,而且還連接了Fabric的80個(gè)節(jié)點(diǎn),使得用戶可以更專注于功能開發(fā)。總線路由問(wèn)題可以簡(jiǎn)單地通過(guò)NOC連接來(lái)解決。

板卡功能:

兩路PCIe Gen5 ,其中PCIe Gen5X16支持系統(tǒng)接口,PCIeGen5X4可同時(shí)支持RC/EP

兩路網(wǎng)口,速率可達(dá)400Gbe以及200Gbe,且支持向下速率兼容

32GBGDDR6,市面上為數(shù)不多的支持GDDR6的FPGA板卡,支持16通路訪問(wèn),內(nèi)存帶寬可達(dá)3.5Tbps

FPGA可支持達(dá)1500K LE

FPGA支持2560高性能計(jì)算核心(MLP)

每個(gè)MLP最大支持32個(gè)乘法器,可根據(jù)數(shù)據(jù)位寬的變化做調(diào)整

專屬內(nèi)嵌的LRAM/BRAM可緩存數(shù)據(jù)或者快速反饋結(jié)

支持整型(INT16/INT8/INT4)、浮點(diǎn)(FP24/FP16)、BFP

INT8總算力約61Tops

支持通用串行總線(USB)JTAG配置、PCIe加載

支持上電自加載,1GB QSPI閃存 板卡規(guī)格:

尺寸:高度:111.15mm 長(zhǎng)度:275mm

工作電壓:外部?jī)陕?12VDC

適用AI應(yīng)用的架構(gòu)特性:

00369078-8e4c-11ee-939d-92fbcf53809c.png

2D NOC的高效路由架構(gòu)讓用戶可以集中精力于開發(fā):

它支持廣泛采用的AXI4標(biāo)準(zhǔn)接口。

NOC的工作頻率可達(dá)2Ghz,數(shù)據(jù)傳輸寬度為256位。

主機(jī)通過(guò)PCIe接口,可以直接通過(guò)NOC的黃色區(qū)域訪問(wèn)16條通道的GDDR6存儲(chǔ)。

主機(jī)通過(guò)PCIe,同樣可以通過(guò)NOC的黃色區(qū)域直接訪問(wèn)連接在NAP上的任意功能單元。

功能單元能夠通過(guò)NOC直接訪問(wèn)存儲(chǔ)資源(GDDR6或DDR)。

不同功能單元之間可以通過(guò)NOC進(jìn)行高效互聯(lián)。







審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1660

    文章

    22416

    瀏覽量

    636585
  • JTAG
    +關(guān)注

    關(guān)注

    6

    文章

    415

    瀏覽量

    75005
  • QSPI
    +關(guān)注

    關(guān)注

    0

    文章

    55

    瀏覽量

    13370
  • PCIe接口
    +關(guān)注

    關(guān)注

    0

    文章

    126

    瀏覽量

    10582
  • GDDR6
    +關(guān)注

    關(guān)注

    0

    文章

    52

    瀏覽量

    11608

原文標(biāo)題:HPC領(lǐng)域的一款大殺器---HBX-G500大帶寬加速卡

文章出處:【微信號(hào):傅里葉的貓,微信公眾號(hào):傅里葉的貓】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    FPGA硬件加速卡設(shè)計(jì)原理圖:1-基于Xilinx XCKU115的半高PCIe x8 硬件加速卡 PCIe半高 XCKU115-3-FLVF1924-E芯片

    FPGA硬件加速, PCIe半高, XCKU115, 光纖采集, 信號(hào)計(jì)算板, 硬件加速卡
    的頭像 發(fā)表于 02-12 09:52 ?400次閱讀
    FPGA硬件<b class='flag-5'>加速卡</b>設(shè)計(jì)原理圖:1-基于Xilinx XCKU115的半高PCIe x8 硬件<b class='flag-5'>加速卡</b> PCIe半高 XCKU115-3-FLVF1924-E芯片

    新品 | LLM-8850 Kit,高性能AI加速卡套件 DinMeter v1.1,1/32DIN標(biāo)準(zhǔn)嵌入式開發(fā)板

    LLM-8850KitLLM-8850Kit是一款面向邊緣AI與嵌入式計(jì)算場(chǎng)景的高性能AI加速卡套件,由LLM-8850CardAI加速卡與LLM-8850PiHat轉(zhuǎn)接板組成。核心加速卡
    的頭像 發(fā)表于 01-30 16:11 ?1077次閱讀
    新品 | LLM-8850 Kit,高性能AI<b class='flag-5'>加速卡</b>套件 DinMeter v1.1,1/32DIN標(biāo)準(zhǔn)嵌入式開發(fā)板

    高速信號(hào)處理設(shè)計(jì)方案:413-基于雙XCVU9P+C6678的100G光纖加速卡

    C6678, XCVU9P, ZU19EG開發(fā)板,, 高速信號(hào)處理, 光纖加速卡, XCVU9P光纖加速卡
    的頭像 發(fā)表于 01-08 16:06 ?308次閱讀
    高速信號(hào)處理設(shè)計(jì)方案:413-基于雙XCVU9P+C6678的100<b class='flag-5'>G</b>光纖<b class='flag-5'>加速卡</b>

    昆侖芯R200 AI加速卡技術(shù)規(guī)格解析

    昆侖芯R200加速卡基于7nm XPU-R架構(gòu),在150W功耗下提供256 TOPS INT8算力,側(cè)重高性能推理。配備最高32GB GDDR6內(nèi)存(512GB/s帶寬)及108路視頻解碼能力,支持
    的頭像 發(fā)表于 12-14 13:12 ?1596次閱讀
    昆侖芯R200 AI<b class='flag-5'>加速卡</b>技術(shù)規(guī)格解析

    邁向云端算力巔峰:昆侖芯K200 AI加速卡全面解讀

    昆侖芯K200作為云端AI加速卡,在K100架構(gòu)基礎(chǔ)上全面升級(jí)。其INT8算力達(dá)256 TOPS,配備16GB HBM內(nèi)存與512GB/s帶寬,專為千億參數(shù)大模型訓(xùn)練與高并發(fā)推理優(yōu)化。采用全高全長(zhǎng)雙
    的頭像 發(fā)表于 12-14 11:17 ?1946次閱讀
    邁向云端算力巔峰:昆侖芯K200 AI<b class='flag-5'>加速卡</b>全面解讀

    專為邊緣而生:深度解析昆侖芯K100 AI加速卡,釋放128 TOPS極致能效

    昆侖芯K100邊緣AI加速卡以75W超低功耗實(shí)現(xiàn)128 TOPS的INT8算力,重新定義邊緣推理能效標(biāo)準(zhǔn)。其半高半長(zhǎng)設(shè)計(jì)搭載8GB HBM內(nèi)存與256GB/s帶寬,支持INT8至FP32多精度計(jì)算
    的頭像 發(fā)表于 12-14 11:12 ?2949次閱讀
    專為邊緣而生:深度解析昆侖芯K100 AI<b class='flag-5'>加速卡</b>,釋放128 TOPS極致能效

    深圳光量子工廠啟示:PCI 加速卡為何偏向 25MHz 2016 有源晶振?

    在 PCI?加速卡項(xiàng)目中,工程師使用SJK 2016?系列有源晶振?25MHZ。原因不僅僅是規(guī)格匹配,更在于系統(tǒng)復(fù)雜度。
    的頭像 發(fā)表于 12-12 16:43 ?1216次閱讀
    深圳光量子工廠啟示:PCI <b class='flag-5'>加速卡</b>為何偏向 25MHz 2016 有源晶振?

    算力密度翻倍!江原D20加速卡發(fā)布,一卡雙芯重構(gòu)AI推理標(biāo)桿

    的關(guān)鍵技術(shù)瓶頸。 ? 在此背景下,江原科技推出采用自研AI芯片的AI加速卡江原D10,并在今年5月實(shí)現(xiàn)量產(chǎn)交付。在大算力AI芯片全流程國(guó)產(chǎn)化產(chǎn)業(yè)鏈實(shí)現(xiàn)首次突破后,11月11日,江原科技再次發(fā)布新代全國(guó)產(chǎn)AI加速卡——江原D20
    的頭像 發(fā)表于 11-14 08:21 ?1w次閱讀
    算力密度翻倍!江原D20<b class='flag-5'>加速卡</b>發(fā)布,<b class='flag-5'>一卡</b>雙芯重構(gòu)AI推理標(biāo)桿

    虛擬電廠加速卡不是噱頭!萬(wàn)點(diǎn)規(guī)模VPP的性能分水嶺

    。 ? 此時(shí)僅靠邊緣MPU/CPU的通用算力,可能無(wú)法及時(shí)處理數(shù)據(jù)清洗、異常檢測(cè)、指令下發(fā)校驗(yàn)等任務(wù),而加速卡(如 GPU、FPGA 加速卡)的并行計(jì)算能力可快速消化數(shù)據(jù)洪流,避免“小包風(fēng)暴”導(dǎo)致的系統(tǒng)頓。 ? 虛擬電廠對(duì)AG
    的頭像 發(fā)表于 10-10 08:59 ?2499次閱讀

    新品 | LLM-8850 Card, AX8850邊緣設(shè)備AI加速卡

    LLM?8850?Card是一款面向邊緣設(shè)備的M.2M-KEY2242?AI加速卡,把42?mm的袖珍體積與AxeraAX8850?SoC的24?TOPS?@?INT8算力結(jié)合起來(lái),為
    的頭像 發(fā)表于 09-26 18:18 ?1126次閱讀
    新品 | LLM-8850 Card, AX8850邊緣設(shè)備AI<b class='flag-5'>加速卡</b>

    智算加速卡是什么東西?它真能在AI戰(zhàn)場(chǎng)上干掉GPU和TPU!

    隨著AI技術(shù)火得塌糊涂,大家都在談"大模型"、"AI加速"、"智能計(jì)算",可真到了落地環(huán)節(jié),算力才是硬通貨。你有沒有發(fā)現(xiàn),現(xiàn)在越來(lái)越多的AI企業(yè)不光用GPU,也不怎么迷信TPU了?他們嘴里多了個(gè)新詞兒——智算
    的頭像 發(fā)表于 06-05 13:39 ?1675次閱讀
    智算<b class='flag-5'>加速卡</b>是什么東西?它真能在AI戰(zhàn)場(chǎng)上干掉GPU和TPU!

    用ZX7981EP方案打造一款直播不頓的5G路由

    直播場(chǎng)景是網(wǎng)絡(luò)解決方案經(jīng)典場(chǎng)景之,它有著獨(dú)特的網(wǎng)絡(luò)需求,多設(shè)備接入、高帶寬、高覆蓋……因此,打造一款直播不頓的路由很有必要。啟明智顯Z
    的頭像 發(fā)表于 05-15 18:01 ?1063次閱讀
    用ZX7981EP方案打造<b class='flag-5'>一款</b>直播不<b class='flag-5'>卡</b>頓的5<b class='flag-5'>G</b>路由

    410?基于?XCVU9P+?C6678?的?100G?光纖的加速卡

    基于 XCVU9P+ C6678 的 100G 光纖的加速卡
    的頭像 發(fā)表于 05-08 08:32 ?757次閱讀
    410?基于?XCVU9P+?C6678?的?100<b class='flag-5'>G</b>?光纖的<b class='flag-5'>加速卡</b>

    邊緣AI運(yùn)算革新 DeepX DX-M1 AI加速卡結(jié)合Rockchip RK3588多路物體檢測(cè)解決方案

    DeepX 推出了一款革命性的產(chǎn)品 DeepX DX-M1 AI 推理加速卡 采用 PCIe Gen3 M.2 M-Key 接口,具備高達(dá) 25 TOPS 的卓越運(yùn)算性能,以及高準(zhǔn)確度、低功耗、低溫
    的頭像 發(fā)表于 05-06 14:15 ?1249次閱讀
    邊緣AI運(yùn)算革新 DeepX DX-M1 AI<b class='flag-5'>加速卡</b>結(jié)合Rockchip RK3588多路物體檢測(cè)解決方案

    寒武紀(jì)基于思元370芯片的MLU370-X8 智能加速卡產(chǎn)品手冊(cè)詳解

    MLU370-X8智能加速卡是全面升級(jí)的數(shù)據(jù)中心訓(xùn)推體AI加速卡,基于寒武紀(jì)全新代思元370芯片,接口為PCIe 4.0 X16,是全高全長(zhǎng)雙寬(FHFL-Dual-Slot)的標(biāo)
    的頭像 發(fā)表于 04-24 17:57 ?5451次閱讀
    寒武紀(jì)基于思元370芯片的MLU370-X8 智能<b class='flag-5'>加速卡</b>產(chǎn)品手冊(cè)詳解