91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)超級芯片的真正殺手锏,C2C互聯(lián)技術(shù)

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚(yáng) ? 2023-08-16 00:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/周凱揚(yáng))英偉達(dá)于今年發(fā)布了新一代的GH200 Grace Hopper硬件平臺,預(yù)示著其發(fā)展HPC與AI的重要路線邁進(jìn)了新階段。GH200將用于應(yīng)對世界上最復(fù)雜的生成式AI負(fù)載,涵蓋大語言模型、推薦系統(tǒng)和矢量數(shù)據(jù)庫等應(yīng)用,且英偉達(dá)依然為GH200準(zhǔn)備了不同的配置選項,無疑這一芯片很快就會用于各大數(shù)據(jù)中心和超算中。

NVLink,從片外互聯(lián)走向片內(nèi)互聯(lián)

或許在多數(shù)人眼中,GH200不過是新一代Grace CPU和Hopper GPU結(jié)合的又一新產(chǎn)品,但這必然不是英偉達(dá)追求的“1+1=2”效果。事實(shí)上,GH200是象征著英偉達(dá)在芯片互聯(lián)技術(shù)先進(jìn)設(shè)計水平的集大成者。

在英偉達(dá)的第四代NVLink技術(shù)和第三代NVSwitch技術(shù)下,創(chuàng)造一個256個GH200連接在一起的系統(tǒng)也不在話下。但這樣的片外互聯(lián)技術(shù)并不算罕見,市面上也有不少初創(chuàng)公司的AI芯片可以做到類似或者更夸張的擴(kuò)展性。

然而在片內(nèi)芯片互聯(lián)上,NVLink-C2C這一互聯(lián)技術(shù)確實(shí)達(dá)到了新的高度。NVLink-C2C是英偉達(dá)專為其superchip系列打造的內(nèi)存一致、高帶寬、低延遲互聯(lián)技術(shù)。也是其實(shí)現(xiàn)高達(dá)900GB/s總帶寬的關(guān)鍵所在。900GB/s的帶寬是什么概念呢?與現(xiàn)代AI/HPC加速器常用的16路的PCIe 5.0相比,還要快上6倍。

NVLink-C2C的優(yōu)勢

NVLink-C2C的第一大優(yōu)勢就是其內(nèi)存一致性,這不僅提高了開發(fā)者的效率、芯片性能,還提高了GPU可以訪問的內(nèi)存量。在這一互聯(lián)技術(shù)的支持下,如今CPU、GPU線程都可以并行訪問CPU和GPU各自的內(nèi)存,無需頁遷移,所以開發(fā)者可以專心于優(yōu)化算法本身,而不是內(nèi)存管理。

其次就是900GB/s的帶寬了,有了NVLink-C2C,應(yīng)用程序可以直接用滿GPU的內(nèi)存,再以超高的帶寬直接調(diào)用Grace CPU的內(nèi)存。畢竟即便是最新的HBM3e版GH200,也只有144GB的內(nèi)存,而Grace CPU可以支持到最高480GB的LPDDR5X內(nèi)存。甚至在NVSwitch的支持下,可以高速訪問整個系統(tǒng)中最高達(dá)144TB的內(nèi)存。

如此一來在GPT這樣的LLM模型中,可用的內(nèi)存也就變多了。這對于batch size增加后,推理所需內(nèi)存數(shù)增加的生成式AI來說至關(guān)重要。相比過去x86 CPU+PCIe 5.0 H100的搭配組合,GH200在更大的batch size下推理速度有著數(shù)倍的提升。

英偉達(dá)也對高帶寬在HPC加速上的優(yōu)勢進(jìn)行了解讀,以ABINIT的標(biāo)準(zhǔn)執(zhí)行時間為例,ABINIT是一個用于計算材料光學(xué)、機(jī)械、振動等特性的模擬軟件。以只用x86 CPU的執(zhí)行時間作為標(biāo)準(zhǔn),在x86 CPU與Hopper GPU的結(jié)合下,超高性能的Hopper GPU極大地縮短了執(zhí)行時間。

然而在CPU與GPU之間的傳輸開銷下,這一組合最終只能做到快上1.16倍的優(yōu)勢。而如果是使用Grace Hopper方案的話,在NVLink-C2C的超大帶寬下,CPU與GPU之間的傳輸開銷迅速縮減,最終實(shí)現(xiàn)了縮短4.25倍的執(zhí)行時間。

寫在最后

英偉達(dá)會走上自研CPU和Superchip的路線其實(shí)并不令人意外,為CPU與GPU之間打通一個更快的接口一直是英偉達(dá)的努力方向之一。此前由于x86的CPU設(shè)計主要還是有英特爾AMD兩家廠商完成,而Grace這樣的自研Arm芯片則沒了設(shè)計限制,可以摻入英偉達(dá)的各種定制化開發(fā)。

NVLink-C2C也為市面上其他的AI芯片帶來了更大的挑戰(zhàn),畢竟英偉達(dá)在性能、軟件生態(tài)上已經(jīng)處于領(lǐng)先地位,又有著如此高效的互聯(lián)技術(shù)??梢灶A(yù)見未來其他廠商也會在芯片互聯(lián)、高速接口等領(lǐng)域發(fā)力,否則很難與英偉達(dá)同臺競爭。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4091

    瀏覽量

    99252
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    英偉達(dá)重磅出手!AI 推理存儲全面覺醒

    電子發(fā)燒友網(wǎng)報道(文/黃晶晶)近日,有消息稱,英偉達(dá)將以大約200億美元收購人工智能芯片初創(chuàng)公司Groq,這將是英偉達(dá)迄今為止規(guī)模最大的一筆
    的頭像 發(fā)表于 12-26 08:44 ?1.2w次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>重磅出手!AI 推理存儲全面覺醒

    黃仁勛:英偉達(dá)AI芯片訂單排到2026年 英偉達(dá)上季營收加速增長62%再超預(yù)期

    AI芯片總龍頭英偉達(dá)的財報終于帶來了驚喜;英偉達(dá)公司發(fā)布財報數(shù)據(jù)顯示,上季營收加速增長62%;再超華爾街預(yù)期。業(yè)界都比較振奮,
    的頭像 發(fā)表于 11-20 11:36 ?1274次閱讀

    英偉達(dá)發(fā)布 NVQLink 開放系統(tǒng)架構(gòu);國內(nèi)首個汽車芯片標(biāo)準(zhǔn)驗(yàn)證平臺投入使用

    英偉達(dá)發(fā)布 NVQLink 開放系統(tǒng)架構(gòu) 在華盛頓特區(qū)舉行的英偉達(dá)全球技術(shù)大會上,英偉
    發(fā)表于 10-29 10:33 ?1229次閱讀

    英偉達(dá)下一代Rubin芯片已流片

    繼8月底英偉達(dá)透露Rubin架構(gòu)芯片計劃明年量產(chǎn)后,當(dāng)?shù)貢r間9月8日的高盛技術(shù)會議上,英偉達(dá)又談
    的頭像 發(fā)表于 09-12 17:15 ?1721次閱讀

    英偉達(dá)被傳暫停生產(chǎn)H20芯片 外交部回應(yīng)

    據(jù)外媒《the Information》在當(dāng)?shù)貢r間的8月21日下午爆料稱,英偉達(dá)可能已經(jīng)暫停生產(chǎn)H20芯片。據(jù)稱,英偉達(dá)已正式下達(dá)指示給到供
    的頭像 發(fā)表于 08-22 15:58 ?2860次閱讀

    英偉達(dá)被約談!“后門”風(fēng)險陰影下,人臉識別終端為何選國產(chǎn)芯片

    7月31日消息,為維護(hù)中國用戶網(wǎng)絡(luò)安全、數(shù)據(jù)安全,國家互聯(lián)網(wǎng)信息辦公室已約談英偉達(dá),要求英偉達(dá)公司就對華銷售的H20算力
    的頭像 發(fā)表于 08-08 09:43 ?937次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>被約談!“后門”風(fēng)險陰影下,人臉識別終端為何選國產(chǎn)<b class='flag-5'>芯片</b>

    國家網(wǎng)信辦約談英偉達(dá)

    近日,英偉達(dá)算力芯片被曝出存在嚴(yán)重安全問題。此前,美議員呼吁要求美出口的先進(jìn)芯片必須配備“追蹤定位”功能。美人工智能領(lǐng)域?qū)<彝嘎叮?b class='flag-5'>英偉
    的頭像 發(fā)表于 07-31 13:56 ?2727次閱讀
    國家網(wǎng)信辦約談<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>

    GB10超級芯片開賣!正式殺入AI PC

    電子發(fā)燒友網(wǎng)綜合報道,近日,聯(lián)發(fā)科與英偉達(dá)合作開發(fā)的GB10超級芯片,作為首款個人AI超級電腦的核心組件,已經(jīng)獲得了主要PC品牌大廠的青睞,
    的頭像 發(fā)表于 07-09 01:21 ?4121次閱讀

    擺脫依賴英偉達(dá)!OpenAI首次轉(zhuǎn)向使用谷歌芯片

    地使用非英偉達(dá)芯片,更顯示出其正在逐步擺脫對英偉達(dá)芯片的深度依賴,在算力布局上邁出了重要戰(zhàn)略調(diào)整
    的頭像 發(fā)表于 07-02 00:59 ?8361次閱讀

    瑞之辰傳感器:從“卡脖子”到“殺手锏”的技術(shù)突圍

    壓力傳感器的國產(chǎn)化替代,將這一“卡脖子”難題逐步轉(zhuǎn)變?yōu)樽陨淼?b class='flag-5'>技術(shù)“殺手锏”。破解“卡脖子”的技術(shù)密碼當(dāng)動力電池安全監(jiān)測需要精度達(dá)1%FS的微型壓力傳感器時,當(dāng)工業(yè)自動化
    的頭像 發(fā)表于 07-01 17:06 ?2094次閱讀
    瑞之辰傳感器:從“卡脖子”到“<b class='flag-5'>殺手锏</b>”的<b class='flag-5'>技術(shù)</b>突圍

    華為與TüV萊茵共同發(fā)布工商業(yè)儲能C2C雙鏈安全白皮書

    華為數(shù)字能源和德國萊茵TüV集團(tuán)(以下簡稱“TüV萊茵”)于上海SNEC展會期間,聯(lián)合重磅發(fā)布《工商業(yè)儲能C2C雙鏈安全白皮書》,旨在通過雙方在儲能安全設(shè)計、安全標(biāo)準(zhǔn)方面的探索研究和協(xié)同創(chuàng)新成果
    的頭像 發(fā)表于 06-20 09:46 ?1070次閱讀

    美國限制英偉達(dá)向華出售H20芯片

    出口H20芯片,以及任何其他性能達(dá)到H20內(nèi)存帶寬、互連帶寬或其組合的芯片,都必須獲得出口許可。 公告披露,美國政府稱,這旨在解決相關(guān)產(chǎn)品可能被用于或被轉(zhuǎn)用于中國超級計算機(jī)的風(fēng)險。4月14日,美國政府通知
    的頭像 發(fā)表于 04-16 17:28 ?1056次閱讀

    特朗普要叫停英偉達(dá)對華特供版 英偉達(dá)H20出口限制 或損失55億美元

    據(jù)外媒報道,英偉達(dá)公司發(fā)布了一項通知稱,美國政府于9日告知英偉達(dá)公司;特供版的H20芯片出口到中國需要許可證,緊接著在14日又告知
    的頭像 發(fā)表于 04-16 16:59 ?2108次閱讀

    新思科技攜手英偉達(dá)加速芯片設(shè)計,提升芯片電子設(shè)計自動化效率

    解決方案在英偉達(dá) GPU和英偉達(dá) CUDA-X庫上所實(shí)現(xiàn)的加速 基于英偉達(dá) GB200 Grac
    發(fā)表于 03-19 17:59 ?508次閱讀