91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

當(dāng)CPU算力趨近極限,GPU能否替代CPU滿足數(shù)字芯片設(shè)計(jì)的算力需求?

新思科技 ? 來(lái)源:新思科技 ? 2024-04-10 17:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

就數(shù)字設(shè)計(jì)實(shí)現(xiàn)而言,RTL-to-GDSII流程中的每一步都涉及海量計(jì)算。在SoC級(jí)別,開(kāi)發(fā)者需要評(píng)估數(shù)百個(gè)分區(qū)的各種版圖規(guī)劃選項(xiàng),從而更大限度減少互連中的延遲并提高效率。確定了版圖規(guī)劃后,需要在每個(gè)分區(qū)中繼續(xù)執(zhí)行其余步驟,直到完成整個(gè)芯片的實(shí)現(xiàn)與簽核環(huán)節(jié)。每個(gè)步驟的算力需求本身就很高,再乘以分區(qū)的數(shù)量,不禁讓人懷疑:傳統(tǒng)上用于數(shù)字設(shè)計(jì)的CPU是否已難堪重任?GPU能否替代CPU滿足這樣的算力需求?

目前,GPU以其在人工智能AI)/機(jī)器學(xué)習(xí)(ML)、游戲以及高性能計(jì)算等領(lǐng)域處理極具挑戰(zhàn)性的工作負(fù)載的強(qiáng)大能力而備受推崇。隨著芯片設(shè)計(jì)趨向更大尺寸與更高復(fù)雜性,將GPU的應(yīng)用范圍延伸到數(shù)字芯片設(shè)計(jì)實(shí)現(xiàn)領(lǐng)域,或許正當(dāng)其時(shí)。

EDA工作負(fù)載面臨的CPU算力瓶頸

CPU一直被譽(yù)為計(jì)算機(jī)的“大腦”。現(xiàn)代CPU集成了數(shù)十億個(gè)晶體管和多個(gè)處理內(nèi)核,適合執(zhí)行各種任務(wù),并且處理速度極快。另一方面,GPU最初是為了特定用途而設(shè)計(jì)的,但隨著時(shí)間推移,GPU也逐漸演變?yōu)槟軌驈V泛用于并行處理任務(wù)的通用處理器了。

傳統(tǒng)上,電子設(shè)計(jì)自動(dòng)化(EDA)的工作負(fù)載主要在基于x86架構(gòu)的CPU上運(yùn)行。然而,Multi-Die等復(fù)雜架構(gòu)的普及,使得CPU的算力逐漸接近極限??紤]到芯片開(kāi)發(fā)團(tuán)隊(duì)經(jīng)常面臨產(chǎn)品上市時(shí)間的壓力,任何能加速芯片設(shè)計(jì)流程的工具和技術(shù)都將極具價(jià)值。在驗(yàn)證和分析階段,由于GPU的卓越計(jì)算性能,新思科技的PrimeSim和VCS仿真流程已經(jīng)實(shí)現(xiàn)了顯著的速度提升。盡管GPU并不適用于數(shù)字設(shè)計(jì)流程中的所有環(huán)節(jié),但它在某些特定任務(wù)中無(wú)疑能夠提供速度上的優(yōu)勢(shì)。

在數(shù)據(jù)中心,每個(gè)機(jī)箱平均部署64至128個(gè)先進(jìn)高性能x86 CPU內(nèi)核,部分機(jī)箱甚至有多達(dá)200個(gè)內(nèi)核。某些任務(wù)需求對(duì)內(nèi)核數(shù)量要求更高,因此需要多個(gè)機(jī)箱協(xié)同進(jìn)行分布式處理。但如果網(wǎng)速不匹配,這種分布式處理就會(huì)帶來(lái)額外的通信成本。RTL-to-GDSII流程和優(yōu)化技術(shù)中包含許多相互依賴的關(guān)系。要成功并行執(zhí)行流程中的每個(gè)作業(yè),進(jìn)行分布式處理的各個(gè)CPU機(jī)箱之間必須能夠非??焖俚赝瓿蓴?shù)據(jù)共享,不能有任何延遲。然而在實(shí)際情況中,網(wǎng)絡(luò)延遲對(duì)處理周期時(shí)間有著顯著影響,進(jìn)而導(dǎo)致整個(gè)RTL-to-GDSII流程的分布式并行難以達(dá)到理想效果。

另一方面,GPU內(nèi)核可以輕松地進(jìn)行擴(kuò)展。由于每個(gè)GPU內(nèi)核承擔(dān)的操作較少而且體積極小,一個(gè)插槽內(nèi)可以集成數(shù)萬(wàn)個(gè)內(nèi)核,這樣便可在占用空間可控的情況下,提供強(qiáng)大的處理能力。那些能從大規(guī)模并行處理中受益的任務(wù)非常適合交由GPU處理。然而,這些任務(wù)通常需要是單向的,因?yàn)槿魏涡枰獩Q策和迭代的任務(wù)都會(huì)減慢處理速度,“或者/并且”需要返回CPU進(jìn)行復(fù)雜的“if then else”條件判斷邏輯。這就意味著,在RTL-to-GDSII數(shù)字實(shí)現(xiàn)流程中,并非所有任務(wù)都適合用GPU來(lái)執(zhí)行。

通過(guò)GPU加速來(lái)加快布局過(guò)程

在數(shù)字設(shè)計(jì)流程中,自動(dòng)布局是一項(xiàng)已經(jīng)在GPU上得到充分應(yīng)用并顯示出巨大潛力的任務(wù)。新思科技的Fusion Compiler采用了GPU加速布局技術(shù),在商業(yè)環(huán)境下的原型測(cè)試中,相較于傳統(tǒng)CPU,已經(jīng)證明了其在縮短周轉(zhuǎn)時(shí)間方面的顯著優(yōu)勢(shì):

38秒即可完成一個(gè)3nm GPU流式多處理器設(shè)計(jì)的布局,其中包含140萬(wàn)個(gè)可布局標(biāo)準(zhǔn)單元和20個(gè)可布局硬宏,相比之下,CPU驅(qū)動(dòng)的布局需要13分鐘才能完成

82秒即可完成一個(gè)12nm汽車CPU設(shè)計(jì)的布局,其中包含290萬(wàn)個(gè)可布局標(biāo)準(zhǔn)單元和200個(gè)可布局硬宏,相比之下,CPU驅(qū)動(dòng)的布局需要19分鐘才能完成

結(jié)合新思科技AI驅(qū)動(dòng)的設(shè)計(jì)空間優(yōu)化解決方案DSO.ai,我們預(yù)計(jì)在保持相同完成時(shí)間線的前提下,將AI驅(qū)動(dòng)型搜索空間擴(kuò)大15至20倍。這一進(jìn)步有望幫助開(kāi)發(fā)團(tuán)隊(duì)在功耗、性能和面積(PPA)方面實(shí)現(xiàn)更卓越的設(shè)計(jì)成果。

在數(shù)字設(shè)計(jì)的多個(gè)實(shí)施步驟中,版圖規(guī)劃和布局對(duì)最終設(shè)計(jì)的功耗、性能和面積(PPA)有著重大影響,因此這兩個(gè)步驟是最需要進(jìn)行廣泛探索的環(huán)節(jié)。即便GPU計(jì)算資源通常與高性能CPU計(jì)算集群分離,我們也能預(yù)見(jiàn),在基于GPU的布局技術(shù)支持下,開(kāi)發(fā)者能夠高效完成工作。然而,在RTL-to-GDSII的整個(gè)實(shí)施流程中,如果其他環(huán)節(jié)存在即時(shí)或交替的GPU加速需求,設(shè)計(jì)數(shù)據(jù)在CPU與GPU集群之間的傳輸所引入的延遲,會(huì)對(duì)吞吐量產(chǎn)生影響。

新型數(shù)據(jù)中心SoC正在設(shè)計(jì)中引入CPU與GPU資源間的統(tǒng)一內(nèi)存,以處理TB級(jí)的工作負(fù)載。得益于這類新興架構(gòu),利用GPU加速時(shí)不再需要移動(dòng)設(shè)計(jì)數(shù)據(jù),我們也能進(jìn)一步思考GPU加速還可以應(yīng)用在數(shù)字設(shè)計(jì)流程的哪些其他方面。特別是當(dāng)開(kāi)發(fā)者能夠?qū)PU與AI驅(qū)動(dòng)的實(shí)施工具結(jié)合使用時(shí),那必將實(shí)現(xiàn)更快的探索、更廣的范圍以及更優(yōu)的結(jié)果。此外,新思科技的AI驅(qū)動(dòng)型全棧式EDA解決方案Synopsys.ai,能夠助力開(kāi)發(fā)者實(shí)現(xiàn)更佳的性能、功耗與面積(PPA)結(jié)果、更快達(dá)成目標(biāo)、并顯著提升開(kāi)發(fā)效率、實(shí)現(xiàn)更高的工程生產(chǎn)力,我們可以預(yù)見(jiàn)GPU加速技術(shù)的加入將進(jìn)一步革新芯片設(shè)計(jì)領(lǐng)域。

總結(jié)

在芯片設(shè)計(jì)流程的仿真階段,GPU的運(yùn)用已司空見(jiàn)慣,數(shù)字設(shè)計(jì)流程的其他部分也將逐漸展現(xiàn)出利用GPU加速的潛力。面對(duì)大型芯片或Multi-Die這類復(fù)雜架構(gòu),CPU在運(yùn)行RTL-to-GDSII流程時(shí)的算力已接近飽和,難以滿足所期望的處理速度。而GPU以其卓越的可擴(kuò)展性和處理能力,有望實(shí)現(xiàn)更快的設(shè)計(jì)周期和更佳的芯片性能。在使用GPU加速的布局工具進(jìn)行的原型設(shè)計(jì)測(cè)試中,布局速度已實(shí)現(xiàn)高達(dá)20倍的提升。隨著AI技術(shù)逐步融入EDA流程中,GPU的加入將顯著提升功耗、面積和性能(PPA)指標(biāo),同時(shí)縮短產(chǎn)品上市時(shí)間。

審核編輯:劉清
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • SoC設(shè)計(jì)
    +關(guān)注

    關(guān)注

    1

    文章

    151

    瀏覽量

    19548
  • 人工智能
    +關(guān)注

    關(guān)注

    1818

    文章

    50120

    瀏覽量

    265601
  • RTL
    RTL
    +關(guān)注

    關(guān)注

    1

    文章

    394

    瀏覽量

    62687
  • 數(shù)字芯片
    +關(guān)注

    關(guān)注

    1

    文章

    120

    瀏覽量

    19076
  • GPU芯片
    +關(guān)注

    關(guān)注

    1

    文章

    307

    瀏覽量

    6521

原文標(biāo)題:當(dāng)CPU算力趨近極限,GPU能否成為數(shù)字芯片設(shè)計(jì)的救星?

文章出處:【微信號(hào):Synopsys_CN,微信公眾號(hào):新思科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    “四合一”平臺(tái),芯片國(guó)產(chǎn)化率超九成,兼容8種國(guó)產(chǎn)AI芯片

    調(diào)度平臺(tái)可支持每天上億次的調(diào)用,能調(diào)度全國(guó)1/6的規(guī)模,網(wǎng)一體化效率提升20%。 ? 為什么要搭建這個(gè)“四
    的頭像 發(fā)表于 04-13 00:03 ?4036次閱讀

    中國(guó)芯片的拐點(diǎn)時(shí)刻

    作者|Taylor出品|芯片技術(shù)與工藝當(dāng)OpenAI的GPT-5在得克薩斯州的機(jī)房中晝夜轟鳴,當(dāng)Nvdia的H200芯片被炒至數(shù)十萬(wàn)美元仍一卡難求,中國(guó)的
    的頭像 發(fā)表于 01-31 07:00 ?1764次閱讀
    中國(guó)<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>芯片</b>的拐點(diǎn)時(shí)刻

    進(jìn)迭時(shí)空發(fā)布新一代RISC-V AI CPU芯片,滿足端側(cè)大模型需求

    FP8數(shù)據(jù)精度原生AI推理,還是首顆完整支持芯片級(jí)虛擬化的RISC-V產(chǎn)品。 ? 硬件配置上,K3配備8顆高性能X100大核,主頻2.4GHz,單核性能與ARM A76相當(dāng),60TOPS的AI
    的頭像 發(fā)表于 01-30 14:06 ?9183次閱讀

    GPU 利用率<30%?這款開(kāi)源智云平臺(tái)讓不浪費(fèi) 1%

    作為 AI 開(kāi)發(fā)者,你是否早已受夠這些困境:花數(shù)百萬(wàn)采購(gòu)的 GPU 集群,利用率常年低于 30%,閑置如同燒錢(qián);跨 CPU/GPU/NP
    的頭像 發(fā)表于 01-26 14:20 ?195次閱讀

    湘軍,讓變成生產(chǎn)?

    腦極體
    發(fā)布于 :2025年11月25日 22:56:58

    CPUGPU到NPU,美格智能持續(xù)優(yōu)化異構(gòu)計(jì)算效能

    前言AI已成為數(shù)字經(jīng)濟(jì)時(shí)代的核心生產(chǎn),但全球AI產(chǎn)業(yè)正面臨“供給不足、成本高企、生態(tài)待建”三重挑戰(zhàn)。據(jù)行業(yè)統(tǒng)計(jì),行業(yè)
    的頭像 發(fā)表于 11-21 16:05 ?1180次閱讀
    從<b class='flag-5'>CPU</b>、<b class='flag-5'>GPU</b>到NPU,美格智能持續(xù)優(yōu)化異構(gòu)<b class='flag-5'>算</b><b class='flag-5'>力</b>計(jì)算效能

    國(guó)產(chǎn)AI芯片真能扛住“內(nèi)卷”?海思昇騰的這波操作藏了多少細(xì)節(jié)?

    最近行業(yè)都在說(shuō)“是AI的命門(mén)”,但國(guó)產(chǎn)芯片真的能接住這波需求嗎? 前陣子接觸到海思昇騰910B,實(shí)測(cè)下來(lái)有點(diǎn)超出預(yù)期——7nm工藝下
    發(fā)表于 10-27 13:12

    與電力的終極博弈,填上了AIDC的“電力黑洞”

    ),專注于提供人工智能訓(xùn)練與推理所需的服務(wù)、數(shù)據(jù)服務(wù)和算法服務(wù)。AIDC采用異構(gòu)計(jì)算架構(gòu),結(jié)合GPU、FPGA、ASIC等多種AI加速芯片,形成高并發(fā)分布式系統(tǒng),以
    的頭像 發(fā)表于 09-22 02:43 ?8463次閱讀

    板卡:驅(qū)動(dòng)智能時(shí)代的核心引擎

    、科學(xué)計(jì)算等領(lǐng)域的核心硬件,支撐著現(xiàn)代數(shù)字化社會(huì)的運(yùn)轉(zhuǎn)。 板卡的核心作用 ? 板卡是一種專為高性能計(jì)算設(shè)計(jì)的硬件模塊,通常以加速卡的
    的頭像 發(fā)表于 08-01 10:25 ?1454次閱讀

    【「芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】+NVlink技術(shù)從應(yīng)用到原理

    前言 【「芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」書(shū)中的芯片知識(shí)是比較接近當(dāng)前
    發(fā)表于 06-18 19:31

    搭建中心,從了解的GPU 特性開(kāi)始

    ABSTRACT摘要本文介紹如何搭建,并介紹A100、H100、H200和B200這些GPU的特性。JAEALOT2025年4月23日隨著人工智能、大數(shù)據(jù)和高性能計(jì)算(HPC)的快速發(fā)展,市場(chǎng)上
    的頭像 發(fā)表于 04-24 11:08 ?3437次閱讀
    搭建<b class='flag-5'>算</b><b class='flag-5'>力</b>中心,從了解的<b class='flag-5'>GPU</b> 特性開(kāi)始

    芯片的生態(tài)突圍與革命

    據(jù)的爆發(fā)式增長(zhǎng),大芯片已成為科技競(jìng)爭(zhēng)的核心領(lǐng)域之一。 ? 大芯片的核心應(yīng)用場(chǎng)景豐富多樣。
    的頭像 發(fā)表于 04-13 00:02 ?3280次閱讀

    智能最具潛力的行業(yè)領(lǐng)域

    ?; 數(shù)據(jù)治理與聯(lián)合創(chuàng)新?:民生銀行與華為、阿里云等共建AI實(shí)驗(yàn)室,通過(guò)“數(shù)據(jù)湖+模型體系”提升服務(wù)精準(zhǔn)度?; 需求驅(qū)動(dòng)?:金融大模型推理對(duì)GPU
    的頭像 發(fā)表于 04-11 08:20 ?1429次閱讀
    智能<b class='flag-5'>算</b><b class='flag-5'>力</b>最具潛力的行業(yè)領(lǐng)域

    DeepSeek推動(dòng)AI需求:800G光模塊的關(guān)鍵作用

    和性能方面展現(xiàn)了出色的優(yōu)勢(shì),滿足當(dāng)前AI需求的快速增長(zhǎng)。 高可靠性: 光模塊經(jīng)過(guò)溫度、靜電放電及機(jī)械耐久性等嚴(yán)格測(cè)試,確保在數(shù)據(jù)中心乃至戶外等多種環(huán)境下均能保持穩(wěn)定表現(xiàn)。
    發(fā)表于 03-25 12:00