91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

奇異摩爾專(zhuān)用DSA加速解決方案重塑人工智能與高性能計(jì)算

奇異摩爾 ? 來(lái)源:奇異摩爾 ? 2024-09-19 11:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

寫(xiě)在開(kāi)頭,奇異摩爾的 NDSA 互聯(lián)系列產(chǎn)品基于高性能RoCEv2 RDMA引擎,是面向智算網(wǎng)絡(luò)通信加速及無(wú)損數(shù)據(jù)傳輸?shù)膶?zhuān)用DSA加速解決方案。

本文部分內(nèi)容來(lái)源于麥肯錫白皮書(shū)

隨著摩爾定律下的晶體管縮放速度放緩,單純依靠增加晶體管密度的通用計(jì)算的邊際效益不斷遞減,促使專(zhuān)用計(jì)算日益多樣化,于是,針對(duì)特定計(jì)算任務(wù)的專(zhuān)用架構(gòu)成為計(jì)算創(chuàng)新的焦點(diǎn)。

在過(guò)去的幾十年的時(shí)間里,半導(dǎo)體晶圓上的晶體管密度幾乎每?jī)赡攴环@一趨勢(shì)令人矚目。但在過(guò)去幾年中,晶體管縮放的速度顯著放緩,比摩爾定律預(yù)測(cè)的速度落后了大約十倍。

2018年,著名計(jì)算機(jī)架構(gòu)師約翰·亨尼斯西(John Hennessy)和大衛(wèi)·帕特森(David Patterson)在圖靈講座中指出,半導(dǎo)體工藝創(chuàng)新的放緩將逐漸增加對(duì)架構(gòu)創(chuàng)新的激勵(lì)——即集成電路的設(shè)計(jì)方式,以執(zhí)行計(jì)算任務(wù)。

“他們認(rèn)為,通用計(jì)算架構(gòu)(如CPU)固有的低效性將開(kāi)始被專(zhuān)門(mén)針對(duì)特定計(jì)算任務(wù)的架構(gòu)(也稱(chēng)為領(lǐng)域?qū)S眉軜?gòu),DSAs)的計(jì)算能力和成本效益所取代 。”

與此同時(shí),隨著計(jì)算和數(shù)字化在云計(jì)算(人工智能和高性能計(jì)算)、網(wǎng)絡(luò)、邊緣、物聯(lián)網(wǎng)(IoT)和自動(dòng)駕駛等眾多應(yīng)用領(lǐng)域中普及,高度領(lǐng)域?qū)S玫挠?jì)算工作負(fù)載正在為DSAs提供有意義的性能優(yōu)勢(shì)。大型語(yǔ)言模型(生成式AI的核心引擎),例如ChatGPT,在高容量的AI工作負(fù)載中提供了進(jìn)一步的專(zhuān)業(yè)化,這促進(jìn)了進(jìn)一步的硬件專(zhuān)業(yè)化。 DSA(domain-specific architecture)為特定應(yīng)用領(lǐng)域開(kāi)發(fā)的硬件和軟件的商業(yè)潛力是巨大的。專(zhuān)用的圖形處理單元 (GPU) 和張量處理單元 (TPU) 已經(jīng)在數(shù)據(jù)中心獲得了重要的市場(chǎng)份額,它們?cè)?AI 工作負(fù)載學(xué)習(xí)和推理方面的表現(xiàn)優(yōu)于 CPU。使用GPU和TPU對(duì)某些應(yīng)用的性能提升是非常顯著的,特定工作負(fù)載的可以實(shí)現(xiàn)15 到 50 倍的加速。此外,在汽車(chē)領(lǐng)域,來(lái)自領(lǐng)先供應(yīng)商的定制的專(zhuān)用于某些計(jì)算場(chǎng)景的DSA硬件也提供了安全支持日益提高的自動(dòng)駕駛水平所需的低延遲、高性能推理。

wKgaombrnnKAGY13AAKCgBR1DvE660.png

隨著 DSA 擴(kuò)展到其他應(yīng)用領(lǐng)域,麥肯錫咨詢(xún)估計(jì)到 2026 年,DSA 將占約 900 億美元的收入(約占全球半導(dǎo)體市場(chǎng)的 10% 至 15%),高于 2022 年的約 400 億美元。因此,我們看到在這個(gè)方向的硬件類(lèi)的風(fēng)險(xiǎn)投資顯著增加也就不足為奇了。

01 算力革命下的高性能網(wǎng)絡(luò)DSA

隨著人工智能及高性能計(jì)算的高速發(fā)展,服務(wù)器集群的瓶頸逐漸從單CPU、GPU、APU的算力轉(zhuǎn)換到硬件間的互聯(lián)能力。傳統(tǒng)的數(shù)據(jù)中心架構(gòu)中包含CPU、內(nèi)存、存儲(chǔ)和網(wǎng)絡(luò)等組件,但CPU目前已經(jīng)公認(rèn)不再是運(yùn)行基礎(chǔ)設(shè)施功能的最佳位置了。對(duì)于下一代數(shù)據(jù)中心而言,面向網(wǎng)絡(luò)加速的DSA將扮演重要的角色,根據(jù)不同應(yīng)用場(chǎng)景的需求,加速數(shù)據(jù)傳輸。同時(shí),以太網(wǎng)速度從25G增加到100G、200G、400G,再到800G,甚至還有持續(xù)增長(zhǎng)的趨勢(shì),超大規(guī)模數(shù)據(jù)中心的硬件架構(gòu)在逐漸轉(zhuǎn)變。

據(jù)估計(jì),對(duì)于超大規(guī)模數(shù)據(jù)中心來(lái)說(shuō),大約有一半的CPU被用在了非創(chuàng)收型任務(wù)上。網(wǎng)絡(luò)DSA可以承擔(dān)大部分繁重的工作,將CPU解放出來(lái),專(zhuān)注于創(chuàng)收的應(yīng)用處理上。同時(shí),由于功能和作用不同,北向網(wǎng)絡(luò)和高帶寬域在設(shè)計(jì)時(shí)側(cè)重點(diǎn)不同。北向網(wǎng)絡(luò)側(cè)重于網(wǎng)絡(luò)控制與管理,主要是網(wǎng)絡(luò)控制器與上層應(yīng)用之間的接口通信。高帶寬域網(wǎng)絡(luò)側(cè)重于數(shù)據(jù)傳輸性能,旨在提供高速度、低延遲的網(wǎng)絡(luò)連接?;赗oCE的RDMA技術(shù),兼容現(xiàn)有的以太網(wǎng)基礎(chǔ)設(shè)施,擁抱開(kāi)放生態(tài),是業(yè)界解決高帶寬域網(wǎng)絡(luò)與北向網(wǎng)絡(luò)數(shù)據(jù)傳輸?shù)闹匾鉀Q方案。

02 Chiplet設(shè)計(jì)方法與DSA的完美結(jié)合

結(jié)合Chiplet設(shè)計(jì)方法學(xué)與DSA的設(shè)計(jì),可以構(gòu)建出高效、靈活且高度定制化的計(jì)算平臺(tái)。Chiplet設(shè)計(jì)方法學(xué)通過(guò)將處理器設(shè)計(jì)拆分為多個(gè)獨(dú)立的Chiplet,每個(gè)Chiplet可以針對(duì)特定功能進(jìn)行優(yōu)化。這樣可以在設(shè)計(jì)、制造和測(cè)試中提高靈活性。同時(shí),不同的Chiplet分工明確,可以專(zhuān)門(mén)處理不同的任務(wù),例如CPU核心、內(nèi)存控制器、I/O接口等。而DSA針對(duì)特定計(jì)算任務(wù)進(jìn)行優(yōu)化,例如生成式人工智能、圖形處理、網(wǎng)絡(luò)處理等,相比于通用處理器,DSA在其特定領(lǐng)域內(nèi)具有更高的性能和能效比。

通過(guò)Chiplet方法學(xué),可以將多個(gè)DSA集成到一個(gè)系統(tǒng)中,創(chuàng)建一個(gè)高度定制化的平臺(tái)。比如,一個(gè)系統(tǒng)可以包含CPU、GPU、TPU、DPU等Chiplet,根據(jù)應(yīng)用需求靈活組合。在這一背景下,組件之間的高速可連接對(duì)于確保順利快速的數(shù)據(jù)傳輸至關(guān)重要?;ヂ?lián)標(biāo)準(zhǔn)、帶寬、延遲和低延遲是關(guān)鍵指標(biāo)。

03奇異摩爾NDSA網(wǎng)絡(luò)加速與無(wú)損數(shù)據(jù)傳輸解決方案

在智算中心領(lǐng)域,奇異摩爾 的NDSA互聯(lián)系列產(chǎn)品復(fù)用以太網(wǎng)基礎(chǔ)設(shè)施,基于高性能RoCEv2 RDMA引擎,面向智算網(wǎng)絡(luò)通信加速及無(wú)損數(shù)據(jù)傳輸?shù)膶?zhuān)用DSA加速解決方案。

AI原生智能網(wǎng)卡

奇異摩爾的Kiwi NDSA-SNIC AI原生智能網(wǎng)卡針對(duì)網(wǎng)絡(luò)數(shù)據(jù)傳輸,基于RoCE V2 RDMA技術(shù),自適應(yīng)網(wǎng)絡(luò)調(diào)度算法,搭載可編程加速核心SDPU,高達(dá)800G傳輸帶寬,實(shí)現(xiàn)Tb級(jí)萬(wàn)卡集群無(wú)損數(shù)據(jù)傳輸。

高性能網(wǎng)絡(luò)加速芯粒

奇異摩爾的高性能網(wǎng)絡(luò)加速芯粒 – Kiwi NDSA互聯(lián)芯粒針對(duì)高帶寬域數(shù)據(jù)傳輸,基于RoCEv2 RDMA技術(shù),單芯粒傳輸帶寬高達(dá)800G,攜帶UCIe-D2D芯??蓴U(kuò)展互聯(lián)接口,實(shí)現(xiàn)集群內(nèi)TB級(jí)的高速通信。

寫(xiě)在最后,無(wú)論是在高性能計(jì)算領(lǐng)域還是在人工智能領(lǐng)域,我們會(huì)預(yù)見(jiàn)更多加速數(shù)據(jù)傳輸?shù)腄SA問(wèn)世。它們通過(guò)提供高吞吐量效率,計(jì)算節(jié)點(diǎn)之間的超快速互連,或提升人工智能訓(xùn)練的效率,為半導(dǎo)體價(jià)值鏈的參與者及其客戶(hù)帶來(lái)更多的革新和挑戰(zhàn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    463

    文章

    54076

    瀏覽量

    466994
  • 人工智能
    +關(guān)注

    關(guān)注

    1819

    文章

    50145

    瀏覽量

    265808
  • 奇異摩爾
    +關(guān)注

    關(guān)注

    0

    文章

    80

    瀏覽量

    4046

原文標(biāo)題:Kiwi Talks | DSA專(zhuān)用領(lǐng)域芯片正在重塑人工智能與高性能計(jì)算

文章出處:【微信號(hào):奇異摩爾,微信公眾號(hào):奇異摩爾】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    自然智能與人工智能融合如何重塑芯片設(shè)計(jì)

    人類(lèi)大腦是所有處理器中最復(fù)雜的,能夠構(gòu)思出不可思議的創(chuàng)意,解決復(fù)雜、微妙的問(wèn)題。相比之下,人工智能擅長(zhǎng)快速分析海量數(shù)據(jù)并高效執(zhí)行任務(wù)。當(dāng)自然智能人工智能融合的結(jié)果,就是芯片設(shè)計(jì)領(lǐng)域正在經(jīng)歷一場(chǎng)令人驚嘆的變革。
    的頭像 發(fā)表于 01-15 13:58 ?561次閱讀

    奇異摩爾參編人工智能加速器互聯(lián)芯粒技術(shù)要求團(tuán)體標(biāo)準(zhǔn)發(fā)布

    近日,中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)批準(zhǔn)并發(fā)布了《人工智能超節(jié)點(diǎn)服務(wù)器技術(shù)要求》等28項(xiàng)團(tuán)體標(biāo)準(zhǔn)。其中由中國(guó)移動(dòng)研究院牽頭、奇異摩爾產(chǎn)品市場(chǎng)&研發(fā)部門(mén)主要參編的《人工智能
    的頭像 發(fā)表于 01-09 11:20 ?638次閱讀
    <b class='flag-5'>奇異</b><b class='flag-5'>摩爾</b>參編<b class='flag-5'>人工智能</b><b class='flag-5'>加速</b>器互聯(lián)芯粒技術(shù)要求團(tuán)體標(biāo)準(zhǔn)發(fā)布

    AMD攜全棧式AI解決方案亮相進(jìn)博會(huì),賦能人工智能+

    2025年11月5日,上海: 第八屆中國(guó)國(guó)際進(jìn)口博覽會(huì)在上海正式啟幕。作為全球高性能與自適應(yīng)計(jì)算領(lǐng)導(dǎo)者,AMD連續(xù)五年亮相進(jìn)博會(huì)。今年,以“AMD賦能人工智能+”為主題,AMD全面展示貫穿云、端
    的頭像 發(fā)表于 11-06 12:53 ?302次閱讀
    AMD攜全棧式AI<b class='flag-5'>解決方案</b>亮相進(jìn)博會(huì),賦能<b class='flag-5'>人工智能</b>+

    MT8391(Genio 720)參數(shù)規(guī)格書(shū) _AIoT高性能邊緣智能解決方案

    隨著物聯(lián)網(wǎng)技術(shù)的蓬勃發(fā)展和人工智能的廣泛應(yīng)用,智能設(shè)備正逐步邁向更高效、更智能的階段。而聯(lián)發(fā)科MT8391(Genio 720)平臺(tái)正是為滿(mǎn)足這一趨勢(shì)而打造的高性能邊緣
    的頭像 發(fā)表于 10-20 20:17 ?725次閱讀
    MT8391(Genio 720)參數(shù)規(guī)格書(shū) _AIoT<b class='flag-5'>高性能</b>邊緣<b class='flag-5'>智能解決方案</b>

    奇異摩爾Networking for AI生態(tài)沙龍成功舉辦

    近日,中國(guó)信息通信研究院華東分院與行業(yè)領(lǐng)先的AI網(wǎng)絡(luò)全棧式互聯(lián)產(chǎn)品及解決方案提供商——奇異摩爾聯(lián)合舉辦的“聚力向芯 算涌無(wú)界 Networking for AI”生態(tài)沙龍活動(dòng)在上海浦東成功舉辦。
    的頭像 發(fā)表于 10-09 12:45 ?834次閱讀

    Vicor高性能電源模塊在數(shù)據(jù)中心的應(yīng)用優(yōu)勢(shì)

    隨著人工智能(AI)在高性能計(jì)算中發(fā)揮越來(lái)越重要的作用,為能耗巨大的AI服務(wù)器提供高效、高性能的電源解決方案,變得至關(guān)重要。
    的頭像 發(fā)表于 09-29 16:50 ?1649次閱讀

    傲琪人工合成石墨片: 破解智能手機(jī)散熱困境的創(chuàng)新解決方案

    的突破 傲琪人工合成石墨片針對(duì)這些需求提供了全面解決方案。該材料采用先進(jìn)的高溫石墨化工藝制備,形成了高度取向的晶體結(jié)構(gòu),實(shí)現(xiàn)了卓越的面內(nèi)導(dǎo)熱性能。 與傳統(tǒng)金屬材料相比,石墨片在相同厚度下提供更優(yōu)的熱傳導(dǎo)
    發(fā)表于 09-13 14:06

    墨芯人工智能亮相2025外灘大會(huì)

    9月10日至13日,墨芯人工智能在2025外灘大會(huì)盛大亮相,成為"數(shù)據(jù)與計(jì)算展區(qū)"備受矚目的焦點(diǎn)之一。作為深耕稀疏計(jì)算的AI芯片企業(yè),墨芯在此次展會(huì)上全方位展示了其人工智能芯片、
    的頭像 發(fā)表于 09-11 14:04 ?835次閱讀

    兆芯攜手合作伙伴在WAIC 2025展示人工智能計(jì)算與決策解決方案

    2025世界人工智能大會(huì)近日在上海盛大開(kāi)幕。大會(huì)期間,兆芯攜手上交智算院、科算云共同呈現(xiàn)了基于自研CPU的人工智能計(jì)算與決策解決方案,展現(xiàn)了自主CPU技術(shù)與AI應(yīng)用的融合創(chuàng)新,激發(fā)新質(zhì)
    的頭像 發(fā)表于 08-04 10:12 ?1007次閱讀

    RISC-V+DSA:躍昉科技袁博滸解析芯算格局重塑的技術(shù)路徑

    《RISC-V+DSA重塑芯算格局的必然選擇》的主題演講,深入探討了RISC-V架構(gòu)與特定領(lǐng)域加速架構(gòu)(DSA)結(jié)合的技術(shù)路徑及其在高性能
    的頭像 發(fā)表于 07-23 10:32 ?851次閱讀
    RISC-V+<b class='flag-5'>DSA</b>:躍昉科技袁博滸解析芯算格局<b class='flag-5'>重塑</b>的技術(shù)路徑

    Axelera AI:邊緣計(jì)算加速智能創(chuàng)新解決方案

    。AxeleraAI憑借其卓越的AI加速解決方案,致力于協(xié)助企業(yè)快速部署高性能、低功耗的邊緣計(jì)算平臺(tái),廣泛應(yīng)用于智慧城市、智慧交通及工業(yè)檢測(cè)等領(lǐng)域。接下來(lái)說(shuō)明AxeleraAI產(chǎn)品特色
    的頭像 發(fā)表于 07-17 11:00 ?1094次閱讀
    Axelera AI:邊緣<b class='flag-5'>計(jì)算</b><b class='flag-5'>加速</b><b class='flag-5'>智能</b>創(chuàng)新<b class='flag-5'>解決方案</b>

    AI芯片:加速人工智能計(jì)算專(zhuān)用硬件引擎

    人工智能(AI)的快速發(fā)展離不開(kāi)高性能計(jì)算硬件的支持,而傳統(tǒng)CPU由于架構(gòu)限制,難以高效處理AI任務(wù)中的大規(guī)模并行計(jì)算需求。因此,專(zhuān)為AI優(yōu)化的芯片應(yīng)運(yùn)而生,成為推動(dòng)深度學(xué)習(xí)、
    的頭像 發(fā)表于 07-09 15:59 ?1707次閱讀

    最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門(mén)學(xué)習(xí)課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會(huì)發(fā)展的當(dāng)下,無(wú)論是探索未來(lái)職業(yè)方向,還是更新技術(shù)儲(chǔ)備,掌握大模型知識(shí)都已成為新時(shí)代的必修課。從職場(chǎng)上輔助工作的智能助手,到課堂用于學(xué)術(shù)研究的智能工具,大模
    發(fā)表于 07-04 11:10

    開(kāi)售RK3576 高性能人工智能主板

    ,HDMI-4K 輸出,支 持千兆以太網(wǎng),WiFi,USB 擴(kuò)展/重力感應(yīng)/RS232/RS485/IO 擴(kuò)展/I2C 擴(kuò)展/MIPI 攝像頭/紅外遙控 器等功能,豐富的接口,一個(gè)全新八核擁有超強(qiáng)性能人工智能
    發(fā)表于 04-23 10:55

    Cognizant將與NVIDIA合作部署神經(jīng)人工智能平臺(tái),加速企業(yè)人工智能應(yīng)用

    -Cognizant將與NVIDIA合作部署神經(jīng)人工智能平臺(tái),加速企業(yè)人工智能應(yīng)用 Cognizant將在關(guān)鍵增長(zhǎng)領(lǐng)域提供解決方案,包括企業(yè)級(jí)AI
    的頭像 發(fā)表于 03-26 14:42 ?775次閱讀
    Cognizant將與NVIDIA合作部署神經(jīng)<b class='flag-5'>人工智能</b>平臺(tái),<b class='flag-5'>加速</b>企業(yè)<b class='flag-5'>人工智能</b>應(yīng)用