91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

應(yīng)對端側(cè)AI算力、內(nèi)存、功耗“三堵墻”困境,安謀科技Arm China “周易”X3給出技術(shù)錦囊

21克888 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:綜合報(bào)道 ? 2025-12-18 13:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AI大模型正加速從云端向邊緣與端側(cè)滲透,然而,算力、內(nèi)存、功耗等卻成了制約其規(guī)?;涞氐摹案邏Α?。專為AI計(jì)算而生的神經(jīng)網(wǎng)絡(luò)處理器(NPU),成為破墻關(guān)鍵。安謀科技Arm China“周易”X3 NPU IP,通過架構(gòu)創(chuàng)新、軟硬件協(xié)同優(yōu)化與開放生態(tài)等,為應(yīng)對端側(cè)AI“算力墻”、“內(nèi)存墻”、“功耗墻”困境給出技術(shù)錦囊。



錦囊一:應(yīng)對“算力墻”,從“定點(diǎn)”到“浮點(diǎn)”,架構(gòu)升級與算力靈活配置

端側(cè)AI從CNN向Transformer遷移,對高精度浮點(diǎn)運(yùn)算的需求激增。傳統(tǒng)NPU受限于架構(gòu)適配性差、算力調(diào)度效率低等,難以滿足復(fù)雜AI場景的動態(tài)需求。為應(yīng)對大模型對端側(cè)算力的嚴(yán)苛需求,“周易”X3提供了高效的解決方案。

“周易”X3的破局之道在于底層架構(gòu)革新,它采用專為大模型而生的DSP+DSA全新架構(gòu),實(shí)現(xiàn)從定點(diǎn)轉(zhuǎn)向浮點(diǎn)計(jì)算,兼顧C(jī)NN與Transformer,解決了傳統(tǒng)NPU“偏科”問題。單Cluster可提供8-80 FP8 TFLOPS的靈活算力配置,能精準(zhǔn)匹配不同場景的多樣化算力需求。相較上一代產(chǎn)品,“周易”X3實(shí)現(xiàn)性能升級——AIGC大模型能力提升10倍、CNN模型性能提升30%-50%,充分釋放大模型算力潛能。

錦囊二:應(yīng)對“內(nèi)存墻”——高帶寬與智能存儲,提升內(nèi)存利用效率

大模型參數(shù)規(guī)模龐大,內(nèi)存帶寬與存儲壓力是另一大瓶頸。若無法高效處理數(shù)據(jù)讀寫與存儲,將導(dǎo)致AI任務(wù)卡頓與響應(yīng)延遲。“周易”X3通過多重技術(shù)升級應(yīng)對內(nèi)存挑戰(zhàn):

超高速數(shù)據(jù)通道:單Core帶寬高達(dá)256GB/s,能快速完成海量數(shù)據(jù)的讀寫,減少數(shù)據(jù)在內(nèi)存中的滯留時間。計(jì)算核心帶寬相較上一代提升4倍,可保障數(shù)據(jù)高效傳輸;

智能存儲架構(gòu):升級的L2 Memory存儲系統(tǒng)有效減少DDR訪存,提升數(shù)據(jù)吞吐效率;

硬件解壓引擎:集成自研解壓硬件WDC,使大模型Weight軟件無損壓縮后通過硬件解壓能額外獲得約15%的等效帶寬;

低精度加速模式:支持端側(cè)大模型運(yùn)行必備的W4A8/W4A16計(jì)算加速模式,兼顧存儲容量、帶寬與精度需求,在保證模型效果的前提下顯著提升計(jì)算效率。

實(shí)測數(shù)據(jù)顯示,多核算力線性度達(dá)70-80%、大模型Prefill階段利用率可達(dá)72%、Decode階段有效帶寬利用率突破100%[1],充分驗(yàn)證其內(nèi)存調(diào)度能力與系統(tǒng)協(xié)同優(yōu)化的卓越表現(xiàn)。

錦囊三:應(yīng)對“功耗墻”:極簡調(diào)度與按需供給,實(shí)現(xiàn)能效優(yōu)化

終端設(shè)備在有限電池容量和散熱條件下,亟需通過算力與能效的協(xié)同優(yōu)化,實(shí)現(xiàn)高性能AI任務(wù)與長續(xù)航的平衡。

“周易”X3集成AI專屬硬件引擎AIFF,搭配專用硬化調(diào)度器,能將CPU負(fù)載降至0.5%以下,且調(diào)度延遲極低。NPU在并行處理多項(xiàng)AI任務(wù)時,無需依賴CPU頻繁介入調(diào)度,顯著降低CPU與NPU間的通信開銷,從而降低系統(tǒng)功耗、有效延長設(shè)備續(xù)航時間。

此外,“周易”X3采用可擴(kuò)展的多核架構(gòu)及層次化的內(nèi)存互連架構(gòu),支持算力靈活裁剪和擴(kuò)展,系統(tǒng)可根據(jù)AI任務(wù)復(fù)雜度實(shí)現(xiàn)“按需供能”,有效降低無效計(jì)算與數(shù)據(jù)搬移,實(shí)現(xiàn)能源利用效率最大化。

Compass AI軟件平臺 助力全鏈路高效開發(fā)與部署

應(yīng)對端側(cè)AI“三堵墻”挑戰(zhàn),離不開軟硬件的深度協(xié)同?!爸芤住盭3配套的Compass AI軟件平臺憑借完善易用、開放生態(tài)、安全保障等多維優(yōu)勢,成為面對端側(cè)AI“三堵墻”困境的超強(qiáng)“金牌輔助”。

“周易” NPU Compass AI軟件平臺


Compass AI軟件平臺提供端到端統(tǒng)一工具鏈,可實(shí)現(xiàn)“一鍵部署,開箱即用”。原生支持Hugging Face、主流AI框架與OS,支持160+算子與270+模型,并對LLM/VLM/VLA及MoE等大模型推理進(jìn)行深度優(yōu)化,實(shí)現(xiàn)從CNN到Transformer模型的無縫接入,大幅降低模型部署門檻與成本。同時,平臺對量化算法的支持與具備的動態(tài)Shape能力,可在提升性能的同時有效降低功耗,避免無效計(jì)算。

此外,Compass AI軟件平臺提供多種軟件工具,并開放IR規(guī)格、開源量化工具等核心組件。開發(fā)者基于DSL編程語言,通過豐富的NN編譯器插件實(shí)現(xiàn)自定義算子,配合可視化調(diào)試工具,能夠?qū)崿F(xiàn)全鏈路可觀測、可優(yōu)化,極大提升不同場景下的開發(fā)效率,為端側(cè)AI的算力調(diào)度、功耗控制提供底層軟件支撐。

以自研IP產(chǎn)品矩陣 助推端側(cè)AI規(guī)?;涞?/strong>

在安謀科技“AI Arm CHINA”戰(zhàn)略指引下,公司將以AI為核心、Arm?生態(tài)為支撐、本土創(chuàng)新為根基,持續(xù)推進(jìn)“周易”NPU、“星辰”CPU、“山海”SPU和“玲瓏”多媒體處理器四大自研IP產(chǎn)品的研發(fā),與產(chǎn)業(yè)伙伴協(xié)同共建中國智能計(jì)算生態(tài),助推端側(cè)AI的規(guī)?;涞?。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    邊緣AI臨界點(diǎn):深度解析176TOPS香橙派AI Station的產(chǎn)業(yè)價值

    、內(nèi)存革命:48GB/96GB LPDDR4X 背后的帶寬博弈 很多開發(fā)者容易陷入唯論的誤區(qū),但在實(shí)際部署大模型時,內(nèi)存容量和帶寬往往是
    發(fā)表于 03-10 14:19

    科技:側(cè)NPU技術(shù)創(chuàng)新,拉動AI落地引擎

    X3 NPU IP以及生態(tài)建設(shè)、NPU發(fā)展趨勢等話題。 ? 圖:科技產(chǎn)品總監(jiān)鮑敏祺 ? 周易X3 NPU IP正當(dāng)時 ?
    的頭像 發(fā)表于 12-09 16:44 ?5923次閱讀
    <b class='flag-5'>安</b><b class='flag-5'>謀</b>科技:<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>NPU<b class='flag-5'>技術(shù)</b>創(chuàng)新,拉動<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>落地引擎

    科技“AI Arm CHINA”戰(zhàn)略,鏈接全球生態(tài)與本土創(chuàng)新

    的如醫(yī)療領(lǐng)域,新癌癥藥物研發(fā)速度較以往提升數(shù)十倍?!痹?1月20日ICCAD-Expo 2025上,科技Arm China CEO?陳鋒在演講中如是說。 ? 當(dāng)前中國
    的頭像 發(fā)表于 12-03 10:24 ?6274次閱讀

    引領(lǐng)側(cè)大模型落地!Firefly-RK182X 開發(fā)套件上線發(fā)售

    海量參數(shù)的大模型給AI行業(yè)帶來顛覆性的體驗(yàn),然而在側(cè)設(shè)備中,由于有限的DRAM帶寬、硬件、存儲容量
    的頭像 發(fā)表于 11-26 16:33 ?2323次閱讀
    引領(lǐng)<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>大模型落地!Firefly-RK182<b class='flag-5'>X</b> 開發(fā)套件上線發(fā)售

    架構(gòu)//軟件/應(yīng)用全面突破,科技Arm China用“周易X3破局端側(cè)AI

    高達(dá)39.6%。然而,當(dāng)大模型從云端向側(cè)滲透,瓶頸、能效矛盾、開發(fā)門檻成為制約側(cè)
    的頭像 發(fā)表于 11-21 08:52 ?7771次閱讀
    架構(gòu)/<b class='flag-5'>算</b><b class='flag-5'>力</b>/軟件/應(yīng)用全面突破,<b class='flag-5'>安</b><b class='flag-5'>謀</b>科技<b class='flag-5'>Arm</b> <b class='flag-5'>China</b>用“<b class='flag-5'>周易</b>”<b class='flag-5'>X3</b>破局端<b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>

    發(fā)布“周易X3 NPU,破局AI,智繪未來藍(lán)圖

    2025年11月13日,國內(nèi)領(lǐng)先的芯片IP設(shè)計(jì)與服務(wù)提供商科技Arm China,正式揭開了新一代NPU IP“周易
    的頭像 發(fā)表于 11-17 11:47 ?337次閱讀
    <b class='flag-5'>安</b><b class='flag-5'>謀</b>發(fā)布“<b class='flag-5'>周易</b>”<b class='flag-5'>X3</b> NPU,破局<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>,智繪未來藍(lán)圖

    矢量計(jì)算性能提升200%,STAR-MC3賦能側(cè)AI革命

    日益增長,推動芯片設(shè)計(jì)向更高能效、更強(qiáng)AI的方向演進(jìn)。 ? 就在近期,芯片IP設(shè)計(jì)與服務(wù)提供商科技(
    的頭像 發(fā)表于 10-27 09:11 ?2606次閱讀

    AI+MCU新選擇,科技“星辰”STAR-MC3問世

    日前,科技Arm China發(fā)布“星辰”STAR-MC3 CPU IP解析長圖,清晰展現(xiàn)了該產(chǎn)品的五大亮點(diǎn)、核心應(yīng)用領(lǐng)域與“星辰”CPU
    的頭像 發(fā)表于 10-23 16:01 ?322次閱讀
    <b class='flag-5'>AI</b>+MCU新選擇,<b class='flag-5'>安</b><b class='flag-5'>謀</b>科技“星辰”STAR-MC<b class='flag-5'>3</b>問世

    科技發(fā)布“星辰”STAR-MC3,提升MCU AI處理能力

    電子發(fā)燒友網(wǎng)綜合報(bào)道 2025年9月25日,科技正式推出自主研發(fā)的第代高能效嵌入式芯片IP——“星辰”STAR-MC3。該產(chǎn)品基于Arm
    的頭像 發(fā)表于 09-29 08:53 ?1.1w次閱讀
    <b class='flag-5'>安</b><b class='flag-5'>謀</b>科技發(fā)布“星辰”STAR-MC<b class='flag-5'>3</b>,提升MCU <b class='flag-5'>AI</b>處理能力

    AI防選什么主板?杰和IB3-761靠“精準(zhǔn)+多接口”出圈

    AI正加速智慧防落地,社區(qū)監(jiān)控要識別人形、防高空拋物,卻陷入兩難,選高力主板,會為冗余
    的頭像 發(fā)表于 09-22 16:45 ?21次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>安</b>防選什么主板?杰和IB<b class='flag-5'>3</b>-761靠“<b class='flag-5'>算</b><b class='flag-5'>力</b>精準(zhǔn)+多接口”出圈

    什么是AI模組?

    未來,騰視科技將繼續(xù)深耕AI模組領(lǐng)域,全力推動AI邊緣計(jì)算行業(yè)的深度發(fā)展。隨著AI技術(shù)的不斷
    的頭像 發(fā)表于 09-19 15:26 ?1765次閱讀
    什么是<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模組?

    什么是AI模組?

    未來,騰視科技將繼續(xù)深耕AI模組領(lǐng)域,全力推動AI邊緣計(jì)算行業(yè)的深度發(fā)展。隨著AI技術(shù)的不斷
    的頭像 發(fā)表于 09-19 15:25 ?841次閱讀
    什么是<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模組?

    2025側(cè)AI芯片爆發(fā):存一體、非Transformer架構(gòu)誰主浮沉?邊緣計(jì)算如何選型?

    各位技術(shù)大牛好!最近WAIC 2025上端側(cè)AI芯片密集發(fā)布,徹底打破傳統(tǒng)困局。各位大佬在實(shí)際項(xiàng)目中都是如何選型的呢?
    發(fā)表于 07-28 14:40

    側(cè)AI需求大爆發(fā)!科技發(fā)布新一代NPU IP,賦能AI終端應(yīng)用

    ,汽車自動駕駛的本地決策,都依賴提升,這對側(cè)AI SoC的性能帶來挑戰(zhàn),上游IP廠商的新品可以給SoC廠商帶來最新助力。 7月9日,在
    的頭像 發(fā)表于 07-11 01:16 ?8779次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>需求大爆發(fā)!<b class='flag-5'>安</b><b class='flag-5'>謀</b>科技發(fā)布新一代NPU IP,賦能<b class='flag-5'>AI</b>終端應(yīng)用

    蘋芯科技 N300 存一體 NPU,開啟側(cè) AI 新征程

    隨著側(cè)人工智能技術(shù)的爆發(fā)式增長,智能設(shè)備對本地與能效的需求日益提高。而傳統(tǒng)馮·諾依曼架構(gòu)在數(shù)據(jù)處理效率上存在瓶頸,“
    的頭像 發(fā)表于 05-06 17:01 ?1128次閱讀
    蘋芯科技 N300 存<b class='flag-5'>算</b>一體 NPU,開啟<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b> <b class='flag-5'>AI</b> 新征程