91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Arm 推出 Armv9 邊緣 AI 計(jì)算平臺(tái),以超高能效與先進(jìn) AI 能力賦能物聯(lián)網(wǎng)革新

晶芯觀察 ? 來源:電子發(fā)燒友 ? 作者:黃晶晶 ? 2025-03-06 11:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)當(dāng)下,快速發(fā)展的 AI 正不斷賦予邊緣設(shè)備越來越先進(jìn)的智能性,使邊緣設(shè)備勝任越來越重要的任務(wù)。為應(yīng)對(duì)邊緣側(cè)持續(xù)增長的 AI 需求,Arm 近日發(fā)布以全新基于 Armv9 架構(gòu)的超高能效 CPU——Arm Cortex-A320 以及對(duì) Transformer 網(wǎng)絡(luò)具有原生支持的 Ethos-U85 AI 加速器為核心的邊緣AI 計(jì)算平臺(tái),可支持運(yùn)行超 10 億參數(shù)的端側(cè) AI 模型。

wKgZO2fJN8-AZSrtAAJygK-Y8zE909.png

全新超高能效 Arm Cortex-A320 CPU 引領(lǐng)邊緣 AI 變革

據(jù) Arm 物聯(lián)網(wǎng)事業(yè)部業(yè)務(wù)拓展副總裁馬健分享,此次全新推出的 Cortex-A320 是 Arm 首個(gè)基于 Armv9 架構(gòu)的超高能效 CPU,為物聯(lián)網(wǎng)應(yīng)用專門優(yōu)化,將徹底變革邊緣 AI。在ML性能方面,Cortex-A320 相較于前代超高能效 CPU (Cortex-A35) 提升了高達(dá) 10 倍的 ML 計(jì)算能力。其能效較 Cortex-A520(Arm 的高能效 Armv9.2 CPU)提升了 50%,進(jìn)一步降低了功耗。在標(biāo)量計(jì)算性能方面,Cortex-A320 的性能比前代 Cortex-A35 提高了 30%,帶來了更強(qiáng)的通用計(jì)算能力。

wKgZPGfJN9iAAWfGAAPH-JZBfN8207.png

馬健指出,隨著對(duì)支持更大規(guī)模、多模態(tài) AI 模型的硬件需求不斷增長,系統(tǒng)的內(nèi)存需求也在迅速提升。因此,具備更高內(nèi)存訪問性能的系統(tǒng)變得尤為必要,以滿足更復(fù)雜的應(yīng)用場(chǎng)景。相比 Cortex-M,Cortex-A 處理器支持更大的可尋址內(nèi)存空間,并能夠更靈活地管理多層次內(nèi)存訪問延遲。

同時(shí),隨著邊緣 AI 負(fù)載變得越來越復(fù)雜,對(duì)更強(qiáng)大、更靈活的操作系統(tǒng)進(jìn)行系統(tǒng)管理的需求也在增加。而傳統(tǒng)的 Cortex-M 一般只能跑實(shí)時(shí)操作系統(tǒng),但功能豐富的操作系統(tǒng)可以使得設(shè)備管理更加靈活。

Cortex-A320 具備支持多種操作系統(tǒng)的能力,無論是如 FreeRTOS 和 Zephyr 的實(shí)時(shí)操作系統(tǒng) (RTOS),還是如 LinuxAndroid 的功能豐富的操作系統(tǒng),都能提供高效支持。與此同時(shí),憑借 Arm的 A處理器架構(gòu)優(yōu)勢(shì),Cortex-A320 可開箱即用地支持 Linux,并且能夠輕松移植安卓及其他現(xiàn)有的功能豐富的操作系統(tǒng)。此外,Cortex-A320 最高可支持四核共享集群,可根據(jù)不同需求靈活擴(kuò)展,滿足各種應(yīng)用場(chǎng)景的需求。

Cortex-A320 還為現(xiàn)有的物聯(lián)網(wǎng)領(lǐng)域的 Cortex-A 產(chǎn)品提供了靈活的升級(jí)路徑。無論是從 Cortex-A35 遷移,還是從全球出貨量最高的基于 Armv8 架構(gòu)的 Cortex-A 處理器 Cortex-A53 升級(jí),Cortex-A320 都提供了理想的 Armv9 遷移方案,并帶來了眾多優(yōu)勢(shì),包括更先進(jìn)的安全性、廣泛的 Armv9 軟件生態(tài)的支持,以及更高的計(jì)算性能。
wKgZPGfJN-CAcC5tAAKT-tLpwV0575.png

此外,隨著邊緣應(yīng)用場(chǎng)景日趨復(fù)雜,以及設(shè)備端軟件及數(shù)據(jù)價(jià)值日益凸顯,安全性問題比以往任何時(shí)候都更為關(guān)鍵,Cortex-A320 充分利用了 Armv9 增強(qiáng)的安全性和AI 計(jì)算特性。在安全性方面,Secure EL2 增強(qiáng)了 TrustZone 內(nèi)部的隔離性,支持更安全地運(yùn)行軟件容器。指針驗(yàn)證/分支目標(biāo)識(shí)別 (PACBTI)可有效緩解跳轉(zhuǎn)和返回編程中的指針安全隱患。內(nèi)存標(biāo)記擴(kuò)展 (MTE)通過內(nèi)存標(biāo)記機(jī)制,使黑客更難利用漏洞進(jìn)行攻擊,提高整體系統(tǒng)安全性。

AI 計(jì)算能力增強(qiáng)方面,Armv9 具有增強(qiáng)的 Neon 和可伸縮向量擴(kuò)展 (SVE2) 技術(shù),提供更高效的 ML 計(jì)算能力。其還支持例如 BFloat16 等新數(shù)據(jù)類型,提高 AI 計(jì)算的精度和能效。不僅如此,新增的矩陣乘法指令能夠優(yōu)化 AI 和 ML 計(jì)算性能,加速神經(jīng)網(wǎng)絡(luò)推理和訓(xùn)練任務(wù)。

Cortex-A320 Ethos-U85 深度配合,相得益彰

Arm Cortex-A320 CPU 和 Ethos-U85 NPU 是此次發(fā)布的邊緣 AI 計(jì)算平臺(tái)的兩大核心。該平臺(tái)具備強(qiáng)大的計(jì)算能力,比去年的基于 Cortex-M85 搭配 Ethos-U85 的平臺(tái)提升了8倍的 ML 計(jì)算性能,帶來了顯著的 AI 計(jì)算能力突破。

該邊緣 AI 計(jì)算平臺(tái)并不是 CPU 和 AI 加速器的簡(jiǎn)單堆疊,而是實(shí)現(xiàn)了深度配合,讓 CPU 和 NPU 相得益彰。馬健指出,去年 Arm 推出的集成了 Cortex-M85 和 Ethos-U85 的 Arm Corstone 物聯(lián)網(wǎng)參考設(shè)計(jì)平臺(tái),顯著提升了端側(cè) Transformer 網(wǎng)絡(luò)的執(zhí)行效率。隨著此次邊緣 AI 計(jì)算平臺(tái)的發(fā)布,Ethos-U85 驅(qū)動(dòng)程序已經(jīng)完成更新,使得 Cortex-A320 能夠直接驅(qū)動(dòng) Ethos-U85,無需額外搭載 Cortex-M。

Cortex-A320 可以為 Ethos-U85 提供更高的內(nèi)存容量與帶寬,讓大模型在 Ethos-U85 上的執(zhí)行如虎添翼;任何開發(fā)者們不希望在 Ethos-U85 上運(yùn)行的 AI 操作,可以回退到 Cortex-A320,利用其 Neon/SVE2 引擎更靈活有效地在 CPU 上執(zhí)行。例如,在連續(xù)圖像檢測(cè)任務(wù)中,通常會(huì)優(yōu)先在 AI 加速器上運(yùn)行,以提高能效。而對(duì)于單張圖像的處理,在 CPU 上執(zhí)行可能更高效。這使智能物聯(lián)網(wǎng)與消費(fèi)類電子生態(tài)系統(tǒng)能夠在正確的時(shí)間,并在合適的地方運(yùn)行最適合的工作負(fù)載。

將 Arm Kleidi 擴(kuò)展到物聯(lián)網(wǎng)

邊緣 AI 普及面臨的最主要障礙之一是軟件開發(fā)和部署的復(fù)雜性,這正是 Armv9 邊緣 AI 計(jì)算平臺(tái)軟件生態(tài)系統(tǒng)發(fā)揮優(yōu)勢(shì)的關(guān)鍵所在。去年,Arm 推出了 Kleidi 軟件庫,并將其引入了智能手機(jī)和服務(wù)器市場(chǎng),它包含優(yōu)化 AI 負(fù)載在 Arm CPU 上執(zhí)行的 KleidiAI 和加速機(jī)器視覺的 KleidiCV。如今,Arm 將 Kleidi 擴(kuò)展到了物聯(lián)網(wǎng)領(lǐng)域,以加速 AI 性能表現(xiàn)。

wKgZO2fJN-qAOP0AAAEyfYGhWpM463.png

KleidiAI 是一套專為 AI 框架開發(fā)者設(shè)計(jì)的計(jì)算內(nèi)核,讓開發(fā)者可以無縫地在 Arm CPU 上獲取最佳性能,適用于各類設(shè)備。它支持如 Neon 和 SVE2 等 Armv9 架構(gòu)的關(guān)鍵特性,大幅提升了 AI 的計(jì)算效率。此外,KleidiAI 已經(jīng)集成到多個(gè)主流 AI 框架,包括 Llama.cpp、ExecuTorch 和 LiteRT(通過 XNNPACK)它可以加速 Meta Llama 3 和 Phi-3 等主流AI 大模型,進(jìn)一步釋放 AI 計(jì)算性能。

更好地支持 Deepseek 等深度模型優(yōu)化

談及對(duì)AI推理應(yīng)用模型的支持,馬健表示:“在百模爭(zhēng)霸的時(shí)代,模型的架構(gòu)還在不斷地改變,一些新的數(shù)據(jù)可以讓模型變得更聰明或者有一些推理功能。深度的優(yōu)化也已經(jīng)開始熱火朝天地進(jìn)行起來了,DeepSeek 就是個(gè)非常好的例子。Deepseek 的 R1 模型已達(dá)到了 15 億參數(shù),跑在 Arm 全新的邊緣 AI 計(jì)算平臺(tái)上,理論上是綽綽有余的?!?br />
此外,馬健還表示,模型的大小有時(shí)候并不與 AI 加速器的 TOPS 直接相關(guān),而是更多受到內(nèi)存帶寬和內(nèi)存容量的限制。Arm 有一系列的 Cortex-A 處理器,從超高的性能到超高的能效。這一系列處理器可以有不同的內(nèi)存配置。不同的內(nèi)存配置可以適配不同大小的參數(shù)規(guī)模。

在AI時(shí)代,最重要的是更加貼近市場(chǎng)和應(yīng)用,從整體上來思考產(chǎn)業(yè)發(fā)展的趨勢(shì)和需求。Arm Cortex CPU 選擇豐富,能夠全面滿足邊緣 AI 應(yīng)用場(chǎng)景的需求,比如 Cortex-X925 適用于非常高端的機(jī)器人領(lǐng)域,而Cortex- A320用在對(duì)能效有極致追求的邊緣應(yīng)用。此外,NPU 方面在不久的未來也將會(huì)有AI新產(chǎn)品加入。

由此可以看到,Arm 早已在邊緣側(cè)進(jìn)行了前瞻性布局。此次發(fā)布的 Arm 邊緣 AI 計(jì)算平臺(tái)能高效執(zhí)行復(fù)雜的 AI 任務(wù),同時(shí)保證系統(tǒng)的安全性、可靠性和數(shù)據(jù)完整性。在 AI 推理時(shí)代,Arm 將繼續(xù)引領(lǐng)行業(yè)發(fā)展。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    135

    文章

    9553

    瀏覽量

    392016
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Arm解碼邊緣AI七大用例如何現(xiàn)實(shí)生活

    邊緣人工智能 (AI),即直接在產(chǎn)生數(shù)據(jù)的本地設(shè)備上集成 AI 能力,已不再是遙不可及的愿景,而是落地當(dāng)下的現(xiàn)實(shí)。這種技術(shù)支持端側(cè)本地處理,無需持續(xù)依賴云端,能夠滿足企業(yè)對(duì)更低時(shí)延、更
    的頭像 發(fā)表于 01-09 15:27 ?551次閱讀

    重磅合作!Quintauris 聯(lián)手 SiFive,加速 RISC-V 在嵌入式與 AI 領(lǐng)域落地

    之后,要打造的是高可靠性、高能還支持可擴(kuò)展的 RISC-V 設(shè)計(jì)方案。而且合作的核心目標(biāo)特別明確: 讓 RISC-V 處理器在嵌入式、聯(lián)網(wǎng)、AI
    發(fā)表于 12-18 12:01

    專為邊緣而生:深度解析昆侖芯K100 AI加速卡,釋放128 TOPS極致

    昆侖芯K100邊緣AI加速卡75W超低功耗實(shí)現(xiàn)128 TOPS的INT8算力,重新定義邊緣推理
    的頭像 發(fā)表于 12-14 11:12 ?2945次閱讀
    專為<b class='flag-5'>邊緣</b>而生:深度解析昆侖芯K100 <b class='flag-5'>AI</b>加速卡,釋放128 TOPS極致<b class='flag-5'>能</b><b class='flag-5'>效</b>

    AI儲(chǔ)管理系統(tǒng),通過AI模型提高能耗管理

    策略,難以應(yīng)對(duì)電力負(fù)荷波動(dòng)、可再生能源發(fā)電的不確定性以及復(fù)雜的市場(chǎng)電價(jià)。如今,鋇錸技術(shù)ARMxy系列邊緣計(jì)算網(wǎng)關(guān)為代表的硬件設(shè)備,通過深度融合人工智能技術(shù),為儲(chǔ)管理系統(tǒng)注入了全新的
    的頭像 發(fā)表于 11-05 17:52 ?814次閱讀

    Arm Flexible Access方案引入Armv9邊緣AI計(jì)算平臺(tái)

    全球首個(gè) Armv9 邊緣 AI 計(jì)算平臺(tái)(專為聯(lián)網(wǎng)
    的頭像 發(fā)表于 10-29 15:27 ?1058次閱讀

    此芯科技發(fā)布“合一”AI加速計(jì)劃,邊緣與端側(cè)AI創(chuàng)新

    此芯科技正式發(fā)布“合一”AI加速計(jì)劃,旨在為邊緣計(jì)算和端側(cè)AI場(chǎng)景提供高能的全棧算力解決方案。
    的頭像 發(fā)表于 09-15 11:53 ?2011次閱讀
    此芯科技發(fā)布“合一”<b class='flag-5'>AI</b>加速計(jì)劃,<b class='flag-5'>賦</b><b class='flag-5'>能</b><b class='flag-5'>邊緣</b>與端側(cè)<b class='flag-5'>AI</b>創(chuàng)新

    如何在基于Arm架構(gòu)的邊緣AI設(shè)備上部署飛槳模型

    當(dāng) Arm 與領(lǐng)先的開源深度學(xué)習(xí)平臺(tái)強(qiáng)強(qiáng)聯(lián)合,會(huì)帶來什么?那就是推動(dòng)創(chuàng)新的“火箭燃料”。Arm 攜手百度,利用雙方在高能
    的頭像 發(fā)表于 09-06 14:07 ?1107次閱讀

    AI 邊緣計(jì)算網(wǎng)關(guān):開啟智能新時(shí)代的鑰匙?—龍興聯(lián)

    順暢地通向云端,實(shí)現(xiàn)設(shè)備與云端之間高效的數(shù)據(jù)傳輸與交互。通過融合先進(jìn)邊緣計(jì)算和人工智能技術(shù),AI 邊緣
    發(fā)表于 08-09 16:40

    Arm 公司面向移動(dòng)端市場(chǎng)的 ?Arm Lumex? 深度解讀

    子系統(tǒng)(CSS)? ? 在移動(dòng)端的落地形態(tài),Lumex 旨在通過高度集成化的軟硬件方案,解決移動(dòng)設(shè)備在 AI 性能、比與開發(fā)效率上的挑戰(zhàn)。以下從技術(shù)架構(gòu)、性能突破、應(yīng)用場(chǎng)景、生態(tài)系統(tǒng)及戰(zhàn)略價(jià)值展開分析: 一、技術(shù)架構(gòu):異構(gòu)
    的頭像 發(fā)表于 05-29 09:54 ?4386次閱讀

    聯(lián)網(wǎng)工程師為什么要學(xué)Linux?

    均基于Linux二次開發(fā)。 2)邊緣計(jì)算AI整合 隨著邊緣智能設(shè)備的普及,Linux在輕量化AI模型部署(如TensorFlow Li
    發(fā)表于 05-26 10:32

    超低功耗Wi-Fi 6模塊聯(lián)網(wǎng):NRF7002

    高能特性為邊緣計(jì)算設(shè)備提供了理想的無線連接方案。 核心亮點(diǎn)與參數(shù)解析1. ?極致設(shè)計(jì)? P
    發(fā)表于 05-21 17:10

    AI邊緣計(jì)算網(wǎng)關(guān)_AI邊緣智能網(wǎng)關(guān)自助政務(wù)服務(wù)機(jī)_廈門計(jì)訊聯(lián)科技有限公司

    在數(shù)字化浪潮席卷全球的今天,政務(wù)服務(wù)智能化轉(zhuǎn)型已成為提升治理效能、優(yōu)化民生體驗(yàn)的關(guān)鍵舉措。計(jì)訊聯(lián)憑借深耕聯(lián)網(wǎng)領(lǐng)域的技術(shù)積淀,其自主研發(fā)的AI邊緣
    的頭像 發(fā)表于 05-19 18:08 ?585次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>邊緣</b><b class='flag-5'>計(jì)算</b>網(wǎng)關(guān)_<b class='flag-5'>AI</b><b class='flag-5'>邊緣</b>智能網(wǎng)關(guān)<b class='flag-5'>賦</b><b class='flag-5'>能</b>自助政務(wù)服務(wù)機(jī)_廈門計(jì)訊<b class='flag-5'>物</b>聯(lián)科技有限公司

    Nordic nRF54 系列芯片:開啟 AI聯(lián)網(wǎng)新時(shí)代?

    。? nRF54H20:?的強(qiáng)勁引擎? nRF54H20 作為 nRF54 系列的杰出代表,超低功耗和強(qiáng)大處理能力AI 機(jī)器學(xué)習(xí)應(yīng)用中嶄露頭角。它集成了多個(gè) Arm Cortex
    發(fā)表于 04-01 00:18

    Banana Pi 發(fā)布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計(jì)算與嵌入式開發(fā)

    架構(gòu),多場(chǎng)景應(yīng)用 BPI-AI2N 采用 RZ/V2N 處理器,集成 4 核 Arm? Cortex?-A55(1.8GHz)與 Cortex?-M33(200MHz),提供強(qiáng)勁的
    發(fā)表于 03-19 17:54

    Firefly 推出 NVIDIA Jetson 系列產(chǎn)品,邊緣計(jì)算行業(yè)

    產(chǎn)品,卓越的邊緣計(jì)算能力比,為AI大模型在
    的頭像 發(fā)表于 03-12 16:32 ?1403次閱讀
    Firefly <b class='flag-5'>推出</b> NVIDIA Jetson 系列產(chǎn)品,<b class='flag-5'>賦</b><b class='flag-5'>能</b><b class='flag-5'>邊緣</b><b class='flag-5'>計(jì)算</b>行業(yè)