91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Arm發(fā)布基于Armv9架構(gòu)的Cortex-A320處理器

Arm社區(qū) ? 來(lái)源:Arm社區(qū) ? 2025-02-27 17:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Arm 物聯(lián)網(wǎng)事業(yè)部高級(jí)產(chǎn)品經(jīng)理 Dimosthenis Rossidis

在當(dāng)前持續(xù)演進(jìn)的物聯(lián)網(wǎng) (IoT) 環(huán)境中,軟件復(fù)雜性不斷增加,邊緣設(shè)備因而需要更勝以往的性能、能效和安全性。Arm Cortex-A 系列產(chǎn)品通過(guò)為功率有限的設(shè)備帶來(lái)先進(jìn)的計(jì)算功能,進(jìn)而滿足這一需求,并為多樣化的市場(chǎng)提供增強(qiáng)的人工智能 (AI) 處理能力、強(qiáng)大的安全性和優(yōu)化的能效。Cortex-A3xx 系列專為包括消費(fèi)類電子設(shè)備和云服務(wù)等在內(nèi)的各種細(xì)分市場(chǎng)提供超高能效解決方案和優(yōu)化的性能。更重要的是,該系列 CPU 為快速增長(zhǎng)的高度多樣化物聯(lián)網(wǎng)市場(chǎng)提供了性能強(qiáng)勁且可擴(kuò)展的解決方案,使其成為邊緣 AI 應(yīng)用的理想之選。

邊緣 AI 需要更卓越的計(jì)算性能、更強(qiáng)大的安全性,以及更出色的軟件靈活性。隨著軟件愈發(fā)復(fù)雜化,Armv9 架構(gòu)應(yīng)運(yùn)而生,以提供先進(jìn)的機(jī)器學(xué)習(xí) (ML) 和 AI 功能,并具備增強(qiáng)的安全特性。該架構(gòu)現(xiàn)已在 Cortex-A3xx 的超高能效系列實(shí)現(xiàn),為新一代邊緣 AI 應(yīng)用夯實(shí)根基。

Cortex-A320:最小型的 Armv9 架構(gòu)實(shí)現(xiàn)

Arm 今日發(fā)布的 Cortex-A320 是首款基于 Armv9 架構(gòu)的超高能效 Cortex-A 處理器。這是一款基于 Armv9.2-A 架構(gòu)的 AArch64 CPU。其微架構(gòu)源自 Cortex-A520,并經(jīng)過(guò)顯著優(yōu)化,以改善面積和功耗。

Cortex-A320 的能效相較 Cortex-A520 提高了 50% 以上。這一提升是通過(guò)多次微架構(gòu)的更新而實(shí)現(xiàn),其中包括窄取和解碼數(shù)據(jù)路徑、密集存儲(chǔ)的 L1 緩存、縮減端口的整數(shù)寄存器文件等優(yōu)化。

得益于高能效的分支預(yù)測(cè)器和預(yù)取器,以及內(nèi)存系統(tǒng)的提升等微架構(gòu)上的顯著創(chuàng)新,Cortex-A320 在 SPECINT2K6 基準(zhǔn)測(cè)試中的標(biāo)量性能相比其前代產(chǎn)品 Cortex-A35 提升了 30% 以上。

更重要的是,通過(guò)集成增強(qiáng)的Armv9 的 Neon 和 SVE2 向量處理技術(shù),在 INT8 通用矩陣乘法 (GEMM) 中測(cè)得 Cortex-A320 的 ML 處理能力比 Cortex-A35 高出至多 10 倍。此外,通過(guò)對(duì) BF16 等新的數(shù)據(jù)類型、新的點(diǎn)積和矩陣乘法指令的支持,Cortex-A320 的 ML 性能比目前全球最受歡迎的 Armv8-A CPU Cortex-A53 高出至多六倍。

Cortex-A320 在 ML 能力的大幅提升,以及極高的面積能效比,使其在 ML 應(yīng)用中成為最高能效的 Cortex-A CPU 核心。

與 Arm Cortex-M 處理器相比,Cortex-A320 的 ML 性能同樣提高了數(shù)倍。例如,在 GEMM 性能方面,Cortex-A320 相較目前性能最高的 Cortex-M CPU (Cortex-M85) 提高了八倍。這種性能提升不僅歸功于 Armv9 架構(gòu)在 AI 處理上的增強(qiáng),還源于 Cortex-A320 內(nèi)存訪問(wèn)性能的大幅提高和頻率的增加。

與此同時(shí),得益于 Arm 的 A 處理器架構(gòu)、多核執(zhí)行,以及靈活的內(nèi)存管理,這使 Cotex-A320 成為 Cortex-M 系列微處理器進(jìn)行性能升級(jí)的合適選項(xiàng)。

通過(guò)微架構(gòu)優(yōu)化,實(shí)現(xiàn)更高能效

Cortex-A320 是一款單發(fā)射、32 位指令取指的有序執(zhí)行 CPU,實(shí)現(xiàn)了優(yōu)化的八級(jí)管線,且具有緊湊的轉(zhuǎn)發(fā)網(wǎng)絡(luò),從而達(dá)到比 Cortex-A520 更高的頻點(diǎn)。

Cortex-A320 提供從單核到四核配置的集群內(nèi)擴(kuò)展。該 CPU 所采用的簡(jiǎn)化 DynamIQ Shared Unit (DSU) DSU-120T,可支持僅使用 Cortex-A320 的集群。DSU-120T 是最小的 DSU 實(shí)現(xiàn),能夠顯著降低復(fù)雜性、面積和功耗,進(jìn)而大幅提升基于 Cortex-A 的入門系列產(chǎn)品的能效。

Cortex-A320 支持高達(dá) 64KB 的 L1 緩存和高達(dá) 512KB 的 L2 緩存,并且具有可連接到外部存儲(chǔ)器的 256 位 AMBA5 AXI 接口。L2 緩存和 L2 TLB 可以在 Cortex-A320 CPU 之間共享,而實(shí)現(xiàn) Neon 和 SVE2 SIMD 技術(shù)的向量處理單元既可在單核復(fù)合體中專用,也可在雙核或四核實(shí)現(xiàn)中由兩個(gè)核共享。

針對(duì)不同市場(chǎng)的多樣化優(yōu)勢(shì)

得益于廣泛的開(kāi)源 Linux 支持、強(qiáng)大的安全生態(tài)系統(tǒng),以及 Armv9 架構(gòu)所取得的關(guān)鍵進(jìn)展,Cortex-A320 可確保與邊緣側(cè)和基礎(chǔ)設(shè)施設(shè)備兼容,同時(shí)具備出色能效和可擴(kuò)展性。

Neon 和 SVE2 向量處理技術(shù)更新提升了 ML 性能,除此之外,Armv9 架構(gòu)還大大增強(qiáng)了安全性,這對(duì)于物聯(lián)網(wǎng)和嵌入式系統(tǒng)至關(guān)重要。Cortex-A320 為 Cortex-A 的超高能效系列引入了重要的安全特性,包括增強(qiáng)內(nèi)存安全性的內(nèi)存標(biāo)記擴(kuò)展 (MTE),以及可減少跳轉(zhuǎn)導(dǎo)向編程和返回導(dǎo)向編程攻擊的指針驗(yàn)證 (PAC) 和分支目標(biāo)識(shí)別 (BTI)。

Secure EL2 是 Cortex-A320 所采用的其中一項(xiàng) Armv9 關(guān)鍵特性,通過(guò)增強(qiáng) TrustZone 中的軟件隔離,有助于在邊緣設(shè)備上安全執(zhí)行軟件容器。

從入門級(jí)通用 MPU、智能揚(yáng)聲器、軟件定義智能攝像頭,到工廠車間內(nèi)的自動(dòng)駕駛車輛、自動(dòng)化邊緣 AI 助手、AI 人機(jī)界面和機(jī)器人控制器,Cortex-A320 可在廣泛的應(yīng)用中發(fā)揮上述優(yōu)勢(shì)。除邊緣 AI 應(yīng)用外,Cortex-A320 還可惠及包括智能手表和智能可穿戴設(shè)備,以及服務(wù)器基板管理控制器 (BMC) 等基礎(chǔ)設(shè)施設(shè)備在內(nèi)的眾多關(guān)鍵細(xì)分市場(chǎng)。

Cortex-A320 也非常適合于以往使用高性能 Cortex-M 的應(yīng)用,如電池供電的 MCU 用例或運(yùn)行實(shí)時(shí)操作系統(tǒng) (RTOS) 的應(yīng)用,這些應(yīng)用需要通過(guò)對(duì)稱多處理來(lái)擴(kuò)展性能,而 Arm 的 A 處理器架構(gòu)開(kāi)箱即支持。

此外,它還可用于需要 Cortex-A 內(nèi)存管理或地址轉(zhuǎn)換特性的 RTOS 應(yīng)用,以增強(qiáng)軟件的靈活性。例如,Cortex-A320 適合于需要在 MCU 設(shè)備上下載應(yīng)用的用例,由于其需要內(nèi)存管理單元 (MMU) 來(lái)跨內(nèi)存映射進(jìn)行代碼重新定位。

與此同時(shí),更寬的尋址空間使得 Cortex-A320 成為異構(gòu)多核用例的高能效解決方案,在這些用例中,性能更高的 Cortex-A 與微控制器級(jí)核心相結(jié)合。借助 Cortex-A320,Arm 的合作伙伴能夠?qū)⑿⌒图軜?gòu)兼容的核心搭配較大的 Cortex-A 處理器,從而簡(jiǎn)化內(nèi)存架構(gòu)。

另一方面,由于其所具備的 A 處理器架構(gòu)特性,Cortex-A320 可以提供開(kāi)箱即用的 Linux 支持,并為安卓系統(tǒng)等現(xiàn)有的功能豐富的操作系統(tǒng)提供軟件可移植性。Cortex-A320 具備出色的靈活性,適用于眾多細(xì)分市場(chǎng)、應(yīng)用和操作系統(tǒng)。

引入 Armv9 邊緣 AI 異構(gòu)計(jì)算平臺(tái)

Arm Ethos-U85 NPU 旨在應(yīng)對(duì) Cortex-A 系統(tǒng)中的常見(jiàn)高延遲內(nèi)存,并與 Cortex-A320 處理器協(xié)作良好。

Ethos-U85 驅(qū)動(dòng)程序已完成更新,該 NPU 現(xiàn)可直接由 Cortex-A320 驅(qū)動(dòng),而無(wú)需基于 Cortex-M 的 ML 島。這一更新不僅改善了延遲,還為 Arm 的合作伙伴免去了使用 Cortex-M 來(lái)驅(qū)動(dòng) NPU 的成本和復(fù)雜性。

此外,Cortex-A320 的內(nèi)存訪問(wèn)性能和增強(qiáng)的內(nèi)存系統(tǒng)使其能夠執(zhí)行更大規(guī)模的 ML 模型,例如超過(guò) 10 億個(gè)參數(shù)的大語(yǔ)言模型 (LLM)。由于可尋址內(nèi)存空間有限,這些模型很難在基于 Cortex-M 的系統(tǒng)上高效運(yùn)行。

Ethos-U NPU 通過(guò)量化數(shù)據(jù)類型,來(lái)滿足邊緣 AI 用例有限的成本和能耗要求。Ethos-U85 不支持的 ML 算子和數(shù)據(jù)類型都將自動(dòng)回調(diào)到 Cortex-A320 上進(jìn)行處理,并利用 Neon/SVE2 引擎進(jìn)行加速。

Armv9 架構(gòu)實(shí)現(xiàn)了顯著的 ML 性能提升,得益于此,在 2GHz 頻率下運(yùn)行,以 8 位 MAC/周期測(cè)得,四核 Cortex-A320 可以執(zhí)行高達(dá) 256 GOPS。因此,無(wú)需外部加速器,Cortex-A320 便可直接在 CPU 上運(yùn)行高級(jí) ML 和 AI 用例。這為針對(duì)各種 ML 和 AI 應(yīng)用的設(shè)備節(jié)省了系統(tǒng)面積、功耗和復(fù)雜性,并帶來(lái)最高可達(dá) 0.25 TOP 的表現(xiàn)。

邊緣 AI 新時(shí)代未來(lái)可期

Cortex-A320 將 Armv9 架構(gòu)的安全性和卓越的 AI 性能引入了 Cortex-A 的超高能效系列,為軟件開(kāi)發(fā)者提供了開(kāi)發(fā)和部署更嚴(yán)苛用例的新可能,開(kāi)創(chuàng)了邊緣 AI 設(shè)備的新時(shí)代。通過(guò)結(jié)合 Arm 的 A 處理器架構(gòu)及相關(guān)的軟件生態(tài)系統(tǒng),并在高能效和靈活性支持下,Cortex-A320 為物聯(lián)網(wǎng)領(lǐng)域的各個(gè)細(xì)分市場(chǎng)提供了卓越的可擴(kuò)展性和多樣化。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    135

    文章

    9552

    瀏覽量

    391838
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11277

    瀏覽量

    224948
  • 物聯(lián)網(wǎng)
    +關(guān)注

    關(guān)注

    2945

    文章

    47818

    瀏覽量

    414820

原文標(biāo)題:詳解 Arm Cortex-A320,針對(duì)物聯(lián)網(wǎng)優(yōu)化的超高能效 Armv9 CPU

文章出處:【微信號(hào):Arm社區(qū),微信公眾號(hào):Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Cortex-M0 處理器介紹

    功耗的32位處理器。 Cortex-M0是Cortex-M家族中的M0系列。最大特點(diǎn)是低功耗的設(shè)計(jì)。Cortex-M0為32位、3級(jí)流水線RISC
    發(fā)表于 01-16 08:04

    GM9-3003-20龍芯3A6000處理器,自主架構(gòu)引領(lǐng)工業(yè)算力?

    3A6000處理器,以全棧國(guó)產(chǎn)化設(shè)計(jì)、強(qiáng)勁算力與豐富擴(kuò)展接口,為工業(yè)場(chǎng)景提供高可靠、高安全的計(jì)算平臺(tái),徹底擺脫對(duì)進(jìn)口芯片的依賴。 ?****核心性能:龍芯 3A6000處理器,自主
    的頭像 發(fā)表于 01-13 16:52 ?1421次閱讀
    GM<b class='flag-5'>9</b>-3003-20龍芯3<b class='flag-5'>A</b>6000<b class='flag-5'>處理器</b>,自主<b class='flag-5'>架構(gòu)</b>引領(lǐng)工業(yè)算力?

    Genio 720處理器規(guī)格參數(shù)_MTK8391高算力核心板方案

    Genio 720(MT8391)處理器規(guī)格參數(shù),采用先進(jìn)的6nm制程工藝,兼顧高性能與低功耗,適配無(wú)風(fēng)扇設(shè)計(jì)及電池供電移動(dòng)設(shè)備需求。CPU架構(gòu):八核處理器,包含2顆Arm
    的頭像 發(fā)表于 01-12 19:57 ?280次閱讀
    Genio 720<b class='flag-5'>處理器</b>規(guī)格參數(shù)_MTK8391高算力核心板方案

    Arm Flexible Access方案引入Armv9邊緣AI計(jì)算平臺(tái)

    全球首個(gè) Armv9 邊緣 AI 計(jì)算平臺(tái)(專為物聯(lián)網(wǎng)及邊緣 AI 工作負(fù)載優(yōu)化)將納入 Arm Flexible Access 方案,助力創(chuàng)新者以低成本、便捷的方式,在邊緣側(cè)獲得先進(jìn)的 AI 性能與安全保障
    的頭像 發(fā)表于 10-29 15:27 ?1044次閱讀

    基于蜂鳥E203架構(gòu)的指令集K擴(kuò)展

    向量操作指令,例如向量加法、向量乘法等。 在蜂鳥E203架構(gòu)中,可以添加K擴(kuò)展指令集,以處理大規(guī)模的數(shù)據(jù)集,可以添加以下指令: 1.VADD:向量加法指令,將兩個(gè)向量相加并存儲(chǔ)結(jié)果到一個(gè)向量寄存
    發(fā)表于 10-21 09:38

    迅為Hi3403V610開(kāi)發(fā)板海思Cortex-A55架構(gòu)核心板卡

    迅為電子重磅推出基于海思Hi3403處理器的高性能核心板,采用先進(jìn)的四核Cortex-A55架構(gòu),主頻高達(dá)1.4GHz,以強(qiáng)勁算力、超凡能效比與卓越的圖像處理能力,為千行百業(yè)的智能化升
    的頭像 發(fā)表于 09-30 14:18 ?686次閱讀
    迅為Hi3403V610開(kāi)發(fā)板海思<b class='flag-5'>Cortex-A</b>55<b class='flag-5'>架構(gòu)</b>核心板卡

    Texas Instruments DRA821x Jacinto? 64位處理器技術(shù)解析

    Texas Instruments DRA821x Jacinto? 64位處理器基于ARM?v8架構(gòu),并為帶有云連接性的網(wǎng)關(guān)系統(tǒng)進(jìn)行了優(yōu)化。片上系統(tǒng) (SoC) 設(shè)計(jì)通過(guò)集成降低了系統(tǒng)級(jí)成本
    的頭像 發(fā)表于 08-28 11:33 ?1083次閱讀
    Texas Instruments DRA821x Jacinto? 64位<b class='flag-5'>處理器</b>技術(shù)解析

    德州儀器AM68x Jacinto 8處理器技術(shù)解析

    Texas Instruments AM68x 64位Jacinto? 8 TOPS Vision SoC處理器是一款基于Eval Jacinto 7架構(gòu)的可擴(kuò)展處理器。該系列面向智能視覺(jué)攝像機(jī)
    的頭像 發(fā)表于 08-27 15:08 ?1110次閱讀
    德州儀器AM68x Jacinto 8<b class='flag-5'>處理器</b>技術(shù)解析

    國(guó)產(chǎn)信創(chuàng)工業(yè)計(jì)算機(jī)海光3350處理器集特IPC-660工控機(jī)

    國(guó)產(chǎn)信創(chuàng)新標(biāo)桿:集特IPC-660工控機(jī)搭載海光3350賦能工業(yè)自主化在工業(yè)4.0與信創(chuàng)國(guó)產(chǎn)化雙軌并行的時(shí)代,海光3350處理器憑借自主可控的x86架構(gòu)與工業(yè)級(jí)高性能,正成為關(guān)鍵基礎(chǔ)設(shè)施的核心算力
    的頭像 發(fā)表于 06-24 15:32 ?2801次閱讀
    國(guó)產(chǎn)信創(chuàng)工業(yè)計(jì)算機(jī)海光3350<b class='flag-5'>處理器</b>集特IPC-660工控機(jī)

    基于RK3576處理器,EASY EAI Orin Nano開(kāi)發(fā)板免費(fèi)試用

    EASY EAI Orin Nano是廣州靈眸科技有限公司的旗艦級(jí)硬件產(chǎn)品?;谌鹦疚⒌腞K3576處理器設(shè)計(jì),集成了4個(gè)Cortex-A72和4個(gè)Cortex-A53及支持NEON指令集,支持
    的頭像 發(fā)表于 06-09 15:01 ?1411次閱讀
    基于RK3576<b class='flag-5'>處理器</b>,EASY EAI Orin Nano開(kāi)發(fā)板免費(fèi)試用

    在IAR Embedded Workbench for Arm中使用Arm Cortex-R52 NEON

    隨著嵌入式系統(tǒng)變得越來(lái)越智能,對(duì)嵌入式處理器的要求也越來(lái)越高。為了更好應(yīng)對(duì)汽車、醫(yī)療和工業(yè)機(jī)器人等領(lǐng)域?qū)η度胧?b class='flag-5'>處理器的要求,Arm推出了采用Armv8-R
    的頭像 發(fā)表于 06-05 09:57 ?1860次閱讀
    在IAR Embedded Workbench for <b class='flag-5'>Arm</b>中使用<b class='flag-5'>Arm</b> <b class='flag-5'>Cortex</b>-R52 NEON

    MT8768處理器規(guī)格參數(shù)_MTK8768聯(lián)發(fā)科安卓核心板定制開(kāi)發(fā)

    先進(jìn)制程工藝,搭載八核ARM Cortex-A53架構(gòu),主頻高達(dá)2.0GHz,運(yùn)行穩(wěn)定且高效,支持Android 11操作系統(tǒng),成為低功耗和高性能應(yīng)用的理想選擇。
    的頭像 發(fā)表于 05-29 19:59 ?2714次閱讀
    MT8768<b class='flag-5'>處理器</b>規(guī)格參數(shù)_MTK8768聯(lián)發(fā)科安卓核心板定制開(kāi)發(fā)

    ARM服務(wù)解決方案

    可控制在15W以下,較x86架構(gòu)能效比提升50%以上,尤其適合邊緣計(jì)算和輕量級(jí)并發(fā)場(chǎng)景。 彈性擴(kuò)展能力? 模塊化設(shè)計(jì)支持通過(guò)增減處理器節(jié)點(diǎn)快速調(diào)整算力,硬件成本較x86架構(gòu)低30%-40%,結(jié)合容器化技術(shù)實(shí)現(xiàn)動(dòng)態(tài)資源調(diào)配。 異構(gòu)
    的頭像 發(fā)表于 05-16 07:44 ?1098次閱讀
    <b class='flag-5'>ARM</b>服務(wù)<b class='flag-5'>器</b>解決方案

    iTOP-3588開(kāi)發(fā)板采用瑞芯微RK3588處理器四核心架構(gòu)GPU內(nèi)置獨(dú)立NPU強(qiáng)大的視頻編解碼

    性能強(qiáng) iTOP-3588開(kāi)發(fā)板采用瑞芯微RK3588處理器,是全新- -代AloT高端 應(yīng)用芯片,采用8nm LP制程,搭載八核64位CPU,四核Cortex-A76 和四核Cortex-A
    發(fā)表于 04-09 16:09

    Arm 推出 Armv9 邊緣 AI 計(jì)算平臺(tái),以超高能效與先進(jìn) AI 能力賦能物聯(lián)網(wǎng)革新

    架構(gòu)的超高能效 CPU——Arm Cortex-A320 以及對(duì) Transformer 網(wǎng)絡(luò)具有原生支持的 Ethos-U85 AI 加速為核心的邊緣AI 計(jì)算平臺(tái),可支持運(yùn)行超
    的頭像 發(fā)表于 03-06 11:43 ?2053次閱讀
    <b class='flag-5'>Arm</b> 推出 <b class='flag-5'>Armv9</b> 邊緣 AI 計(jì)算平臺(tái),以超高能效與先進(jìn) AI 能力賦能物聯(lián)網(wǎng)革新