5月29日Arm正式推出 Arm 2023 全面計算解決方案(TCS23), 包含基于全新第五代 GPU 架構(gòu)、可實現(xiàn)終極視覺體驗的全新Arm Immortalis GPU,助力 Arm 面向下一代人AI保持性能領(lǐng)先的全新 Armv9 CPU 集群,以及可為數(shù)百萬 Arm 開發(fā)者提供更易訪問軟件的全新增強技術(shù),為整個系統(tǒng)的關(guān)鍵工作負(fù)載帶來了顯著提升。
近日,在媒體技術(shù)日活動上,多位Arm技術(shù)專家來到現(xiàn)場分享了TCS23的技術(shù)特征以及智能移動設(shè)備發(fā)展的前瞻洞察。Arm 產(chǎn)品營銷副總裁 Ian Smythe首先介紹了TCS23的整體性能優(yōu)勢。
全新 Armv9 Cortex 計算集群已連續(xù)三年實現(xiàn)兩位數(shù)的性能提升。TCS23的計算集群包括超大核Cortex-X4,大核處理器 Cortex-A720 和小核 Cortex-A520。也推出了全新DSU-120 ,專門為了滿足高要求的多線程用例而設(shè)計?;诘谖宕軜?gòu)的 GPU即Immortalis-G720,專為旗艦智能手機而設(shè)計,可帶來 15% 的性能提升,減少了多達(dá) 40% 的內(nèi)存帶寬用量,有助于實現(xiàn)更出色且持久的幀率,最終帶來更高質(zhì)量的圖形。提供 64 位計算性能、支持安全創(chuàng)新,遷移到 64 位系統(tǒng)的任務(wù)已經(jīng)完成。Arm 的內(nèi)存標(biāo)記擴展MTE 功能,支持開發(fā)者在應(yīng)用部署前后,都能檢測和避免內(nèi)存安全漏洞。Ian還表示,在接下來的幾年里,我們將在包括 Krake GPU 和 Blackhawk CPU 等關(guān)鍵 IP 上加大投入,以滿足合作伙伴對于計算和圖形性能的要求。
TCS23全面計算解決方案包括工具、軟件以及各種硬件產(chǎn)品,例如Arm 架構(gòu)以及再底層的物理 IP、POP IP。TCS23在底層 IP上有了全新的更新,同時在工具上也提供了新的產(chǎn)品,在GPU上新品,進一步提高性能和效率。同時,Arm還推出了僅支持 64 位、且基于 Armv9.2 架構(gòu)的CPU集群,提供了全新的系統(tǒng)級IP 以及開發(fā)工具。
全面升級CPU核,以及DSU-120支持最高多達(dá)14個內(nèi)核的可擴展配置
Cortex-X4 是Arm打造過性能最快速的CPU,與 Cortex-X3 相比,Cortex-X4 的性能提高了15%,并帶來可以顯著降低功耗多達(dá) 40% 的高能效微架構(gòu)。而面積僅增加了 10%,這是Cortex-X系列處理器中,在每平方毫米的性能方面最出類拔萃的產(chǎn)品。不論是更快速的即時應(yīng)用響應(yīng),或是更流暢的網(wǎng)頁瀏覽體驗, Cortex-X4 的增強性能將為設(shè)備帶來顯著的升級。包括 3A 級游戲、全天候生產(chǎn)力和后臺任務(wù)在內(nèi)的用例,是移動設(shè)備中極其重要的部分,而能效則是高效運行此類用例必不可少的關(guān)鍵。
全新的大核處理器 Cortex-A720 和全新小核 Cortex-A520,與其上一代相比,雙雙在能效方面都提高了 20%。Cortex-A720 是業(yè)界主流的 CPU IP,可提高持續(xù)性能,是新 CPU 集群的核心主力,而Cortex-A520 是我們最出眾的高效性能核心。
由于高端移動設(shè)備的芯片設(shè)計越來越復(fù)雜,要面對用戶體驗的升級、新軟件功能的需求和更高性能和效率的持續(xù)突破,TCS23基于全新 Armv9.2 架構(gòu)搭建,可以為客戶提供突破能效和性能邊界所需的前沿技術(shù),客戶可以基于 TCS23 進行不同配置,從而自行創(chuàng)建可擴展性高的計算解決方案。這里不僅包括智能手機,還有高端數(shù)字電視、機頂盒等等。

Arm 終端事業(yè)部產(chǎn)品管理高級總監(jiān)Kinjal Dave談到,在Armv9.2 計算集群中除了全新 Cortex-X4、Cortex-A720 和 Cortex-A520 CPU,還有DynamIQ Shared Unit DSU-120。全新的 DSU-120基于兩年前推出的 DSU-110 開發(fā), 針對 DSU 的各方各面進行了優(yōu)化提升。 在擴展性方面,新款 DSU-120 支持最高多達(dá) 14 個的內(nèi)核和更大的L3緩存,可助力構(gòu)建比前代產(chǎn)品更強大、性能更高的 CPU 集群。無論是搭載于高性能筆記本電腦中的由十核 Cortex-X4 和四核 Cortex-A720 CPU 所組成的集群,還是用于旗艦智能手機中的由單核 Cortex-X4、四核 Cortex-A720 和四核 Cortex-A520 所組成的集群,高度可擴展的 DSU 都為 Arm 2023 全面計算解決方案(TCS23)奠定了根基。
DSU-120 還提供了全新的先進功能,例如智能節(jié)能模式,它有助于提高整個 CPU 集群的效率。更高級別的效率表現(xiàn)能延長特定集群所針對的任何消費電子設(shè)備的工作天數(shù)。DSU-120 還新增了24MB 和 32MB的 L3 緩存配置選項,進而使得對應(yīng)集群擁有更高的性能和更低的系統(tǒng)功耗。

在高端數(shù)字電視和機頂盒,以及中端智能手機應(yīng)用中,TCS23配置側(cè)重于提供具有超高可擴展性的高級圖形和計算性能,實現(xiàn)出色的用戶體驗。舉例來說,數(shù)字電視可以具備多視圖功能,例如同時在屏幕上顯示視頻通話、視頻流應(yīng)用和 AI 應(yīng)用等多個任務(wù)。更高的性能還可實現(xiàn)先進機器學(xué)習(xí)功能,以提升相機和視頻應(yīng)用場景的相關(guān)用戶體驗。
除此之外,TCS23 為注重成本的市場準(zhǔn)備了多款配置選擇,例如由全新 Cortex-A520 提供支持的可擴展 CPU 小核集群,以及可擴展的 Mali GPU。
GPU的三大關(guān)鍵提升
第五代架構(gòu)提高了所有 GPU 的系統(tǒng)級圖形性能,聚焦三個關(guān)鍵處理趨勢,即場景復(fù)雜性、更出色的圖形性能和內(nèi)存系統(tǒng)能耗功率。

隨著開發(fā)者紛紛設(shè)法實現(xiàn)更優(yōu)質(zhì)的視覺效果,移動設(shè)備上的場景復(fù)雜性也呈爆炸式增長?,F(xiàn)在面臨的挑戰(zhàn)在于,更高的場景復(fù)雜性會讓幾何相關(guān)的內(nèi)存訪問占據(jù)過多的可用帶寬,并最終影響性能。
為了處理這些更復(fù)雜的場景,圖形管道首先引入了延遲頂點著色 (DVS) 以重新定義 Arm GPU 中的圖形數(shù)據(jù)流。DVS 利于性能隨內(nèi)核數(shù)增加而提升,使 Arm 的合作伙伴能夠在未來達(dá)到更高的性能水平。DVS 還有助于在高度復(fù)雜的游戲場景中保持穩(wěn)定幀率,同時為未來下一代的幾何內(nèi)容提供支持。Immortalis-G720 有助于控制 HDR 渲染中使用的高深度紋理的性能影響。DVS 的引入意味著超復(fù)雜幾何形狀的場景可被渲染,并可節(jié)省處理能力。
Arm認(rèn)為內(nèi)存系統(tǒng)能耗功率是導(dǎo)致處理器散熱達(dá)到極限的主要因素。在第五代架構(gòu)中,希望為 GPU 分配更多的內(nèi)存系統(tǒng)效能以達(dá)到更好的視覺效果,同時也希望可以進一步節(jié)約能耗功率,以延長電池續(xù)航時間。
除了引入第五代架構(gòu)外,Immortalis 和 Mali GPU 的整體設(shè)計在性能和效率方面也實現(xiàn)了大幅提升。Immortalis-G720 支持十核或更多核心,并可選用優(yōu)化的物理 IP 來加速 SoC 設(shè)計。Mali-G720 和 Mali-G620 的超強可擴展性有助于為廣泛的消費電子設(shè)備帶來優(yōu)質(zhì)的圖形功能,例如智能手機、筆記本電腦、數(shù)字電視、機頂盒 (STB) 和可穿戴設(shè)備。Mali-G720 可支持六到九個核心,而 Mali-G620 可支持至多五個核心,可助力 Arm授權(quán)許可合作伙伴在更多市場中實現(xiàn)設(shè)計工作的快速復(fù)用。

3D 場景重建是一個關(guān)鍵的機器學(xué)習(xí)應(yīng)用場景,可以在移動 GPU上渲染真實場景的新穎視圖。并且在該應(yīng)用下,與 Immortalis-G715 相比,Immortalis-G720 的峰值性能提高了25%,占用的內(nèi)存帶寬減少了22%。
開發(fā)者可利用 Unity ML-Agents插件在游戲和模擬中訓(xùn)練智能代理。在 GDC 2023 上,Arm展示了在移動 SoC 上處理 100 個類似代理和復(fù)雜圖形的超強表現(xiàn)。

Arm通過廣泛的 GPU 工具和資源保持對游戲開發(fā)者的生態(tài)系統(tǒng)支持??蓮腁rm Mobile Studio免費下載多種解析、性能分析和調(diào)試工具,以幫助開發(fā)者優(yōu)化其應(yīng)用的性能和效率。
軟件優(yōu)化不可或缺
以TCS23 中的軟件來看包括三大支柱,即性能、安全以及開發(fā)者的可訪問性。Arm 終端事業(yè)部生態(tài)系統(tǒng)及工程高級總監(jiān) Geraint North詳細(xì)解析了TCS23 軟件部分的提升。
機器學(xué)習(xí)是軟件工作中非常重要的部分,因此在 TCS23 中我們更新了軟件技術(shù)庫。比如 Arm NN 以及 Arm Compute Library (ACL),這些都是開源的軟件技術(shù)庫,開發(fā)者可以利用它來優(yōu)化在 Armv9架構(gòu) CPU 和 GPU 上面機器學(xué)習(xí)的復(fù)雜性。
自 2023 年 1 月以來,Arm NN和 ACL 已經(jīng)通過谷歌的 Google Play Store 在安卓系統(tǒng)上提供,而且已經(jīng)有超過 1 億日活躍用戶。此外,到 2024 年,不管是Arm NN還是 ACL 都可以使用谷歌的移動平臺,意味著開發(fā)者能夠在可下載的項目,在默認(rèn)狀態(tài)下更新到網(wǎng)絡(luò)最新的版本,同時意味著能在基于 Arm 架構(gòu)上實現(xiàn)開發(fā)者獲得最高可能的機器學(xué)習(xí)的潛力。
多年以來,Arm一直在大量提供不斷優(yōu)化中的Mali GPU,賦能開發(fā)者,為他們免費提供了強大的開發(fā)工具,從而能夠讓他們在基于 Mali GPU 上實現(xiàn)最佳效果的設(shè)計。同時Arm還與全球主要的游戲引擎工作室進行多年的合作,一起推動圖形技術(shù)的進步,并且以一種非??蓴U展的方式實現(xiàn)產(chǎn)品的優(yōu)化。
Arm 還為開發(fā)者提供豐富的培訓(xùn)以及最佳實踐信息文件的分享,讓開發(fā)者可以在開始構(gòu)建圖形時不斷去改善他們的創(chuàng)意。
除此之外,Arm 還為最新的工藝節(jié)點和庫優(yōu)化了IP,并且利用其在 RTL 方面的專長配置物理 IP,以此在先進的技術(shù)上為基于Arm架構(gòu)的產(chǎn)品設(shè)計、制造提供了優(yōu)化的EDA流程與物理實現(xiàn)。
軟件越多越復(fù)雜,相對應(yīng)漏洞也會增長,Arm 的內(nèi)存標(biāo)記擴展MTE 功能通過“鎖”和“密鑰”的設(shè)置避免內(nèi)存安全漏洞。值得一提的是,TCS23是一個完全支持64位的集群,以利用完整的64位移動生態(tài)系統(tǒng)的優(yōu)勢。
小結(jié):
TCS23基于最新一代的Armv9.2 架構(gòu),同時基于全新的DynamIQ共享單元之上,帶來更多的可擴展性和更細(xì)致的電源控制模式,確??蛻粼谛枰臅r候可以獲得完整的性能和帶寬,在不需要的時候可以通過非常細(xì)的顆粒度去降低功率。
從Arm對TCS23的部署也能夠看到解決方案的靈活性和彈性,適用于智能手機、筆記本電腦等不同領(lǐng)域。與此同時,對于安全性、AI運算以及生態(tài)都進行大量優(yōu)化和拓展。TCS23給廣大客戶提供了非常好的可擴展性,以期發(fā)揮架構(gòu)帶來的更大優(yōu)勢。
-
ARM
+關(guān)注
關(guān)注
135文章
9559瀏覽量
392185 -
移動設(shè)備
+關(guān)注
關(guān)注
0文章
528瀏覽量
55960
發(fā)布評論請先 登錄
深度解析?ARM?架構(gòu):從劍橋車庫到未來計算
Arm推出面向游戲引擎的神經(jīng)圖形軟件開發(fā)套件
什么是ARM架構(gòu)?你需要知道的一切
Arm神經(jīng)超級采樣 以ML進一步強化性能 實現(xiàn)卓越的移動端圖形性能
Arm神經(jīng)技術(shù)是業(yè)界首創(chuàng)在 Arm GPU 上增添專用神經(jīng)加速器的技術(shù),移動設(shè)備上實現(xiàn)PC級別的AI圖形性能
一文了解Arm神經(jīng)超級采樣 (Arm Neural Super Sampling, Arm NSS) 深入探索架構(gòu)、訓(xùn)練和推理
Arm 與微軟合作,為基于 Arm 架構(gòu)的 PC 和移動設(shè)備應(yīng)用提供超強 AI 體驗
ARM Mali GPU 深度解讀
Arm 公司面向移動端市場的 ?Arm Lumex? 深度解讀
Arm攜手微軟共筑云計算和PC未來
Arm與微軟合作加速邊緣設(shè)備上的AI體驗
Arm助力開發(fā)者加速遷移至Arm架構(gòu)云平臺 Arm云遷移資源分享
國產(chǎn)ARM主板:自主創(chuàng)新的崛起與未來挑戰(zhàn)
Arm解讀Armv9 CPU為何是打造高性能、高能效移動計算的關(guān)鍵
MWC2025亮點放送 探索Arm如何塑造移動端技術(shù)未來
從Arm TCS23看Arm對移動設(shè)備未來的洞察
評論