91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

UWA推出全新GPU性能測(cè)評(píng)工具,支持多款PowerVR芯片優(yōu)化

穎脈Imgtec ? 2023-08-14 10:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

移動(dòng)設(shè)備GPU 性能優(yōu)化對(duì)玩家游戲體驗(yàn)至關(guān)重要。侑虎科技 UWA 一直專注于游戲和 VR 應(yīng)用的性能優(yōu)化,移動(dòng)設(shè)備 GPU 優(yōu)化是其關(guān)注的重點(diǎn),為了更好地滿足開發(fā)者針對(duì)不同 GPU 芯片的性能測(cè)評(píng)與優(yōu)化,日前他們?cè)谌律?jí)的UWA SDK 2.4.8版本中,推出了 GPU 性能測(cè)評(píng)工具—UWA GOT Online GPU 模式。這也是 UWA 繼去年GPU Counter 功能更新增加Imagination PowerVR GPU 芯片支持后的一次重要升級(jí)。

全新的UWA GOT Online GPU 模式帶來了更全面的GPU 性能優(yōu)化方案。在 UWA 官方公開的 GOT Online 支持設(shè)備列表中,可以看到對(duì)多款I(lǐng)magination PowerVR GPU的支持:GE8100、GE8200、GE8300、GE8310、GE8430、GE8320、GE8325、GE8340 等,并且會(huì)持續(xù)刷新支持Imagination PowerVR GPU的型號(hào),表中還列出了GPU耗時(shí)均值、GPU著色、GPU帶寬、GPU圖元處理、GPU負(fù)載等多個(gè)評(píng)測(cè)優(yōu)化維度。Imagination 將與 UWA 持續(xù)合作幫助開發(fā)者對(duì)GPU 進(jìn)行更好地優(yōu)化。

30d3fd9a-3a48-11ee-bbcf-dac502259ad0.png

現(xiàn)在,讓我們一一介紹這些重要功能。

  • 性能簡(jiǎn)報(bào):該頁面可以快速地幫助開發(fā)者把控項(xiàng)目的GPU性能壓力情況

  • GPU分析:分別從渲染和帶寬兩個(gè)角度,對(duì)GPU性能壓力進(jìn)行分析

  • 渲染資源分析:開啟紋理和網(wǎng)格資源分析功能,定位這些資源的具體使用情況

  • Overdraw快照:更便捷地定位Overdraw壓力來源

GPU溫度:快速判斷設(shè)備發(fā)熱的原因是否主要來自GPU


性能簡(jiǎn)報(bào)

如下圖,UWA列出了測(cè)試時(shí)的FPS、GPU Clocks數(shù)據(jù),并用淺紅色背景標(biāo)注了GPU Bound幀。GPU Bound表示GPU性能高壓區(qū)間,此時(shí)GPU計(jì)算耗費(fèi)的時(shí)鐘周期數(shù)過高,可能無法支持滿幀運(yùn)作。

3104379e-3a48-11ee-bbcf-dac502259ad0.png

同時(shí),UWA也在圖表下列出了GPU性能、渲染統(tǒng)計(jì)、紋理資源分析和網(wǎng)格資源分析4個(gè)模塊的參數(shù)情況和對(duì)應(yīng)的優(yōu)化任務(wù)隊(duì)列。

311ba4c4-3a48-11ee-bbcf-dac502259ad0.png

312901dc-3a48-11ee-bbcf-dac502259ad0.png

314aab7a-3a48-11ee-bbcf-dac502259ad0.png

簡(jiǎn)報(bào)的目的是幫助大家在茫茫多的性能指標(biāo)中,快速篩選出高優(yōu)先級(jí)的優(yōu)化任務(wù)。如需要針對(duì)某些指標(biāo)做更為深層的下探,就可以使用下文中的各個(gè)功能進(jìn)行分析。


GPU分析

在指標(biāo)匯總下,展示了測(cè)試過程中獲取到的各項(xiàng)GPU參數(shù)。同時(shí),UWA也根據(jù)這些指標(biāo)間的關(guān)聯(lián),分別從渲染和帶寬兩個(gè)角度,幫助開發(fā)者對(duì)GPU性能壓力進(jìn)行具體分析。

1. 指標(biāo)匯總

GPU TimeGPU Time即每幀的GPU耗時(shí)。GPU耗時(shí)的推薦值和CPU耗時(shí)一樣,當(dāng)項(xiàng)目需要維持在30幀時(shí),GPU耗時(shí)應(yīng)低于33ms(UWA推薦控制在28ms更佳)。同時(shí),UWA也列出了渲染耗時(shí)Fragment Time和頂點(diǎn)處理耗時(shí)Non-Fragment Time數(shù)據(jù)作為補(bǔ)充。

3164c5b4-3a48-11ee-bbcf-dac502259ad0.png


Clocks

GPU Clocks表示渲染一幀耗費(fèi)的GPU時(shí)鐘周期數(shù),和GPU Times一樣,也是用于衡量GPU性能的主要指標(biāo)。通過GPU Clocks,開發(fā)者可以快速定位項(xiàng)目的GPU壓力主要來自哪些場(chǎng)景,并結(jié)合其他GPU參數(shù)對(duì)GPU壓力情況進(jìn)行具體分析。

318471de-3a48-11ee-bbcf-dac502259ad0.png


GPU Utilization

Fragment Utilization和Non Fragment Utilization分別表示圖元處理和非圖元處理任務(wù)處于活動(dòng)狀態(tài)的時(shí)間百分比。

31a409a4-3a48-11ee-bbcf-dac502259ad0.png

當(dāng)Non Fragment Utilization高時(shí),開發(fā)者可以從面片數(shù)、面剔除、模型復(fù)雜度等角度著手進(jìn)行優(yōu)化;而當(dāng)Fragment Utilization高時(shí),則考慮項(xiàng)目中是否存在Overdraw過高、Fragment Shader過于復(fù)雜等問題。


GPU Shaded

在GPU Shaded下,可以獲取到相關(guān)的Fragment shaded、Vertices shaded、Cycles/Pixel指標(biāo)數(shù)據(jù)。

31c88b4e-3a48-11ee-bbcf-dac502259ad0.png

其中Cycles/Pixel表示平均每個(gè)像素耗費(fèi)的GPU時(shí)鐘周期。當(dāng)畫面的Shader復(fù)雜度過高/或者Overdraw過高時(shí),GPU需要消耗大量的時(shí)鐘周期對(duì)Shader進(jìn)行運(yùn)算,容易造成GPU耗時(shí)變高,造成卡頓。通過Cycles/Pixel,即可快速定位高Cycles的場(chǎng)景,需要進(jìn)一步判斷場(chǎng)景的GPU壓力是否是由于Shader復(fù)雜度過高還是Overdraw過高造成,進(jìn)行有針對(duì)性的優(yōu)化。

31eb6326-3a48-11ee-bbcf-dac502259ad0.png

Fragment shaded表示每幀F(xiàn)ragment shader執(zhí)行了多少次,用Fragment shaded數(shù)除以設(shè)備分辨率,可以側(cè)面反映項(xiàng)目的Overdraw情況。

當(dāng)Overdraw較高時(shí),容易引起發(fā)熱和能耗方面的問題。我們可以通過降低半透明粒子特效的粒子數(shù)量、使用不規(guī)則面片代替矩形面片渲染粒子特效或UI等方式,減少項(xiàng)目的Overdraw層數(shù),降低GPU壓力。

31f12108-3a48-11ee-bbcf-dac502259ad0.png

而Vertices shaded則表示每幀Vertex shader執(zhí)行了多少次。使用Vertices shaded除以輸入圖元數(shù),即可得到平均每個(gè)圖元進(jìn)行了多少次Vertices shaded。UWA推薦平均每個(gè)圖元執(zhí)行次數(shù)應(yīng)控制在1.5次以下。

3207e47e-3a48-11ee-bbcf-dac502259ad0.png


GPU Bandwidth

和CPU一樣,GPU Bandwidth也是芯片耗電的重要指標(biāo)。當(dāng)GPU持續(xù)進(jìn)行高負(fù)載外部讀寫時(shí),掉電就會(huì)過快。UWA的GPU Bandwidth模塊統(tǒng)計(jì)了測(cè)試過程中單幀的讀寫帶寬總量,通過查看GPU Bandwidth模塊,可以快速定位測(cè)試過程中帶寬較高的場(chǎng)景和原因,并進(jìn)行進(jìn)一步測(cè)試優(yōu)化。

32228806-3a48-11ee-bbcf-dac502259ad0.png


GPU Memory Bus Utilization

GPU Memory Bus Utilization,即每幀GPU內(nèi)存總線負(fù)載。它表示當(dāng)前GPU帶寬消耗占總可用帶寬的百分比。當(dāng)GPU Memory Bus Utilization持續(xù)較高時(shí),說明GPU訪問內(nèi)存的頻率過于頻繁,可以通過減少紋理資源與網(wǎng)格資源的大小和數(shù)量控制GPU緩存的占比。

324644f8-3a48-11ee-bbcf-dac502259ad0.png


GPU Primitive

渲染面是產(chǎn)生GPU壓力的重要因素之一,渲染面過多可能是模型過于復(fù)雜;也可能是地形、大建筑物等大面積模型沒有進(jìn)行適當(dāng)?shù)牟鸱?,?dǎo)致進(jìn)入視域體的面片可能不多,但提交GPU的渲染面依然很多。

對(duì)于這種情況,我們可以通過GPU Primitive下的各項(xiàng)參數(shù)來進(jìn)行初步判斷。

3267ca42-3a48-11ee-bbcf-dac502259ad0.png

Input Primitives:提交到GPU端的圖元總數(shù),該數(shù)值基本等同于引擎端統(tǒng)計(jì)的渲染面片總數(shù)。

Visible Primitives:在GPU端通過各種裁剪之后,留下的參與渲染的三角面。

Culled Primitives:因?yàn)樵谝曈蝮w外而被裁剪的三角面,因?yàn)槌蚨徊眉舻娜敲妗?/p>

GPU圖元處理數(shù)量過多會(huì)對(duì)設(shè)備的帶寬和能耗造成較大的影響,應(yīng)盡量在程序端完成剔除,并減小送往GPU的圖元數(shù)。在3D場(chǎng)景中,比較理想的情況下,可見圖元的數(shù)量應(yīng)該接近或高于 50%(對(duì)于大部分模型,有一半三角面會(huì)因?yàn)槌虮徊眉簦?。如果某些角度下,可見圖元的比例非常低,則很可能存在上文提到的第二種情況,從而可以針對(duì)性地檢查和優(yōu)化場(chǎng)景中,這個(gè)角度下,被提交到GPU的大面積模型。

32874d68-3a48-11ee-bbcf-dac502259ad0.png

2. GPU渲染分析

GPU Clocks是衡量GPU性能的主要指標(biāo),結(jié)合該曲線,開發(fā)者可以快速判斷各個(gè)場(chǎng)景中的GPU壓力。

32a22584-3a48-11ee-bbcf-dac502259ad0.png

同時(shí),UWA也展示出了GPU Shaded、GPU Primitive指標(biāo)的均值和性能走勢(shì)。當(dāng)某個(gè)場(chǎng)景中的GPU Clocks較高時(shí),通過這些指標(biāo)的推薦值和性能曲線,開發(fā)者就可以快速判斷是哪些參數(shù)造成的GPU渲染計(jì)算壓力,并采取相應(yīng)的優(yōu)化方案。

32b5b4c8-3a48-11ee-bbcf-dac502259ad0.png


3. GPU帶寬分析

由于GPU讀、寫帶寬較高時(shí)都會(huì)造成大量的發(fā)熱和耗電,需要開發(fā)者重點(diǎn)關(guān)注。

在相關(guān)參數(shù)中,也展示了GPU Memory Bus Utilization、GPU Primitive參數(shù)。比如當(dāng)GPU Primitives較高時(shí),就說明提交到GPU端的圖元總數(shù)較多,可能引起較高的帶寬壓力。

32dacb32-3a48-11ee-bbcf-dac502259ad0.png32f66784-3a48-11ee-bbcf-dac502259ad0.png


渲染資源分析

當(dāng)參與渲染的紋理和網(wǎng)格資源越多、采樣越多時(shí),資源內(nèi)存會(huì)變高,GPU帶寬和GPU Clocks也會(huì)相應(yīng)上漲。為了保證讓參與渲染計(jì)算的資源物盡其用,開發(fā)者可以手動(dòng)開啟紋理和網(wǎng)格資源分析功能,定位這些資源的具體使用情況。

3323d69c-3a48-11ee-bbcf-dac502259ad0.png

紋理資源分析

在紋理資源分析頁,除了紋理資源的內(nèi)存、數(shù)量、尺寸等參數(shù)外,我們還可以查看紋理渲染利用率、是否開啟Mipmap和Mipmap采樣率等數(shù)據(jù)。

33f87fe6-3a48-11ee-bbcf-dac502259ad0.png

34277332-3a48-11ee-bbcf-dac502259ad0.png

通過紋理渲染利用率,開發(fā)者即可快速定位到一直在內(nèi)存中但從未參與過渲染的紋理資源,以此排查是否存在場(chǎng)景中不可見的渲染物體、不合理的打包和加載策略等可能造成此種浪費(fèi)的因素。

344f6f18-3a48-11ee-bbcf-dac502259ad0.png

347f65ba-3a48-11ee-bbcf-dac502259ad0.png

而通過Mipmap 0層采樣率是否較低(低于20%),則可以判斷哪些紋理資源的尺寸過大,開發(fā)者就可以通過降低這些紋理資源分辨率緩解內(nèi)存和GPU壓力,同時(shí)也不會(huì)影響畫面效果。

網(wǎng)格資源分析

在網(wǎng)格資源分析頁,除了和紋理資源相似的資源渲染利用率外,我們也可以查看網(wǎng)格的最大屏占比和最小渲染密度數(shù)據(jù)。渲染利用率為0的網(wǎng)格資源和紋理資源優(yōu)化方式相似,而網(wǎng)格最大屏占比和最小渲染密度則可以用于排查網(wǎng)格資源的精度是否合理。

3499167c-3a48-11ee-bbcf-dac502259ad0.png

當(dāng)網(wǎng)格的最大屏占比小于0.02%時(shí),說明網(wǎng)格在手機(jī)屏幕中只占很小的一部分,可見性較低。如果同時(shí)網(wǎng)格的復(fù)雜度較高,就說明網(wǎng)格的精度過高,開發(fā)者可以考慮使用更低精度的模型進(jìn)行替換。

34bf2a7e-3a48-11ee-bbcf-dac502259ad0.png

34d2a342-3a48-11ee-bbcf-dac502259ad0.png

渲染密度則表示在平均每一萬像素中網(wǎng)格的頂點(diǎn)數(shù),如果該值大于1000,則說明我們?cè)诤苄〉漠嬅嬷欣L制了過于復(fù)雜的網(wǎng)格。因此,當(dāng)此網(wǎng)格的渲染密度最小時(shí),該數(shù)值仍然高于1000,那么此網(wǎng)格的頂點(diǎn)數(shù)大概率是過高的,開發(fā)者可以考慮對(duì)這些網(wǎng)格資源進(jìn)行減面操作,或使用LOD分級(jí)處理。


Overdraw快照

Overdraw表示項(xiàng)目運(yùn)行過程中單幀中整個(gè)屏幕被填充的倍數(shù)。在游戲運(yùn)行過程中,場(chǎng)景中半透明物體的重合會(huì)使得同一個(gè)像素點(diǎn)在一幀中會(huì)被繪制多次,容易造成Overdraw過高,引起設(shè)備發(fā)熱。

在Overdraw快照模塊,UWA通過Fragment Shaded(渲染像素總數(shù))與設(shè)備渲染分辨率,換算得到了Overdraw的計(jì)算值,以幫助開發(fā)者對(duì)項(xiàng)目的Overdraw情況進(jìn)行排查。

34e9c144-3a48-11ee-bbcf-dac502259ad0.png

在測(cè)試GPU模式時(shí),開發(fā)者可以手動(dòng)Dump采集場(chǎng)景中具體的Overdraw情況。

350535c8-3a48-11ee-bbcf-dac502259ad0.png

在Overdraw快照模塊,即可查看Dump幀各個(gè)相機(jī)的Overdraw情況。其中Overlay-UI(UWA)相機(jī)展示的是UGUI中Overlay部分的Overdraw信息,即所有沒有掛在任何相機(jī)下UI的Overdraw信息。

35385264-3a48-11ee-bbcf-dac502259ad0.png

在柱狀圖下方,還可以查看所選柱狀圖的Overdraw熱力圖,其中顏色越紅,表示該處像素在當(dāng)前幀中被填充的次數(shù)較多,Overdraw較高,GPU的壓力就越大。

355204e8-3a48-11ee-bbcf-dac502259ad0.png

開發(fā)者可以結(jié)合報(bào)告截圖和Overdraw熱力圖,更便捷地定位項(xiàng)目的Overdraw壓力來源。


GPU溫度

GPU壓力較高時(shí)容易引起設(shè)備發(fā)熱。UWA統(tǒng)計(jì)了設(shè)備的GPU、CPU、電池溫度,以便開發(fā)者判斷設(shè)備發(fā)熱的原因是否主要來自GPU。

3573bf5c-3a48-11ee-bbcf-dac502259ad0.png

若確認(rèn)是由于GPU壓力導(dǎo)致發(fā)熱,接下來可以進(jìn)一步排查與GPU溫度情況有關(guān)的參數(shù),譬如FPS、GPU Clocks、GPU bandwidth。而功率則會(huì)和GPU溫度相互影響,也是反應(yīng)能耗和發(fā)熱問題的重要參數(shù)。

358c657a-3a48-11ee-bbcf-dac502259ad0.png

這里特別建議大家:由于CPU和GPU芯片位置較近,當(dāng)CPU壓力較大產(chǎn)生發(fā)熱時(shí),也可能帶動(dòng)GPU一起發(fā)熱。所以在優(yōu)化GPU發(fā)熱問題時(shí),也要適當(dāng)結(jié)合CPU壓力情況進(jìn)行排查分析??偟膩碚f,當(dāng)項(xiàng)目存在耗電快、溫度高的現(xiàn)象時(shí),開發(fā)者可以從GPU性能壓力、GPU帶寬、CPU主線程、CPU子線程等方面著手,優(yōu)化發(fā)熱問題。

UWA提供的性能測(cè)評(píng)工具更進(jìn)一步地拆分和細(xì)化了項(xiàng)目的GPU壓力成因,為您帶來前所未有的優(yōu)化體驗(yàn)。UWA的目標(biāo)是讓您更便捷、高效地定位項(xiàng)目的GPU壓力來源,告別盲目猜測(cè),擁抱精準(zhǔn)優(yōu)化。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    463

    文章

    54024

    瀏覽量

    466353
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5196

    瀏覽量

    135511
  • vr
    vr
    +關(guān)注

    關(guān)注

    34

    文章

    9694

    瀏覽量

    157269
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    沐曦股份正式推出曦索X系列全新GPU品牌與產(chǎn)品線

    1月27日,沐曦股份(股票代碼:688802.SH)正式推出曦索X系列全新GPU品牌與產(chǎn)品線。該系列產(chǎn)品是面向科學(xué)智能場(chǎng)景深度優(yōu)化的高性能計(jì)
    的頭像 發(fā)表于 01-28 17:14 ?646次閱讀

    NVIDIA RTX PRO 2000 Blackwell GPU性能測(cè)試

    越來越多的應(yīng)用正在使用 AI 加速,而無論工作站的大小或形態(tài)如何,都有越來越多的用戶需要 AI 性能。NVIDIA RTX PRO 2000 Blackwell 是全新 NVIDIA
    的頭像 發(fā)表于 11-28 09:39 ?6344次閱讀
    NVIDIA RTX PRO 2000 Blackwell <b class='flag-5'>GPU</b><b class='flag-5'>性能</b>測(cè)試

    適應(yīng)邊緣AI全新時(shí)代的GPU架構(gòu)

    電子發(fā)燒友網(wǎng)站提供《適應(yīng)邊緣AI全新時(shí)代的GPU架構(gòu).pdf》資料免費(fèi)下載
    發(fā)表于 09-15 16:42 ?47次下載

    【作品合集】米爾RK3576開發(fā)板測(cè)評(píng)

    米爾RK3576開發(fā)板測(cè)評(píng)作品合集 產(chǎn)品介紹: RK3576 是瑞芯微一款面向AI市場(chǎng)推出的高性能處理器,它配備了四核Cortex-A72和四 核Cortex-A53 的 CPU,集成了6TOPS
    發(fā)表于 09-11 10:19

    Imagination GPU 全面支持 Vulkan 1.4 和 Android 16

    是Imagination開發(fā)者社區(qū)中廣受歡迎的圖形API,因其提供了低開銷、跨平臺(tái)訪問現(xiàn)代GPU的能力,幫助開發(fā)者在多種設(shè)備上最大化性能與效率。其對(duì)GPU操作的顯式控制,以及對(duì)
    的頭像 發(fā)表于 08-14 11:18 ?2307次閱讀
    Imagination <b class='flag-5'>GPU</b> 全面<b class='flag-5'>支持</b> Vulkan 1.4 和 Android 16

    如何在Ray分布式計(jì)算框架下集成NVIDIA Nsight Systems進(jìn)行GPU性能分析

    在大語言模型的強(qiáng)化學(xué)習(xí)訓(xùn)練過程中,GPU 性能優(yōu)化至關(guān)重要。隨著模型規(guī)模不斷擴(kuò)大,如何高效地分析和優(yōu)化 GPU
    的頭像 發(fā)表于 07-23 10:34 ?2414次閱讀
    如何在Ray分布式計(jì)算框架下集成NVIDIA Nsight Systems進(jìn)行<b class='flag-5'>GPU</b><b class='flag-5'>性能</b>分析

    GUI Guider全新優(yōu)化方案GUI xTurbo-VeloRender初體驗(yàn):基于i.MX RT平臺(tái)的LVGL渲染能力突破

    引言 在嵌入式GUI開發(fā)領(lǐng)域,圖形界面的渲染性能直接決定了用戶體驗(yàn)的流暢度與產(chǎn)品競(jìng)爭(zhēng)力。針對(duì)i.MX RT系列的開發(fā)需求,恩智浦在2025年隆重推出全新性能
    的頭像 發(fā)表于 07-10 09:21 ?3762次閱讀
    GUI Guider<b class='flag-5'>全新</b><b class='flag-5'>優(yōu)化</b>方案GUI xTurbo-VeloRender初體驗(yàn):基于i.MX RT平臺(tái)的LVGL渲染能力突破

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】+NVlink技術(shù)從應(yīng)用到原理

    前言 【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」書中的芯片知識(shí)是比較接近當(dāng)前的頂尖芯片水平的,同時(shí)包含了
    發(fā)表于 06-18 19:31

    鴻蒙5開發(fā)寶藏案例分享---性能優(yōu)化案例解析

    鴻蒙性能優(yōu)化寶藏指南:實(shí)戰(zhàn)工具與代碼案例解析 大家好呀!今天在翻鴻蒙開發(fā)者文檔時(shí),意外挖到一個(gè) 性能優(yōu)化寶藏庫 ——原來官方早就提供了超多實(shí)
    發(fā)表于 06-12 16:36

    各大廠商與新興企業(yè)推出的 EDA Copilot 工具

    當(dāng)前EDA(電子設(shè)計(jì)自動(dòng)化)領(lǐng)域正經(jīng)歷AI驅(qū)動(dòng)的智能化轉(zhuǎn)型,各大廠商與新興企業(yè)推出的EDA Copilot工具通過自然語言交互、自動(dòng)化設(shè)計(jì)優(yōu)化等技術(shù),顯著提升芯片設(shè)計(jì)效率。以下是基于最
    的頭像 發(fā)表于 06-06 09:34 ?2857次閱讀

    HarmonyOS優(yōu)化應(yīng)用內(nèi)存占用問題性能優(yōu)化

    應(yīng)用開發(fā)過程中注重內(nèi)存管理,積極采取措施來減少內(nèi)存占用,以優(yōu)化應(yīng)用程序的性能和用戶體驗(yàn)。 HarmonyOS提供了一些內(nèi)存管理的工具和接口,幫助開發(fā)者有效地管理內(nèi)存資源: onMemoryLevel接口
    發(fā)表于 05-21 11:27

    iTOP-3588S開發(fā)板四核心架構(gòu)GPU內(nèi)置GPU可以完全兼容0penGLES1.1、2.0和3.2。

    性能強(qiáng) iTOP-3588S開發(fā)板采用瑞芯微RK3588S處理器,是全新一代AloT高端應(yīng)用芯片,搭載八核64位CPU,四核Cortex-A76和四核Cortex-A55架構(gòu)主頻高達(dá)2.4GHZ
    發(fā)表于 05-15 10:36

    提升AI訓(xùn)練性能GPU資源優(yōu)化的12個(gè)實(shí)戰(zhàn)技巧

    在人工智能與機(jī)器學(xué)習(xí)技術(shù)迅速發(fā)展的背景下,GPU計(jì)算資源的高效利用已成為關(guān)鍵技術(shù)指標(biāo)。優(yōu)化GPU資源分配不僅能顯著提升模型訓(xùn)練速度,還能實(shí)現(xiàn)計(jì)算成本的有效控制。根據(jù)AI基礎(chǔ)設(shè)施聯(lián)盟2024年發(fā)布
    的頭像 發(fā)表于 05-06 11:17 ?1555次閱讀
    提升AI訓(xùn)練<b class='flag-5'>性能</b>:<b class='flag-5'>GPU</b>資源<b class='flag-5'>優(yōu)化</b>的12個(gè)實(shí)戰(zhàn)技巧

    開售RK3576 高性能人工智能主板

    AI 神經(jīng)網(wǎng)絡(luò)處理器 NPU,運(yùn)算性能高達(dá) 6.0TOPS,支持多種 AI 開發(fā)工具和接口。支持 雙屏異顯功能,支持 LVDS 接口 10
    發(fā)表于 04-23 10:55

    英諾達(dá)推出RTL功耗優(yōu)化工具

    英諾達(dá)(成都)電子科技有限公司隆重推出芯片設(shè)計(jì)早期RTL級(jí)功耗優(yōu)化工具—EnFortius RTL Power Explorer(ERPE),該工具可以高效、全面地在RTL設(shè)計(jì)階段進(jìn)行
    的頭像 發(fā)表于 03-20 17:06 ?1187次閱讀