91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

優(yōu)化的關(guān)鍵,RISC-V中的性能監(jiān)控

E4Life ? 來源:電子發(fā)燒友原創(chuàng) ? 作者:Leland ? 2021-12-16 09:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

RISC-V在云端、數(shù)據(jù)中心、汽車與網(wǎng)絡技術(shù)中的頻繁創(chuàng)新和亮相,已經(jīng)讓這一成長中的ISA一只腳邁入了高性能計算場景。然而缺少強大的性能監(jiān)測工具讓RISC-V的應用優(yōu)化成了問題,尤其是在RISC-V如今不少軟件源于從非原生移植的情況下,運算性能不能發(fā)揮出百分百的實力成了令人頭疼的問題。

與此同時,英特爾ARM都擁有自己專用的性能監(jiān)控方案,讓開發(fā)者可以發(fā)揮出其硬件的全部效力,但RISC-V仍然依靠定制或廠商特定的方案,而缺少通用性能監(jiān)控軟件工具的完整支持。

Perf對RISC-V的支持

系統(tǒng)級的性能優(yōu)化往往是靠性能剖析和代碼優(yōu)化來實現(xiàn)的,前者是為了尋找性能瓶頸,后者則是為了改善軟件性能,因此這類性能分析/監(jiān)控工具成了處理器開發(fā)時必不可少的軟件。盡管RISC-V的ISA規(guī)范已經(jīng)定義了硬件性能監(jiān)控(HPM),但總體支持程度上仍未完善。

就以Linux上的性能分析工具Perf為例,該工具可以借助PMU(性能監(jiān)控單元)、tracepoint和內(nèi)核計數(shù)器來分析程序中的硬件事件,比如處理器時鐘周期、指令計數(shù)器等,也可以分析一些軟件事件,比如Page Fault等。

Perf分為兩種模式,一種是perf stat,一種是perf record。如今上游Linux的perf雖然已經(jīng)對RISC-V有了支持,但僅對perf stat有一些基本的支持。比如mcycle這一CSR用于處理器運行的時鐘周期計數(shù),而minstret這一CSR則用于退休指令計數(shù)。

目前RISC-V特權(quán)規(guī)范中的支持 / 西部數(shù)據(jù)

RISC-V privileged規(guī)范中,RISC-V定義了幾種特權(quán)模式,分別是U-mode(用戶模式)、S-mode(管理員模式)和M-mode(機器模式)。但目前只有在機器模式下才能對這些寄存器進行讀寫,管理員模式下缺乏可寫入的寄存器。

計數(shù)器卻又是每時每刻運行中的,所以現(xiàn)在可以做到周期和指令計數(shù),卻無法啟用、禁用和暫停計數(shù)器,無法使用任何可編程計數(shù)器和事件采樣。不僅如此,RISC-V的perf不僅無法處理計數(shù)器溢出,也不支持溢出中斷。雖然市面上很多RISC-V處理器已經(jīng)考慮到了這一點,采用定制的形式來完成部分任務,比如Esperanto就為自己的ET-SoC-1千核RISC-V處理器加入了商業(yè)級的芯片除錯與性能監(jiān)控能力,但RISC-V規(guī)范本身缺少這些支持,這也就不利于當下RISC-V的開源生態(tài)。

完整的Perf支持缺少了什么?

于是我們現(xiàn)在發(fā)現(xiàn)管理員模式下無法寫入計數(shù)器,也無法改變mcountinhibit來直接開啟或停止計數(shù)器,也無法改變mhpmcountern來開啟或禁用直接讀取。接著就是沒有中斷指示器,我們不知道哪一個計數(shù)器出現(xiàn)了數(shù)值溢出,也沒有事件篩選功能。那么針對這些問題的解決方案是什么,哪些措施才能實現(xiàn)完整的Perf支持呢?來自西部數(shù)據(jù)的Atish Patra在近期的RISC-V峰會上提出了他以及開發(fā)社區(qū)所青睞的答案——SBI PMU擴展和sscofpmf ISA擴展。

SBI PMU擴展將作為一個接口,讓管理員模式下的軟件發(fā)現(xiàn)硬件計數(shù)器的細節(jié),針對特定的perf事件來配置硬件計數(shù)器,在請求下開始或停止計數(shù)器。除此之外,SBI PMU擴展還引入了固件性能計數(shù)器來監(jiān)控固件事件,比如未對齊的存取指令數(shù)、RFENCE和IPI數(shù)等等。如今在RISC-V的SBI 1.0版本中我們也可以看到,PMU擴展已經(jīng)成了該規(guī)范的一部分。

接著是sscofpmf擴展,ss代表的是特權(quán)架構(gòu)和管理員級的擴展,cofpmf代表的是溢出計數(shù)和特權(quán)模式篩選。該擴展新增了一個32位的scountovf只讀寄存器,該寄存器存儲的是29個mhpmcounter的第63位(OF),如此一來就能準確快速地判斷究竟是哪個事件的計數(shù)器溢出了。這一擴展已經(jīng)凍結(jié),目前處于審查狀態(tài),預計不久的將來就會批準,來自Linux內(nèi)核的支持工作也在推進中。

小結(jié)

RISC-V作為一個尚處于發(fā)展初期的架構(gòu),在某些方面確實還有不及其前輩x86和ARM的地方,我們這次從性能監(jiān)控上就能看出一些端倪,但RISC-V自身的特性也為它帶來了不小的優(yōu)勢。

首先,RISC-V是站在巨人的肩膀上發(fā)展的,它可以有效地規(guī)避以上那些架構(gòu)走錯的老路。其次,開源開放讓RISC-V有了龐大的社區(qū)支持,像以上這些解決方案,其實已經(jīng)被多次提及,來自社區(qū)的力量勢必可以讓RISC-V走得更遠。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20260

    瀏覽量

    252593
  • Linux
    +關(guān)注

    關(guān)注

    88

    文章

    11770

    瀏覽量

    219110
  • RISC-V
    +關(guān)注

    關(guān)注

    48

    文章

    2891

    瀏覽量

    53077
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    重磅合作!Quintauris 聯(lián)手 SiFive,加速 RISC-V 在嵌入式與 AI 領域落地

    多個關(guān)鍵領域的落地采用,這波操作真的太讓人期待了~ 這次合作可不是簡單聯(lián)手,核心是優(yōu)勢互補:Quintauris 擅長硬件與軟件 IP,SiFive 則有高性能RISC-V 內(nèi)核和成熟平臺,兩者結(jié)合
    發(fā)表于 12-18 12:01

    新思科技全棧工具鏈助力RISC-V設計高效進階

    RISC-V 架構(gòu)席卷全球的當下,新思科技(Synopsys)通過在整個硅生命周期開發(fā)工具、驗證平臺與定制 IP 方面的深厚積累,成為 RISC-V 生態(tài)中最為關(guān)鍵的“隱形推手”,在整個 R
    的頭像 發(fā)表于 12-17 10:29 ?753次閱讀
    新思科技全棧工具鏈助力<b class='flag-5'>RISC-V</b>設計高效進階

    探索RISC-V在機器人領域的潛力

    探索RISC-V在機器人領域的潛力 測評人:洄溯 測評時間: 2025年11月 測評對象: MUSE Pi Pro開發(fā)板(基于進迭時空K1系列高性能RISC-V CPU) 一、 開篇引言
    發(fā)表于 12-03 14:40

    為什么RISC-V是嵌入式應用的最佳選擇

    最近RISC-V基金會在社交媒體上發(fā)文,文章說物聯(lián)網(wǎng)和嵌入式系統(tǒng)正在迅速發(fā)展,需要更高的計算性能、更低的功耗和人工智能。RISC-V是為未來而建的,包括超高效的MCU到高性能應用處理器
    的頭像 發(fā)表于 11-07 10:09 ?1615次閱讀

    risc-v浮點運算單元的使用及其設計考慮

    的應用。 在RISC-V,浮點運算單元分為單精度浮點數(shù)(32位)和雙精度浮點數(shù)(64位),通常包括以下幾種基本功能: 加法器/減法器:用于執(zhí)行浮點數(shù)的加減運算。 乘法器:用于執(zhí)行浮點數(shù)的乘法運算。 除法
    發(fā)表于 10-21 14:46

    提高RISC-V在Drystone測試得分的方法

    :編譯器如何優(yōu)化生成的機器代碼也會影響Drystone的得分。優(yōu)化的編譯器能夠生成更高效的機器代碼,從而提高性能。 提高 RISC-V 在 Drystone 測試
    發(fā)表于 10-21 13:58

    RISC-V B擴展介紹及實現(xiàn)

    某個方向移位并將結(jié)果存儲在目標寄存器;后者則用于為一個值生成一個位掩碼。 此外,B擴展還增加了一組壓縮指令,可以使指令占用更少的內(nèi)存空間,從而提高系統(tǒng)性能。這些壓縮指令兼容于RISC-V ISR
    發(fā)表于 10-21 13:01

    時擎科技亮相2025 RISC-V中國峰會,深度解析高性能RISC-V SoC技術(shù)挑戰(zhàn)與創(chuàng)新

    2025年7月16-18日,第五屆RISC-V中國峰會在上海張江科學會堂成功舉辦,作為全球RISC-V領域頂級盛會之一,本屆峰會匯聚了數(shù)百家企業(yè)、研究機構(gòu)及開源社區(qū),共同探討RISC-V生態(tài)
    的頭像 發(fā)表于 07-21 17:37 ?1667次閱讀
    時擎科技亮相2025 <b class='flag-5'>RISC-V</b>中國峰會,深度解析高<b class='flag-5'>性能</b><b class='flag-5'>RISC-V</b> SoC技術(shù)挑戰(zhàn)與創(chuàng)新

    知合計算:RISC-V架構(gòu)創(chuàng)新,阿基米德系列劍指高性能計算

    在于更高的能效性能。這主要取決于單位性能的提升,以及先進工藝帶來的PPA優(yōu)化。只有出現(xiàn)標桿性的產(chǎn)品才能真正引領整個RISC-V性能計算軟硬
    的頭像 發(fā)表于 07-18 14:17 ?2760次閱讀
    知合計算:<b class='flag-5'>RISC-V</b>架構(gòu)創(chuàng)新,阿基米德系列劍指高<b class='flag-5'>性能</b>計算

    x264 的 RISC-V 生態(tài)構(gòu)建與優(yōu)化探索

    性能優(yōu)化水平的重要標桿。 ? 2025 年 7 月 18 日,在第五屆(2025)RISC-V 中國峰會的軟件與生態(tài)系統(tǒng)分論壇上,字節(jié)跳動軟件工程師錢佳炎分享了關(guān)于 x264 在 RISC-V
    發(fā)表于 07-18 11:42 ?4964次閱讀

    孟建熠:攀登 RISC-V性能高峰,打造標桿產(chǎn)品

    RISC-V 在高性能計算領域的崛起,是近年來全球芯片架構(gòu)競爭的重要趨勢之一。其開源、靈活、可擴展的特性,使其在高性能處理器設計、人工智能算力優(yōu)化、服務器芯片等領域展現(xiàn)出強勁的發(fā)展勢頭
    發(fā)表于 07-17 15:56 ?4956次閱讀

    兆松科技發(fā)布高性能RISC-V編譯器ZCC 4.0.0版本

    近日,兆松科技(武漢)有限公司(以下簡稱“兆松科技”)宣布正式發(fā)布高性能 RISC-V 編譯器 ZCC 4.0.0 版本。新版本在性能優(yōu)化、廠商自定義指令支持和軟件庫等方面實現(xiàn)全面升級
    的頭像 發(fā)表于 06-27 14:48 ?3120次閱讀
    兆松科技發(fā)布高<b class='flag-5'>性能</b><b class='flag-5'>RISC-V</b>編譯器ZCC 4.0.0版本

    智芯公司RISC-V性能CPU芯片獲得權(quán)威認可

    近日,智芯公司自主研發(fā)的RISC-V性能CPU芯片通過工信部直屬中國電子技術(shù)標準化研究院賽西實驗室檢測,標志著智芯公司在RISC-V性能CPU芯片領域取得
    的頭像 發(fā)表于 06-16 17:32 ?1598次閱讀

    RISC-V架構(gòu)下的編譯器自動向量化

    性能算力生態(tài)的建設,正投入編譯器自動向量化優(yōu)化等多項關(guān)鍵技術(shù),全面助力RISC-V的高性能發(fā)展。RIS
    的頭像 發(fā)表于 06-06 16:59 ?1252次閱讀
    <b class='flag-5'>RISC-V</b>架構(gòu)下的編譯器自動向量化

    FPGA與RISC-V淺談

    。 Semico Research預測2025年 RISC-V 芯片市場規(guī)模將突破 450 億美元,年復合增長率達 58%,國家戰(zhàn)略采購占比超 35%。RISC-V International在報告預測,搭載
    發(fā)表于 04-11 13:53 ?686次閱讀
    FPGA與<b class='flag-5'>RISC-V</b>淺談