91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

RISC-V高級指令融合如何實現性能密度躍升

新思科技 ? 來源:新思科技 ? 2025-12-29 11:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Synopsys ARC-V 處理器中的高級指令融合引入了一種新型機制,用于融合常見的 RISC-V 指令對,旨在提高處理器流水線效率,特別是針對資源受限的嵌入式處理器。通過融合來自不同功能單元的指令, 它將單發(fā)射、順序執(zhí)行的處理器擴展為雙指令發(fā)射。

重要的是,該機制并未引入新的指令,完全兼容 RISC-V 架構,并且對軟件透明,確保與現有軟件和硬件環(huán)境的無縫集成。通過減少流水線開銷并簡化指令處理,高級指令融合顯著提升嵌入式處理的效率。

該方法還具備可適應的設計原則,可以從雙指令融合擴展到多指令融合,從而惠及整個生態(tài)系統(tǒng)中的 RISC-V 處理器實現。

嵌入式 RISC-V 設計面臨的挑戰(zhàn)

隨著嵌入式系統(tǒng)不斷演進,設計人員面臨在嚴格的功耗和成本限制下實現更高性能和日益異構的處理架構的挑戰(zhàn)。這一轉變部分源于邊緣人工智能(Edge AI)的快速擴展,越來越多的工作負載被推向數據源附近,這要求更智能、更強大的嵌入式解決方案。

與此同時,開放標準的 RISC-V 架構正在獲得廣泛推動,尤其在微控制器單元(MCU)領域,其采用率和出貨量處于領先地位。這些處理器必須在滿足極端功耗、安全性和可靠性標準的同時,支持邊緣復雜的工作負載。

RISC-V 指令集架構(ISA)設計為簡潔且模塊化,使用大量簡單指令可以降低 CPU 功耗和面積。然而,這種指令冗余可能帶來性能限制,因為復雜操作需要更多周期來完成。

雖然雙發(fā)射、多發(fā)射以及亂序執(zhí)行等技術可以提升每周期指令數(IPC)和性能,但它們通常會增加面積需求,這對資源受限的嵌入式處理器來說是一個挑戰(zhàn)。

指令融合是一項眾所周知的技術,它利用可用的硬件資源來增加指令級并行性(ILP)。指令融合以最小的面積開銷提升 ILP 和 CPU 性能,特別適用于在小型、順序執(zhí)行的處理器中提高性能密度。

本文描述了一種新穎的高級指令融合技術,用于在微架構層面融合成對的 RISC-V 指令。該技術在避免引入單獨的流水線的前提下,實現了雙發(fā)射處理器的主要效率優(yōu)勢,同時保持 RISC-V 兼容性。

什么是高級指令融合?

架構級融合 vs 微架構級融合

某些指令集在架構級別融合指令,另一些指令集則在微架構/實現層面進行指令融合。典型示例包括加載/存儲對以及帶自動增量的加載/存儲。在某些指令集(例如:ARM 和 ARC)中,這些在架構級別融合,即:這些操作由單條指令完成。其他指令集(例如:RISC-V)則采取不同的方法,保持架構指令簡潔,將融合操作交由微架構實現。

微架構級融合相比架構級融合的主要優(yōu)勢包括:

微架構級融合能夠實現更激進的優(yōu)化,例如即使內存地址不連續(xù)也可以融合加載指令對

不同 ISA 之間的二進制兼容性更易維護,因為簡單或小型處理器無需實現指令融合

在微架構級別實現融合要求處理器具有足夠的指令獲取帶寬。簡單的 RISC ISA(例如:RISC-V)比較冗長,因此比在架構級別執(zhí)行指令融合的 ISA 消耗更多指令獲取帶寬。

簡單的順序單發(fā)射處理器每周期的指令獲取帶寬通常不超過 4 字節(jié)。這對微架構融合構成了嚴重限制。大多數融合對需要 16 位壓縮指令。因此,在資源受限的嵌入式處理器中利用微架構融合的第一步是增加其指令獲取帶寬。

實現細節(jié)

資源受限的 RISC-V 設計中的高級指令融合

傳統(tǒng)的融合指令對不需要額外的寄存器文件讀寫帶寬。與其他 RISC-V 指令一樣,一個融合指令對最多從寄存器文件讀取兩個源操作數,并產生一個結果。

然而,某些融合指令對候選會打破這一規(guī)則:

加載雙指令(Load-double):融合兩個加載指令時,需要兩個寄存器寫端口

存儲雙指令(Store-double):融合兩個存儲指令時,需要三個寄存器讀端口(存儲指令有一個公共基地址,但每個存儲指令需要獨立的存儲數據操作數)

乘加指令(MAC):融合乘法和加法時,需要三個寄存器文件讀端口

要利用這些高級融合指令對(雙加載、雙存儲和 MAC),需要額外的硬件資源。更具體地說:寄存器文件應能夠提供三個源操作數,并增加第二個寄存器寫端口。

高級指令融合技術增加了額外的硬件資源,并提高了其利用率。它通過利用微架構融合框架,在順序執(zhí)行處理器上實現了有限的雙發(fā)射能力。采用這種方法,任何映射到不同的功能單元、最多需要三個源操作數、并且最多產生兩個目標寄存器的兩個獨立的指令,都可以被視為高級融合(雙發(fā)射)候選對。

這些指令在前端通過預解碼的操作碼和寄存器操作數標識符進行融合。預解碼的寄存器操作數標識符用于檢測高級融合指令對之間是否存在數據依賴關系。解碼器被增強以接收融合指令的附加信息,但不會被復制。融合指令對中的每條指令被分發(fā)至對應的功能單元。處理器的后端指令融合基本無感,除了增加架構 PC 和處理由融合指令觸發(fā)的異常之外,不需要引入單獨的流水線。

圖 1 展示了帶有高級指令融合的 RISC-V 處理器前端的典型實現。一些示例包括以下指令對:LOAD+ALU、LOAD+BR、LOAD+MPY、ST+BR、ST+ALU。

e40b6280-e0a0-11f0-8c8f-92fbcf53809c.jpg

性能結果

Pollack 定律指出,微架構增強帶來的性能提升通常隨復雜度增加的平方根增長。圖 2 顯示,對于 Synopsys ARC-V RMX(一款帶有高級指令融合的 RISC-V 嵌入式處理器),測得的 CoreMark/MHz 表明其性能提升與硅面積呈線性關系,帶來了更大的性能優(yōu)勢。此外,由于高級指令融合僅產生固定的面積開銷,性能密度的提升也更加顯著。

e4c61b7a-e0a0-11f0-8c8f-92fbcf53809c.jpg

結論

高級指令融合為在資源受限的嵌入式系統(tǒng)中提供了一種有效提升處理器流水線效率的方法,其核心是融合常見的 RISC-V 指令對。該技術在不引入新指令或需要軟件修改的前提下,通過在單發(fā)射、順序執(zhí)行處理器上實現來自不同功能單元的指令融合,完成雙指令發(fā)射,實現了顯著的性能提升,并完全兼容 RISC-V 架構。流水線開銷降低和簡化指令處理帶來了顯著的效率提升,同時這種可擴展的設計支持未來擴展到多指令融合。總體而言,高級指令融合為整個 RISC-V 生態(tài)系統(tǒng)中高效提升處理器性能提供了一種實用且可擴展的解決方案。

e57e93c6-e0a0-11f0-8c8f-92fbcf53809c.jpg

關鍵要點

理想的嵌入式系統(tǒng)設計:該技術專為面積和功耗受限的小型、順序執(zhí)行處理器設計,適用于無法采用傳統(tǒng)多發(fā)射或亂序架構的場景。

無需更改 ISA 即可提升性能:高級指令融合在不引入新指令或破壞 RISC-V 兼容性的情況下,提高 IPC 和流水線效率。

微架構級融合優(yōu)勢:相比架構級融合,在微架構級別進行融合支持更靈活、更激進的優(yōu)化策略。

硬件高效雙發(fā)射:通過融合來自不同功能單元的指令,實現雙指令發(fā)射,僅需適度增加硬件資源,如增加寄存器端口。

可擴展設計:融合框架具有適應性,可擴展支持多指令融合,推動在整個 RISC-V 生態(tài)系統(tǒng)中更廣泛采用。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    20258

    瀏覽量

    252538
  • 嵌入式
    +關注

    關注

    5200

    文章

    20462

    瀏覽量

    334375
  • 指令
    +關注

    關注

    1

    文章

    623

    瀏覽量

    37551
  • RISC-V
    +關注

    關注

    48

    文章

    2889

    瀏覽量

    53065

原文標題:突破能效瓶頸:RISC-V 高級指令融合如何實現性能密度躍升

文章出處:【微信號:Synopsys_CN,微信公眾號:新思科技】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    RISC-V開放架構設計之道|閱讀體驗】RISC-V基礎整數指令

    第2章 RV32I:RISC-V基礎整數指令集 本章重點講解構成RISC-V基礎整數指令集的基本指令
    發(fā)表于 01-31 21:10

    RISC-V的MCU與ARM對比

    集擴展,實現特定功能或加速器。 性能與功耗 RISC-VRISC-V適合用于高效設計實現,其全部RI
    發(fā)表于 05-27 15:58

    rIsc-v的缺的是什么?

    通過軟件模擬或復雜的指令序列來實現一些高級功能,這可能會增加執(zhí)行時間和功耗。 2. 生態(tài)系統(tǒng)支持不足 軟件和工具鏈的可用性:盡管RISC-V社區(qū)在快速發(fā)展,但與成熟的ARM等架構相比,
    發(fā)表于 07-29 17:18

    RISC-V指令集的特點總結

    實現的復雜性,提高處理器的執(zhí)行效率和易于優(yōu)化。 模塊化 定義:RISC-V 指令集支持模塊化擴展,允許開發(fā)者根據具體應用需求添加或定制特定的指令模塊。 優(yōu)勢:模塊化設計使得
    發(fā)表于 08-30 22:05

    RISC-V指令集概述

    RISC-V就是RISC的第五代指令集架構。而RISC-V目標就是“成為一種完全開放的指令集架構,可被任何學術機構或商業(yè)組織自由使用”。
    發(fā)表于 11-30 23:30

    關于RISC-V芯片的應用學習總結

    和模塊化設計成為其顯著優(yōu)勢。物聯網設備通常需要長時間運行,且對體積和功耗有嚴格要求。RISC-V芯片通過精簡指令集和優(yōu)化設計,實現了低功耗的同時保持了高性能,非常適合用于傳感器節(jié)點、智
    發(fā)表于 01-29 08:38

    RISC-V B擴展介紹及實現

    B擴展簡介 RISCV B擴展指的是RISCV用于位運算加速的一個擴展指令集,目的是使用一條指令實現原本需要2-3條指令才能實現的位操作
    發(fā)表于 10-21 13:01

    RISC-V有哪些特點

    50條指令,可以用于實現一個具備定點運算和特權模式等基本功能的處理器?! ?b class='flag-5'>RISC-V的三大特點  第一點是完全開源,對指令集使用,RISC-V
    發(fā)表于 08-25 11:17

    一文看懂RISC-V代碼密度

    本帖最后由 jf_11671167 于 2021-10-9 10:35 編輯 關鍵詞:RISC-V處理器 ,平頭哥玄鐵CPU,RISC-V指令集,IoT芯片,RISC-V
    發(fā)表于 09-01 14:29

    什么是RISC-VRISC-V指令具有哪些特點應用?

    什么是RISC-V?RISC-V指令具有哪些特點應用?自己怎么才能設計出設計一套指令集?
    發(fā)表于 10-14 09:05

    優(yōu)化的關鍵,RISC-V中的性能監(jiān)控

    定制或廠商特定的方案,而缺少通用性能監(jiān)控軟件工具的完整支持。Perf對RISC-V的支持系統(tǒng)級的性能優(yōu)化往往是靠性能剖析和代碼優(yōu)化來實現的,
    發(fā)表于 12-27 08:00

    risc-v是什么意思

    因此得名“RISC Five”。  RISC-V指令集的設計思想  RISC-V 的目標是成為一個通用的指令集架構(ISA)?! ∷苓m
    發(fā)表于 03-30 16:40

    為什么做開源高性能RISC-v核,香山開源高性能RISC-V處理器開發(fā)流程

    RISC-V是一個基于精簡指令集原則的開源指令集架構,那么為什么做開源高性能RISC-v核?
    發(fā)表于 06-22 14:25 ?3391次閱讀
    為什么做開源高<b class='flag-5'>性能</b><b class='flag-5'>RISC-v</b>核,香山開源高<b class='flag-5'>性能</b><b class='flag-5'>RISC-V</b>處理器開發(fā)流程

    risc-v中國峰會直播:如何優(yōu)化RISC-V指令集架構的代碼密度?

    第一屆中國峰會在上海舉辦,以下是小編整理的部分risc-v峰會的內容。主要介紹了影響代碼密度的因素以及如何優(yōu)化RISC-V指令集架構的代碼密度
    的頭像 發(fā)表于 06-23 12:12 ?3892次閱讀
    <b class='flag-5'>risc-v</b>中國峰會直播:如何優(yōu)化<b class='flag-5'>RISC-V</b><b class='flag-5'>指令</b>集架構的代碼<b class='flag-5'>密度</b>?

    第一屆RISC-V中國峰會看點 risc-v開發(fā)要怎么優(yōu)化risc-v指令集架構代碼密度

    在第一屆RISC-V中國峰會上看點很多,RISC-V是開源的,那么代碼密度要怎么控制,會不會因為開源而導致代碼密度特別大? 我們一起來看看risc-
    發(fā)表于 06-23 18:22 ?1w次閱讀
    第一屆<b class='flag-5'>RISC-V</b>中國峰會看點 <b class='flag-5'>risc-v</b>開發(fā)要怎么優(yōu)化<b class='flag-5'>risc-v</b><b class='flag-5'>指令</b>集架構代碼<b class='flag-5'>密度</b>