91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

進迭時空第三代高性能核X200研發(fā)進展

進迭時空 ? 2025-06-06 16:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

繼X60和X100之后,進迭時空正在基于開源香山昆明湖架構研發(fā)第三代高性能處理器核X200。與進迭時空的第二代高性能核X100相比,X200的單位性能提升75%以上,達到了16 SpecInt2006/GHz,單核性能提升125%以上,達到了50 SpecInt2006/Core,主要應用于超級AI計算機、云計算、高階自動駕駛等高性能計算場景。



X200是一款6發(fā)射、14級流水線的超標量亂序高性能RISC-V核。X200的整體特性如下:


SpecInt2006 > 16分/GHz,單核頻率可達3.2GHz @ 7nm

支持RVV1.0,Vector Crypto 擴展以及進迭時空 IME 擴展

支持RVH,AIA技術,并且能夠與進迭時空自研IOMMU配合實現(xiàn)完整的虛擬化

支持安全隔離技術,與進迭時空自研 IOPMP配合實現(xiàn)云計算級別的機密計算安全方案

支持服務器級別RAS,Trace特性

支持全芯片高效CHI互聯(lián),與進迭時空自研NoC總線配合最大128核心的并行互聯(lián)

將支持2025年定稿的最新 Profile 規(guī)范(RVA25)


14bb077c-42b4-11f0-986f-92fbcf53809c.png



X200 架構與微架構創(chuàng)新


基于開源香山,快速迭代


“昆明湖”是開芯院開發(fā)的第三代高性能核,整體性能對標 Arm N2,達到 SpecInt2006 性能15分/GHz。開芯院不僅開源了昆明湖全部的設計代碼,還提供了昆明湖的驗證環(huán)境、Golden model、性能分析工具(如完整的Simpoint Flow)以及經(jīng)過部分對齊的昆明湖Gem5模型?;陂_源的昆明湖性能模型和架構設計,可以大大減少了處理器設計過程中架構探索的時間,并在開源性能模型的基礎上進一步做微架構創(chuàng)新和性能迭代。


取指前端:昆明湖采用了分支預測和指令緩存訪問解耦(下稱Decouple)的架構,最大限度減少分支指令對高帶寬取指需求的影響。分支主預測器采用兩級FTB 加TAGE-SC結構,配合XS-Gem5的前端建模,設計了合理的參數(shù)規(guī)格;


執(zhí)行后端:昆明湖實現(xiàn)了基于推測的指令喚醒與發(fā)射、Move指令消除、基于Checkpoint檢測點的指令恢復等多項機制,有效降低后端指令執(zhí)行延遲,并提升推測錯誤時的恢復速度;


訪存單元:昆明湖探索了多種預取機制,基于第一級數(shù)據(jù)緩存實現(xiàn)了Stride, Stream, SMS, SPB的混合預取算法,基于私有的二級緩存L2 Cache實現(xiàn)了BOP與Temporal的算法,在SpecInt2006基準測試上取得了出色的效果。


因為香山核的全套開源以及出色的微架構設計,進迭時空X200選擇基于開源昆明湖研發(fā)第三代高性能CPU核。在昆明湖的架構上,進迭時空根據(jù)面向的計算場景,對部分模塊進行了優(yōu)化,進一步平衡了部分模塊的PPA指標。X200 SpecInt2006能夠達到16分/GHz,相較前代X100提升75%以上。


14d184ca-42b4-11f0-986f-92fbcf53809c.png



取指前端升級


取指前端作為CPU核流水線的起點,其效率直接決定了后級流水線的運行負荷,是影響指令吞吐量的關鍵瓶頸。近年來,Apple M2, AMD Zen4 等處理器架構均在取指前端進行了大量的優(yōu)化。


X200的取指前端,基于 Decouple 架構,進一步改進了FTB的結構,提升分支指令的存儲利用率;擴展了對2-Taken Branch 場景的支持,可實現(xiàn)每周期至多預測2個跳轉分支。


相應的,X200優(yōu)化了指令Cache的組織結構,支持兩個獨立的取指塊并行取指。通過調(diào)整指令Cache Tag和Data的訪問流水級,緩解了指令Cache的訪問沖突,進一步提升整體的取指帶寬。



訪存及互聯(lián)設計優(yōu)化


訪存及互聯(lián)往往是CPU核中最復雜的部分,訪存單元的設計也極大地影響了CPU核的性能。


X200的訪存單元優(yōu)化了整體訪存流水線,支持了Load/Store復用流水線,平衡了性能和資源的消耗。針對整個訪存通路,通過指令提前喚醒和流水線優(yōu)化,極致優(yōu)化訪存延遲,L1 Cache的Load To Use Latency控制在4個周期,2M Priave L2 Cache控制在10個周期,Cluster Level Cache控制在~30個周期;針對應用場景,進一步調(diào)優(yōu)預取算法;核級別和簇級別均支持超深的Outstanding能力,面向AI等大數(shù)據(jù)量搬運場景,允許更多事務在下個層次的內(nèi)存系統(tǒng)中并行,減少整體內(nèi)存的訪問延遲。


在互聯(lián)的設計上,從核互聯(lián)成簇以及多簇之間的互聯(lián),均使用了CHI的標準協(xié)議,最高可支持到CHI.F協(xié)議,核間根據(jù)簇中核的規(guī)模,使用 Ring/Mesh Bus進行互聯(lián),在提升可擴展性的同時,進一步提升簇內(nèi)總線的頻率與帶寬。支持Cache Stash的功能,能夠通過主動的緩存預存,降低關鍵數(shù)據(jù)包的獲取延遲。


14e2f354-42b4-11f0-986f-92fbcf53809c.png



向量及AI單元優(yōu)化


X200支持RISC-V Vector1.0及Vector Crypto指令集,VLEN支持256/512/1024可配,數(shù)據(jù)處理寬度支持4x128/4x256可配。矢量整型指令支持SEW=8/16/32/64;矢量浮點指令支持SEW=FP16/BF16/FP32/FP64。訪存處理寬度上支持3x128/3x256的可配,并支持矢量訪存指令的非對齊訪問。


同時,X200支持符合RV規(guī)范的IME擴展的 AI 增強指令

(INT4/INT8/FP8/FP16/BF16/FP32),提供靈活易用的融合 AI 算力。此外,X200可配地通過接口擴展的方式支持AME擴展,以提供更加定制化的AI算力。


在此基礎上,X200針對常見的應用場景,結合算法特點,對向量/AI處理能力和能效進行優(yōu)化,并重點對向量訪存和向量計算資源的均衡和協(xié)同、復雜訪存pattern以及復雜元素置換操作在亂序核中的的實現(xiàn)等方面進行深度調(diào)優(yōu)。同時,考慮到大帶寬向量帶來的龐大資源投入,X200基于對大量算法的模擬分析,評估并權衡不同指令對資源/功耗開銷以及性能回報,做了不同層次的向量可配性,以滿足不同應用場景的性能和PPA需求。



新擴展指令集支持


RISC-V是一個高速發(fā)展、充滿活力的指令集,2024年,RISC-V共批準(Ratified)了23個規(guī)范,RISC-V正快速在各個場景下,拉近與x86、Arm之類成熟指令集的距離。X200面向應用領域的需求,進一步對RISC-V最新的擴展進行了支持:


支持QoS規(guī)范(CBQRI, QoSID),進一步提升高優(yōu)先級數(shù)據(jù)的延遲表現(xiàn),增強系統(tǒng)的穩(wěn)定性和實時性

支持Svadu, Zacas擴展,分別降低多核間頁表更新的代價,減少多核搶鎖的概率,提升多核系統(tǒng)的效率

支持CFI擴展,使用Shadow Stack和 Landing Pad技術保護內(nèi)存,降低系統(tǒng)被攻破的概率


X200 也將持續(xù)跟進RISC-V的最新擴展以及 Profile,將會支持今年定稿的最新Profile(預計為 RVA25)。



服務器級特性優(yōu)化


X100已經(jīng)實現(xiàn)了完整虛擬化、符合云計算場景的安全功能、符合計算機7*24小時穩(wěn)定工作的RAS特性等。X200在X100的基礎上,在完整實現(xiàn)這些功能的同時,也將做進一步增強。重點面向云服務應用場景,通過優(yōu)化TLB及Walk Cache的組織形式,減少虛擬化多級地址翻譯帶來的性能損失;擴展Trace以及HPM(高性能計數(shù)器)功能,配合自研總線進行系統(tǒng)級優(yōu)化,提升性能分析、問題定位的跟蹤效率;支持更多RAS信息上報,配合全通路CHI總線支持,進一步提升總線的穩(wěn)定性,配合進迭時空服務器管理固件,能夠提升服務器系統(tǒng)可發(fā)現(xiàn)錯誤、可糾正錯誤、可管理錯誤能力。




借助于香山昆明湖出色的架構和微架構基礎,進迭時空開展了X200的研發(fā)工作,并實現(xiàn)了對第二代處理器核X100的大幅性能提升。當前,X200已經(jīng)完成了代碼開發(fā)并進入了持續(xù)的PPA優(yōu)化階段,預計將在2025年Q4季度研發(fā)完畢,基于X200的高性能計算芯片將在2026年底面市。


更多X200的設計細節(jié)將在后續(xù)的公司微信公眾號中陸續(xù)做介紹,敬請大家期待。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    20255

    瀏覽量

    252250
  • 進迭時空
    +關注

    關注

    0

    文章

    61

    瀏覽量

    521
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Canonical 與時空攜手:Ubuntu 全面支持 K3/K1 RISC-V AI CPU 計算平臺

    的深度融合,將為全球開發(fā)者帶來強大、靈活、可靠的計算解決方案。專為高性能智能計算設計的硬件平臺時空K3和K1芯片均基于自主研發(fā)
    的頭像 發(fā)表于 02-06 09:32 ?2.7w次閱讀
    Canonical 與<b class='flag-5'>進</b><b class='flag-5'>迭</b><b class='flag-5'>時空</b>攜手:Ubuntu 全面支持 K3/K1 RISC-V AI CPU 計算平臺

    龍騰半導體推出全新第三代超結MOSFET技術平臺

    今天,龍騰半導體正式交出答卷 -- 基于自主工藝路線開發(fā)的全新第三代(G3) 超結 MOSFET技術平臺。
    的頭像 發(fā)表于 01-22 14:44 ?625次閱讀
    龍騰半導體推出全新<b class='flag-5'>第三代</b>超結MOSFET技術平臺

    時空2025年度十大開發(fā)者揭曉

    回顧2025,RISC-V與AI的融合持續(xù)深化,推動智能計算進入更開放、更高效的新階段。在人工智能發(fā)展的浪潮中,廣大開發(fā)者始終與時空并肩前行,共同探索技術前沿與實踐落地。
    的頭像 發(fā)表于 01-12 20:07 ?616次閱讀
    <b class='flag-5'>進</b><b class='flag-5'>迭</b><b class='flag-5'>時空</b>2025年度十大開發(fā)者揭曉

    Neway第三代GaN系列模塊的生產(chǎn)成本

    %。研發(fā)與認證成本技術迭代:GaN技術處于快速發(fā)展期,Neway需持續(xù)投入研發(fā)(如第三代模塊研發(fā)費用占比超15%)以保持技術領先。行業(yè)認證:進入新能源車、軌道交通等領域需通過AEC-Q
    發(fā)表于 12-25 09:12

    芯聚成都 | 時空邀您共赴 ICCAD-Expo 2025

    芯聚成都 | 時空邀您共赴 ICCAD-Expo 2025
    的頭像 發(fā)表于 11-14 18:02 ?3682次閱讀
    芯聚成都 | <b class='flag-5'>進</b><b class='flag-5'>迭</b><b class='flag-5'>時空</b>邀您共赴 ICCAD-Expo 2025

    時空K1 Linux kernel upstream進展 | 取之于開源,貢獻于開源

    的持續(xù)繁榮。為此,我們和眾多社區(qū)開發(fā)者一道持續(xù)推進相關工作,以下為K1芯片Linuxkernelupstream的最新工作進展時空將upstream工作分為了3
    的頭像 發(fā)表于 10-30 18:06 ?8751次閱讀
    <b class='flag-5'>進</b><b class='flag-5'>迭</b><b class='flag-5'>時空</b>K1 Linux kernel upstream<b class='flag-5'>進展</b> | 取之于開源,貢獻于開源

    時空參加2025 RISC-V北美峰會,披露第二RISC-V AI CPU芯片 K3 進展

    的RISC-VAICPU計算生態(tài)企業(yè),時空攜前沿技術和量產(chǎn)產(chǎn)品精彩亮相,在現(xiàn)場設置展臺,發(fā)表了閃電演講,并向全球行業(yè)同仁分享了企業(yè)產(chǎn)品最新研發(fā)進展。在閃電演講環(huán)節(jié),
    的頭像 發(fā)表于 10-24 18:33 ?6877次閱讀
    <b class='flag-5'>進</b><b class='flag-5'>迭</b><b class='flag-5'>時空</b>參加2025 RISC-V北美峰會,披露第二<b class='flag-5'>代</b>RISC-V AI CPU芯片 K3 <b class='flag-5'>進展</b>

    取之于開源,貢獻于開源:時空AI計算生態(tài)開源貢獻

    時空和opencv社區(qū)進行合作,基于時空的RISC-VAICPU芯片K1,優(yōu)化了opencv的基礎視覺算法在RISC-Vvector1.0的性能
    的頭像 發(fā)表于 10-21 09:03 ?5792次閱讀
    取之于開源,貢獻于開源:<b class='flag-5'>進</b><b class='flag-5'>迭</b><b class='flag-5'>時空</b>AI計算生態(tài)開源貢獻

    開啟連接新紀元——芯科科技第三代無線SoC現(xiàn)已全面供貨

    搭載第三代無線SoC中的Secure Vault安全技術率先通過PSA 4級認證
    的頭像 發(fā)表于 10-09 15:57 ?4.3w次閱讀

    校園招聘 | 時空2026校園招募令

    校園招聘 | 時空2026校園招募令
    的頭像 發(fā)表于 09-11 09:05 ?837次閱讀
    校園招聘 | <b class='flag-5'>進</b><b class='flag-5'>迭</b><b class='flag-5'>時空</b>2026校園招募令

    電鏡技術在第三代半導體中的關鍵應用

    第三代半導體材料,以碳化硅(SiC)和氮化鎵(GaN)為代表,因其在高頻、高效率、耐高溫和耐高壓等性能上的卓越表現(xiàn),正在成為半導體領域的重要發(fā)展方向。在這些材料的制程中,電鏡技術發(fā)揮著不可或缺的作用
    的頭像 發(fā)表于 06-19 14:21 ?726次閱讀
    電鏡技術在<b class='flag-5'>第三代</b>半導體中的關鍵應用

    迎接泛機器人時代:時空如何以RISC-V架構數(shù)智未來

    21世紀經(jīng)濟報道記者趙娜杭州報道“這是我們的時代?!苯衲?月的一天,21世紀經(jīng)濟報道記者來到時空杭州總部。
    的頭像 發(fā)表于 06-06 17:00 ?1119次閱讀
    迎接泛機器人時代:<b class='flag-5'>進</b><b class='flag-5'>迭</b><b class='flag-5'>時空</b>如何以RISC-V架構數(shù)智未來

    第三代半導體的優(yōu)勢和應用領域

    隨著電子技術的快速發(fā)展,半導體材料的研究與應用不斷演進。傳統(tǒng)的硅(Si)半導體已無法滿足現(xiàn)代電子設備對高效能和高頻性能的需求,因此,第三代半導體材料應運而生。第三代半導體主要包括氮化鎵(GaN
    的頭像 發(fā)表于 05-22 15:04 ?2442次閱讀

    英飛凌發(fā)布第三代3D霍爾傳感器TLE493D-x3系列

    近日,英飛凌的磁傳感器門類再添新兵,第三代3D霍爾傳感器TLE493D-x3系列在經(jīng)歷兩產(chǎn)品的迭代之后應運而生。
    的頭像 發(fā)表于 05-22 10:33 ?1533次閱讀
    英飛凌發(fā)布<b class='flag-5'>第三代</b>3D霍爾傳感器TLE493D-<b class='flag-5'>x</b>3系列

    金升陽推出高性能第三代插件式單路驅動電源

    隨著新能源電動汽車行業(yè)的蓬勃發(fā)展,其動力系統(tǒng)的關鍵組件:IGBT及SiC MOSFET驅動件需求量十分可觀;為更好地迎合上述市場的需求,金升陽推出了高性能第三代插件式單路驅動電源QA_(T)-R3S系列(“T”為貼片式封裝)。
    的頭像 發(fā)表于 04-09 17:25 ?1091次閱讀
    金升陽推出<b class='flag-5'>高性能</b><b class='flag-5'>第三代</b>插件式單路驅動電源