91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

HPC處理器的多核架構挑戰(zhàn)

王燕 ? 來源:十個名字V ? 作者:十個名字V ? 2022-07-14 16:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著半導體設計團隊競相利用“超越摩爾”,新的架構選擇和挑戰(zhàn)層出不窮。以超大規(guī)模硬件為例,其中一系列工作負載——數據庫分析、人工智能、微服務、視頻編碼和高復雜性計算算法——需要一系列處理器解決方案。性能、功耗和成本仍然至關重要,但現(xiàn)在架構師自己交付。沒有一種“最好”的架構;處理器必須設計為最好地服務于特定類別的工作負載和價格/性能配置文件。

多核架構挑戰(zhàn)

AWS Graviton2 有 64 個 Arm Neoverse N1 內核,它們平鋪在單個芯片上的連貫網狀網絡中。其他設計已經擴展到多芯片,芯片之間具有緩存一致的連接。多芯片實現(xiàn)為進一步增長和降低不太先進工藝成本的潛力開辟了空間。雖然這些新架構選項擴展了可能性,但它們也帶來了新的設計挑戰(zhàn)。在眾多選擇中,哪些架構真正能夠以合適的價格為合適的工作負載提供更高的吞吐量?

這里的一個問題是,應如何針對目標類應用程序的物理內存對相干網狀網絡中的分布式系統(tǒng)緩存進行分區(qū)。優(yōu)化這些選擇,甚至優(yōu)化哪些 CPU 內核最能滿足需求,都需要以周期級精度運行實際工作負載。高級模型根本不足以達到此目的。

poYBAGLOsl2ALQFSAARV9EQJl4Q431.png

poYBAGLOsl2ALQFSAARV9EQJl4Q431.png

圖:多芯片實現(xiàn)中不同的 I/O 延遲。(來源:Cadence

連貫網格中的處理器陣列之間的通信延遲在單個裸片內將相對一致,但在多裸片實現(xiàn)中裸片之間的延遲可能會有很大差異(見圖)。因此,設計發(fā)展出多種架構,可在未來使用——全連接網格、集線器和輻條內存系統(tǒng)或其他 2D 和 3D 結構,其中一個小芯片提供大系統(tǒng)緩存和主內存訪問。此外,堆棧中的其他小芯片相互通信,并通過集線器與主存儲器通信。

有效探索所有這些選項在很大程度上取決于針對實際工作負載準確建模性能。建模和分析只能在 RTL 域中使用仿真和原型進行探索。

SystemReady 合規(guī)性

服務器架構師面臨的另一種問題是操作系統(tǒng)兼容性。您可以直接在大多數筆記本電腦上啟動任何 Linux 發(fā)行版、虛擬機管理程序或 Windows。要在基于 Arm 的服務器上啟動,此責任由服務器制造商和 Arm 分擔。

Arm 開發(fā)了一個名為 SystemReady 的合規(guī)套件,以標準化一組最低要求,以解決這個問題和其他合規(guī)問題。PCIe 合規(guī)性是一個特別重要的組件,因為它直接為許多服務器接口協(xié)議提供或作為主要 I/O 的基礎,以實現(xiàn)快速存儲、快速網絡和芯片外連貫接口。這里特別重要的是通過 PCIe 進行遠程服務器引導。Arm 將此合規(guī)套件作為在 UEFI (BIOS) 層上運行的軟件提供。Cadence 與 Arm 合作了幾年,旨在將測試縮減為具有 PCIe 流量生成庫的最小裸機測試套件,該庫的仿真速度比 UEFI 測試套件更快,可以快速調整硬件調試。

服務器開發(fā)人員面臨的另一個挑戰(zhàn)是 PCIe 使用強排序的內存模型。Arm 支持標準允許的松散排序的內存模型。但只有強排序才能保證沒有死鎖。在松散訂購下,硬件/固件開發(fā)人員必須提供該保證。不幸的是,這無法通過合規(guī)性檢查。集成商必須再次在仿真器或原型系統(tǒng)上通過廣泛的用例測試證明設計是死鎖安全的。

使用 Cadence System 驗證 IP 的方法使工程師能夠在半天內啟動并運行系統(tǒng)級測試套件,該套件可以根據 SystemReady 要求驗證 PCIe 集成。此方法還可用于演示從連接到 PCIe 的閃存設備模型引導 SUSE Linux 和 Windows,這引起了高級服務器社區(qū)的極大興趣。

不僅適用于服務器

Arm Neoverse 平臺不僅是為高端服務器設計的。該家族已經開始進入其他云應用程序和通信基礎設施,一直到邊緣。在其中一些應用程序中,多核架構已經很重要。在大多數此類應用程序(例如汽車)中,對一系列開放和商業(yè)操作系統(tǒng)的開箱即用支持是必不可少的。

我相信用于自動生成系統(tǒng)級內容和驗證系統(tǒng)級目標合規(guī)性的工具將在許多市場中具有廣泛的適用性。EDA 行業(yè)需要超越傳統(tǒng)的單接口單協(xié)議驗證 IP (VIP) 范圍,走向多接口多協(xié)議系統(tǒng)級 VIP 的新時代。

審核編輯:湯梓紅
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    20256

    瀏覽量

    252425
  • ARM
    ARM
    +關注

    關注

    135

    文章

    9554

    瀏覽量

    392033
  • 服務器
    +關注

    關注

    14

    文章

    10256

    瀏覽量

    91517
  • HPC
    HPC
    +關注

    關注

    0

    文章

    346

    瀏覽量

    24988
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    SMJ320C80數字信號處理器架構、特性與應用全解析

    SMJ320C80數字信號處理器架構、特性與應用全解析 在當今數字化的時代,數字信號處理器(DSP)在眾多領域中發(fā)揮著至關重要的作用。SMJ320C80作為一款高性能的單芯片并行處理器
    的頭像 發(fā)表于 03-06 16:55 ?980次閱讀

    探索TDA54x Jacinto?處理器:高性能與安全的完美融合

    我們帶來了哪些新的技術亮點和應用可能。 文件下載: tda54-q1.pdf 強大的功能特性 多核處理架構 TDA54x處理器擁有豐富的處理
    的頭像 發(fā)表于 03-06 16:50 ?960次閱讀

    MAX77874:16A高性能四相降壓調節(jié),引領多核處理器電源解決方案

    MAX77874:16A高性能四相降壓調節(jié),引領多核處理器電源解決方案 在電子設備飛速發(fā)展的今天,多核心CPU和GPU處理器對電源的要求
    的頭像 發(fā)表于 03-06 16:40 ?955次閱讀

    TAS3103A數字音頻處理器:特性、架構與應用詳解

    TAS3103A數字音頻處理器:特性、架構與應用詳解 引言 在當今數字化音頻處理領域,一款高性能、可配置的音頻處理器至關重要。德州儀器(Texas Instruments)的TAS31
    的頭像 發(fā)表于 02-27 16:25 ?131次閱讀

    Chiplet,如何助力HPC?

    (chipletarchitecture),它能夠以更低的成本提供比單芯片處理器更高的性能,同時能耗降低高達10倍。這些優(yōu)勢使得小芯片架構在未來高性能計算和人工智
    的頭像 發(fā)表于 02-26 15:15 ?719次閱讀
    Chiplet,如何助力<b class='flag-5'>HPC</b>?

    Cortex-M0 處理器介紹

    功耗的32位處理器。 Cortex-M0是Cortex-M家族中的M0系列。最大特點是低功耗的設計。Cortex-M0為32位、3級流水線RISC處理器,其核心仍為馮.諾依曼結構,是指令和數據共享同一總線的架構
    發(fā)表于 01-16 08:04

    云拼接處理器的性能如何?

    性能方面表現(xiàn)卓越,以下從多個維度進行深入解析。 一、硬件設計:穩(wěn)定與高效的基石 融大視覺的云拼接處理器采用嵌入式純硬件設計,這一設計理念使其區(qū)別于依賴操作系統(tǒng)的軟件方案。由于沒有傳統(tǒng)操作系統(tǒng)的復雜架構,系統(tǒng)完
    的頭像 發(fā)表于 09-05 00:11 ?729次閱讀

    Andes晶心科技推出AndesCore 46系列處理器家族

    Andes晶心科技,作為高效能、低功耗32/64位RISC-V處理器核的領導供貨商及RISC-V國際組織的創(chuàng)始首席會員,今日宣布推出具有4個成員的AndesCore 46系列處理器家族。首款成員AX46MPV是一款全新64位多核
    的頭像 發(fā)表于 08-13 14:02 ?2668次閱讀

    【老法師】多核異構處理器中M核程序的啟動、編寫和仿真

    有很多研究單片機的小伙伴在面對多核異構處理器時,可能會對多核的啟動流程感到困惑——因為不熟悉GCC編程和GDB調試,所以也無法確定多核異構處理器
    的頭像 發(fā)表于 08-13 09:05 ?3996次閱讀
    【老法師】<b class='flag-5'>多核</b>異構<b class='flag-5'>處理器</b>中M核程序的啟動、編寫和仿真

    T113-i芯片技術解析:高性能嵌入式處理器的創(chuàng)新設計

    ?芯片概述 明遠智睿的T113-i芯片是一款由全志科技推出的高性能、低功耗嵌入式處理器,主要面向智能家居、工業(yè)控制、消費電子等領域。該芯片基于ARM架構,集成了多核CPU、GPU和豐富的接口資源,在
    的頭像 發(fā)表于 07-17 14:15 ?1311次閱讀

    龍芯處理器支持WINDOWS嗎?

    龍芯處理器目前不支持原生運行Windows操作系統(tǒng),主要原因如下: 架構差異 龍芯架構:龍芯早期基于MIPS架構,后續(xù)轉向自主研發(fā)的LoongArch指令集(與x86/ARM不兼容
    發(fā)表于 06-05 14:24

    HPM5E31IGN單核 32 位 RISC-V 處理器

    問題。其單核設計在保證性能的同時實現(xiàn)了優(yōu)異的能效比,主頻可達248MHz,遠超同類ARM架構處理器。這種高性能特性使其能夠輕松應對實時數據處理、復雜算法運算等挑戰(zhàn)性任務。核心特性
    發(fā)表于 05-29 09:23

    技術分享 | 如何在2k0300(LoongArch架構處理器上跑通qt開發(fā)流程

    技術分享 | 如何在2k0300開發(fā)板(LoongArch架構處理器上跑通qt開發(fā)流程
    的頭像 發(fā)表于 05-20 11:05 ?904次閱讀
    技術分享 | 如何在2k0300(LoongArch<b class='flag-5'>架構</b>)<b class='flag-5'>處理器</b>上跑通qt開發(fā)流程

    熱成像儀為何都在瘋狂卷多核處理器?“多核大戰(zhàn)”背后的真相你知道嗎?

    ”遠遠不夠, “看得清”“不卡頓”“多任務并行”成了剛需。 于是,一場關于“多核處理器”的行業(yè)競賽悄然拉開帷幕。 多核,不只是手機的事,熱成像儀也在“追核” 過去我們常常聽說手機從雙核進化到八核甚至二十核,現(xiàn)在同樣的邏輯正發(fā)生在
    的頭像 發(fā)表于 04-27 15:41 ?785次閱讀

    光子 AI 處理器的核心原理及突破性進展

    ,光子 AI 處理器依靠光信號的傳輸、調制及檢測來完成計算任務,因其具備高速、低功耗、高帶寬等突出優(yōu)勢,被視作突破現(xiàn)有計算瓶頸的關鍵技術之一。 核心原理及面臨的技術挑戰(zhàn) 光子 AI 處理器的核心原理,是用光子取代電子進行運算。具
    的頭像 發(fā)表于 04-19 00:40 ?4184次閱讀