91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

百核千核,服務(wù)器芯片多核才是王道?

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚 ? 2022-06-01 00:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

要說造芯這件事,不僅手機和汽車廠商熱衷于此,如今服務(wù)器廠商也紛紛投入自研大軍中來,無論是國內(nèi)的阿里云,還是國外的亞馬遜,在收購一大批芯片設(shè)計廠商網(wǎng)羅了一眾芯片設(shè)計精銳后,也開始推出基于自己芯片的服務(wù)器,所用工藝也已經(jīng)升級到了7nm和5nm。

此外,第三方服務(wù)器芯片廠商也順勢發(fā)力,打算為這些云服務(wù)廠商提供更高的吸引力,而不是讓他們整天想著節(jié)省成本用自研方案替換掉自己的產(chǎn)品。好在大部分云服務(wù)廠商自研的芯片主要還是集中在AI加速芯片和網(wǎng)絡(luò)芯片這一塊,CPU很大一部分仍是第三方的地盤。而在第三方的CPU設(shè)計中,我們可以看到多核已經(jīng)成了當(dāng)下的主流方案。

多核云端更吃香?

首先我們來看最常見也最直接的一種提升性能方式,堆核心。這種操作我們已經(jīng)在消費芯片或是各個電子產(chǎn)品的宣傳術(shù)語中聽得耳朵生繭了,且向來都是一種相當(dāng)有效的性能提升方式。盡管則對芯片的面積限制較大,但不可否認(rèn)的是,在對面積沒那么看重的服務(wù)器市場上,走多核路線的芯片廠商越來越多。

AmpereComputing的AmpereAltra應(yīng)該是國內(nèi)出貨量最高的Arm服務(wù)器CPU系列了,這款最高128核的處理器已經(jīng)在不少云服務(wù)的實例上亮相。AmpereComputing與微軟Azure和OracleCloud達成了合作,在中國不僅擁有阿里云、騰訊云、京東云和UCloud這些公有云客戶,百度、美團和字節(jié)跳動等公司也在使用其產(chǎn)品。

AmpereAltraMax封裝 / AmpereComputing


再來看看英偉達的ArmCPU Grace,雖然采用了Arm的Neoverse參考設(shè)計,但英偉達同樣選了144核的多核心設(shè)計,那么為何多核在服務(wù)器上如此吃香呢?我們上面也提到了AmpereAltra在中國收獲了不小的市場,其實歸根結(jié)底就是其多核心數(shù)的功勞。

國內(nèi)使用公有云的用戶數(shù)遠超國外,對于云服務(wù)廠商來說,這種多核處理器意味著可以將單服務(wù)器切分為更多的vCPU,也就意味著更多的可用實例。這還沒完,以AmpereAltra為例,每個核心上只運行單個線程,這樣即便多用戶同時使用下,依然能夠維持穩(wěn)定的性能。

Ampere處理器路線圖 / AmpereComputing


值得一提的是,Ampere近期發(fā)布了自研5nm處理器,AmpereOne,一個基于自研Arm核心的服務(wù)器處理器。這對于其他廠商來說或許無法實現(xiàn),但Ampere作為Arm架構(gòu)的授權(quán)商,是可以像高通、華為和蘋果等廠商一樣,開發(fā)定制自己的Arm核心的。

也或許是因為這次終于沒有繼續(xù)沿用ArmNeoverseN1或N2這樣的參考設(shè)計,Ampere才將這一產(chǎn)品命名為AmpereOne。Ampere并沒有公布這一產(chǎn)品的核心數(shù),但從現(xiàn)有產(chǎn)品最小核心數(shù)也有32核的設(shè)計,以及AmpereOne實物圖與AmpereAltraMax近似的封裝來推斷,這一新品追求的必然是更高性能的云原生應(yīng)用,而不是面向只需較低核心數(shù)就能滿足需求的邊緣計算市場。

服務(wù)器AI芯片靠數(shù)量和能耗制勝

與處理器芯片處理通用計算的多核策略不同,AI芯片的多核主要還是提高AI計算效率,而且單核能效比和單位面積效率往往高于傳統(tǒng)的處理器架構(gòu),導(dǎo)致核心數(shù)更多。以打造千核RISC-V AI芯片的Esperanto為例,其ET-SoC-1芯片基于臺積電7nm打造,集成了1092個RISC-V核心。

ET-SoC-1芯片 / Esperanto


但就是這樣一個千核芯片,卻可以做到20W以內(nèi)的功耗和570mm2的diesize。正因如此,即便單個ET-SoC-1的算力不及英偉達A100這類GPU,也可以憑借多塊芯片組成的AI加速器板卡來實現(xiàn)同等的性能,甚至低上一大截的功耗。

對于依賴陣列乘法器這類專用硬件和少量CPU核心的芯片,一旦問題不能完全由專用硬件解決,就會把任務(wù)交給有限的通用CPU核心。而Esperanto的ET-SoC-1方案中,上千顆通用RISC-V核心帶來的完全并行可以顯著加快執(zhí)行速度。何況哪怕相較于5nm而言,7nm的能效比也還是非常優(yōu)異的,所以更適合這類超多核心數(shù)的設(shè)計,也更符合數(shù)字中心的低碳設(shè)計理念。

結(jié)語

有的讀者可能會有疑惑,既然多核能給服務(wù)器芯片帶來顯著的提升,為何英特爾AMD這些x86服務(wù)器芯片廠商不設(shè)計百核以上的架構(gòu)呢?這就與CISC與RISC架構(gòu)的差異有關(guān)了,哪怕在同等工藝和同等核心數(shù)下,x86芯片的diesize也絕對要大于Arm和RISC-V芯片,而隨著diesize的增加,芯片的良率也會一并減少。再者就是多核下的并行問題了,一些通用計算任務(wù)在多核下的并行執(zhí)行效率并不高,而且會大幅提升復(fù)雜性。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    463

    文章

    54031

    瀏覽量

    466459
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    14

    文章

    10267

    瀏覽量

    91533
  • 服務(wù)器芯片
    +關(guān)注

    關(guān)注

    2

    文章

    127

    瀏覽量

    19782
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    使用rk3568開發(fā)板,0\\1\\3運行l(wèi)inux,2運行hal,在0中怎么關(guān)閉2

    使用rk3568開發(fā)板,0\\\\1\\\\3運行l(wèi)inux,2運行hal,想在內(nèi)核中通過smc指令完成核0對2得啟動和關(guān)閉,文件系統(tǒng)中/sys/rk_amp目錄下有個boot_cpu文件,可以發(fā)起對
    發(fā)表于 10-27 10:09

    多核服務(wù)器的CPU親和性配置與負載均衡優(yōu)化

    某大廠的資深架構(gòu)師小王最近遇到了一個頭疼的問題:新采購的雙路AMD EPYC 7763(128核心)服務(wù)器,在高并發(fā)場景下的性能表現(xiàn)竟然還不如之前的32服務(wù)器。經(jīng)過深入排查,發(fā)現(xiàn)問題出在CPU親和性配置上。通過正確的配置,最終
    的頭像 發(fā)表于 08-27 14:45 ?883次閱讀

    【老法師】多核異構(gòu)處理中M程序的啟動、編寫和仿真

    文章,小編就將以飛凌嵌入式的OKMX8MP-C開發(fā)板為例,為大家介紹多核異構(gòu)處理M程序的啟動配置、程序編寫和實時仿真的過程。
    的頭像 發(fā)表于 08-13 09:05 ?4012次閱讀
    【老法師】<b class='flag-5'>多核</b>異構(gòu)處理<b class='flag-5'>器</b>中M<b class='flag-5'>核</b>程序的啟動、編寫和仿真

    國產(chǎn)算力新標(biāo)桿:集特GSC-2000-12雙路服務(wù)器,重塑高性能計算的“中國方案”

    以“全棧國產(chǎn)化”基因和“卡集群”的硬核實力,悄然改寫著中國高端服務(wù)器的市場格局。搭載飛騰新一代旗艦芯片騰云S5000C-64,這款專為大數(shù)據(jù)、AI訓(xùn)練設(shè)計的機架
    的頭像 發(fā)表于 07-03 11:14 ?2677次閱讀
    國產(chǎn)算力新標(biāo)桿:集特GSC-2000-12雙路<b class='flag-5'>服務(wù)器</b>,重塑高性能計算的“中國方案”

    請問雙芯片如何調(diào)試?

    芯片如何調(diào)試?比如有很多M4+M0的芯片,是分開調(diào)試合適可以一起調(diào)試?
    發(fā)表于 06-19 07:32

    如何選擇 邊緣計算服務(wù)器

    邊緣計算服務(wù)器選型指南(2025年更新版) 一、明確應(yīng)用場景需求 場景細分? 工業(yè)控制、自動駕駛等需?毫秒級響應(yīng)?的場景,優(yōu)先選擇集成多核處理(如Xeon D系列)和實時算法加速模塊的機型,確保
    的頭像 發(fā)表于 05-06 07:58 ?751次閱讀
    如何選擇 邊緣計算<b class='flag-5'>服務(wù)器</b>

    國外bgp服務(wù)器多少錢?# 服務(wù)器

    服務(wù)器
    jf_57681485
    發(fā)布于 :2025年04月24日 14:19:00

    新加坡服務(wù)器延遲大嗎?真相在這里#新加坡服務(wù)器 #服務(wù)器

    服務(wù)器
    jf_57681485
    發(fā)布于 :2025年04月18日 13:48:50

    龍芯3C6000服務(wù)器CPU,1632線程,國產(chǎn)CPU新標(biāo)桿!

    服務(wù)器
    國產(chǎn)計算機小秦
    發(fā)布于 :2025年04月10日 11:10:04

    龍芯3C6000服務(wù)器CPU,1632線程,國產(chǎn)CPU新標(biāo)桿!

    服務(wù)器
    jf_10805031
    發(fā)布于 :2025年04月09日 10:44:40

    RZT2H CR52雙BOOT流程和例程代碼分析

    RZT2H是多核處理,啟動時,需要一個“主”先啟動,然后主根據(jù)規(guī)則,加載和啟動其他內(nèi)核。本文以T2H內(nèi)部的CR52雙為例,說明T2H
    的頭像 發(fā)表于 04-03 17:14 ?2954次閱讀
    RZT2H CR52雙<b class='flag-5'>核</b>BOOT流程和例程代碼分析

    雙倍能效陣列云,重新定義服務(wù)器性價比

    力高達48TOPS*72,滿足高并發(fā)AI訓(xùn)練需求?。 ARM架構(gòu)通過多核并行計算與動態(tài)電源管理技術(shù),實現(xiàn)“按需供電”,單位機架算力密度顯著提升,功耗較傳統(tǒng)x86服務(wù)器降低30%-50%?。 ?先進制程與能效優(yōu)化? 采用4nm工藝的芯片
    的頭像 發(fā)表于 03-26 08:35 ?677次閱讀
    雙倍能效陣列云,重新定義<b class='flag-5'>服務(wù)器</b>性價比

    NTP校時服務(wù)器 時鐘同步服務(wù)器

    服務(wù)器
    jf_75250307
    發(fā)布于 :2025年03月19日 20:56:34

    高流量網(wǎng)站需要什么樣的服務(wù)器配置?

    數(shù)量至少4以上,根據(jù)網(wǎng)站負載可擴展至更多核心。 內(nèi)存:至少需要32GB RAM,對于大型網(wǎng)站可能需要64GB或更多。內(nèi)存越大,服務(wù)器能夠同時處理的請求越多,性能也越好。 存儲:使用固態(tài)硬盤(SSD)或NVMe驅(qū)動
    的頭像 發(fā)表于 03-17 16:43 ?1406次閱讀

    STM32雙H7間如何通信?

    STM32雙H7間通信的方法,主要是CM7和CM4之間如何進行數(shù)據(jù)傳遞
    發(fā)表于 03-12 07:34