91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ntel I9的多核scalability是真的嗎

Linux閱碼場 ? 來源:Linux閱碼場 ? 作者:宋寶華 ? 2021-10-20 11:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

昨天我們用Intel I9的10核,每個(gè)核2個(gè)threads的機(jī)器跑了內(nèi)核的編譯:

超線程SMT究竟可以快多少?

今天,我換一臺機(jī)器,采用AMD Ryzen。

默認(rèn)情況16核,每個(gè)核2個(gè)threads,共32個(gè)CPUs:

8d9e0e28-3101-11ec-82a8-dac502259ad0.png

下面編譯內(nèi)核:

8df6755e-3101-11ec-82a8-dac502259ad0.png

大約需要53秒。記得昨天用Intel I9 10核20線程需要2分鐘30秒左右。

再來一遍:

8e5dca56-3101-11ec-82a8-dac502259ad0.png

這說明make clean, drop_caches后時(shí)間也差不多。51秒,53秒左右的正常抖動(dòng)范圍。

現(xiàn)在我們關(guān)閉smt,只保留16個(gè)CPU:

8eda8b0e-3101-11ec-82a8-dac502259ad0.png

具體的關(guān)閉方法就是:

sudo sh -c ‘echo off 》 /sys/devices/system/cpu/smt/control’

這樣只剩下16個(gè)CPU,下面來編譯:

8f52ff44-3101-11ec-82a8-dac502259ad0.png

時(shí)間57秒,相對于51、53秒,速度下降不到10%。

這說明超線程SMT對編譯內(nèi)核這個(gè)workload的性能的提升絕對沒有達(dá)到100%,甚至都沒有達(dá)到10%。

我們現(xiàn)在重新開啟超線程:

sudo sh -c ‘echo on 》 /sys/devices/system/cpu/smt/control

看一下哪個(gè)CPU和哪個(gè)CPU是thread sibling:

8fd104d4-3101-11ec-82a8-dac502259ad0.png

看起來CPU0和CPU16是一對,CPU1和CPU17是一對,依次類推。

剛才我們關(guān)閉SMT是把CPU16-CPU31全關(guān)了,只留下每對里面的1個(gè)CPU,也就是留下了CPU0-CPU15。

在開啟SMT的時(shí)候(假設(shè)藍(lán)色和紅色是一個(gè)CORE里面的兩個(gè)CPU):

9085d2f6-3101-11ec-82a8-dac502259ad0.png

在關(guān)閉SMT的時(shí)候,等于每對里面只留1個(gè)CPU:

現(xiàn)在我們換一種關(guān)法,一對對關(guān),只留下8對,也就是8個(gè)core:

指令如下:

918b663e-3101-11ec-82a8-dac502259ad0.png

實(shí)現(xiàn)效果如下:

92315648-3101-11ec-82a8-dac502259ad0.png

再重新編譯內(nèi)核:

926acc0c-3101-11ec-82a8-dac502259ad0.png

現(xiàn)在耗時(shí)是1分21秒,相對于所有CPU全開,下降了很多,時(shí)間增大了59%,當(dāng)然沒有達(dá)到2倍。

再想想昨天的Intel I9,關(guān)閉5個(gè)完整核耗時(shí)是3分10秒,全開10核是2分30秒,Intel一半核工作和所有核同時(shí)工作的差距遠(yuǎn)不如AMD那么明顯。

所以可以看出,就內(nèi)核編譯這個(gè)workload而言,AMD的16core相對于8core,性能的scale會(huì)更加成正比。當(dāng)然AMD開關(guān)SMT,對內(nèi)核編譯這個(gè)workload而言,影響小于10%,而Intel I9的影響有14%。

很多童鞋昨天留言,說編譯內(nèi)核有一定的IO bound,另外提到link階段是單線程,還有的童鞋說是Intel Turbo的影響,這些我們都認(rèn)為是有一定道理的。但是,我始終堅(jiān)信,profiling是檢驗(yàn)猜想的唯一標(biāo)準(zhǔn),后面有空再寫一篇文章來profiling一些究竟是為什么。

這到底是為什么?牙膏廠的多核scalability究竟是不是騙紙?還是按摩店的部分核沒有Intel部分核的威猛模式?「元芳,你怎么看?」

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5688

    瀏覽量

    140016
  • 內(nèi)核
    +關(guān)注

    關(guān)注

    4

    文章

    1468

    瀏覽量

    42892
  • intel
    +關(guān)注

    關(guān)注

    19

    文章

    3508

    瀏覽量

    191328

原文標(biāo)題:這到底是為什么?牙膏廠的多核scalability究竟是不是騙紙?還是按摩店的部分核沒有Intel部分核的威猛模式?「元芳,你怎么看?」

文章出處:【微信號:LinuxDev,微信公眾號:Linux閱碼場】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    如何讓S32K396支持FreeRTOS的多核運(yùn)行?

    如何讓S32K396支持FreeRTOS的多核運(yùn)行
    發(fā)表于 02-26 10:03

    瑞薩RZ/T2H平臺多核異構(gòu)的應(yīng)用場景分析

    本文以RZ/T2H多軸控制/驅(qū)動(dòng)的實(shí)例,介紹RZ/T2H平臺的多核異構(gòu)應(yīng)用場景。
    的頭像 發(fā)表于 12-15 11:34 ?2437次閱讀
    瑞薩RZ/T2H平臺<b class='flag-5'>多核</b>異構(gòu)的應(yīng)用場景分析

    FRDM i.MX 9平臺選型指南:FRDM i.MX 9系列開發(fā)平臺解析

    FRDM i.MX 9系列開發(fā)平臺的入門級產(chǎn)品 FRDM i.MX 9系列概述 恩智浦FRDM i.MX
    的頭像 發(fā)表于 12-11 15:15 ?3.4w次閱讀
    FRDM <b class='flag-5'>i</b>.MX <b class='flag-5'>9</b>平臺選型指南:FRDM <b class='flag-5'>i</b>.MX <b class='flag-5'>9</b>系列開發(fā)平臺解析

    既要穩(wěn)定性,還要性價(jià)比的工業(yè)級開發(fā)板 — 米爾i.MX91

    之前我介紹過NXPi.MX8系列的開發(fā)板,最近它的下一代產(chǎn)品i.MX9系列產(chǎn)品也有了,我就拿到了這個(gè)基于NXPi.MX9系列的米爾MYD-LMX91開發(fā)板i.MX91這個(gè)SoC在NXP產(chǎn)品線里定位
    的頭像 發(fā)表于 11-20 08:05 ?2127次閱讀
    既要穩(wěn)定性,還要性價(jià)比的工業(yè)級開發(fā)板 — 米爾<b class='flag-5'>i</b>.MX91

    Diodes公司推出高性能I2C/SPI總線至雙通道UART網(wǎng)橋PI7C9X762Q

    Diodes 公司(Diodes)(Nasdaq:DIOD)宣布推出PI7C9X762Q,這是一款符合汽車標(biāo)準(zhǔn)*的高性能 I2C/SPI 總線至雙通道 UART 網(wǎng)橋。該器件在工作狀態(tài)和睡眠模式下
    的頭像 發(fā)表于 10-17 17:51 ?1785次閱讀

    移植RTThread多核如何開始(ZYNQ US 64位 A53)?

    想請教一下各位前輩如何移植RTThread到多核平臺上,需要注意的問題和學(xué)習(xí)路線。
    發(fā)表于 09-22 07:25

    【老法師】多核異構(gòu)處理器中M核程序的啟動(dòng)、編寫和仿真

    文章,小編就將以飛凌嵌入式的OKMX8MP-C開發(fā)板為例,為大家介紹多核異構(gòu)處理器M核程序的啟動(dòng)配置、程序編寫和實(shí)時(shí)仿真的過程。
    的頭像 發(fā)表于 08-13 09:05 ?4001次閱讀
    【老法師】<b class='flag-5'>多核</b>異構(gòu)處理器中M核程序的啟動(dòng)、編寫和仿真

    干擾可以提高測量精度,是真的嗎?

    一、前言 水可以引燃蠟燭,是真的嗎?是真的! 蛇怕雄黃,是真的嗎?是假的! 上述兩個(gè)現(xiàn)象,已經(jīng)由央視 財(cái)經(jīng)頻道《是真的嗎?》揭秘。 今天要探討的是: 干擾可以提高測量精度,是
    的頭像 發(fā)表于 08-04 09:28 ?712次閱讀
    干擾可以提高測量精度,是<b class='flag-5'>真的</b>嗎?

    多個(gè)i.MXRT共享一顆Flash啟動(dòng)的方法與實(shí)踐(上)

    有些客戶應(yīng)用會(huì)采用多顆 i.MXRT 芯片設(shè)計(jì)一主多從的硬件架構(gòu)(目的不一,或仿多核 MCU 系統(tǒng)、或拓展 GPIO 數(shù)量),因?yàn)?i.MXRT 片內(nèi)無非易失性存儲器,這時(shí)候?yàn)檎麄€(gè)系統(tǒng)配置合適的啟動(dòng)設(shè)備保證每個(gè)
    的頭像 發(fā)表于 06-05 10:01 ?1156次閱讀
    多個(gè)<b class='flag-5'>i</b>.MXRT共享一顆Flash啟動(dòng)的方法與實(shí)踐(上)

    DS4550 I2C和JTAG、非易失、9位、輸入/輸出擴(kuò)展器與存儲器技術(shù)手冊

    DS4550是9位,非易失(NV) I/O擴(kuò)展器,具有I2C兼容串行接口或IEEE? 1149.1 JTAG端口控制的64字節(jié)NV用戶存儲器。DS4550采用數(shù)字編程替代硬件跳線和機(jī)械開關(guān),實(shí)現(xiàn)對數(shù)
    的頭像 發(fā)表于 05-26 09:50 ?879次閱讀
    DS4550 <b class='flag-5'>I</b>2C和JTAG、非易失、<b class='flag-5'>9</b>位、輸入/輸出擴(kuò)展器與存儲器技術(shù)手冊

    米爾瑞芯微多核異構(gòu)低功耗RK3506核心板重磅發(fā)布

    近日,米爾電子發(fā)布MYC-YR3506核心板和開發(fā)板,基于國產(chǎn)新一代入門級工業(yè)處理器瑞芯微RK3506,這款芯片采用三核Cortex-A7+單核Cortex-M0多核異構(gòu)設(shè)計(jì),不僅擁有豐富的工業(yè)接口
    發(fā)表于 05-16 17:20

    熱成像儀為何都在瘋狂卷多核處理器?“多核大戰(zhàn)”背后的真相你知道嗎?

    熱成像儀進(jìn)入“多核”時(shí)代,這不是噱頭,而是需求在變。 從黑夜中識別生命體,到復(fù)雜地形中實(shí)現(xiàn)熱源追蹤,過去主要用于軍事和工業(yè)的熱成像儀,如今正越來越多地進(jìn)入民用市場。而隨著使用場景的復(fù)雜化,“看得見
    的頭像 發(fā)表于 04-27 15:41 ?793次閱讀

    杰發(fā)科技發(fā)布車規(guī)級多核MCU芯片AC7870

    4月15日-17日,備受全球電子制造行業(yè)矚目的慕尼黑上海電子展在上海新國際博覽中心舉行。在車規(guī)級SoC和MCU芯片賽道穩(wěn)居行業(yè)頭部的四維圖新旗下杰發(fā)科技,以“多核紀(jì)元 智控芯生“為主題,現(xiàn)場展示了車載T-box、數(shù)字鑰匙等多個(gè)芯片應(yīng)用場景,并重磅發(fā)布車規(guī)級多核MCU芯片A
    的頭像 發(fā)表于 04-17 10:48 ?1555次閱讀