91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

談一談Linux讓實(shí)時任務(wù)獨(dú)占CPU的事

Linux閱碼場 ? 來源:Linuxer ? 作者:Linuxer ? 2021-02-20 17:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文主要討論在高實(shí)時要求、高效能計算、DPDK等領(lǐng)域,Linux如何讓某一個線程排他性獨(dú)占CPU;獨(dú)占CPU涉及的線程、中斷隔離原理;以及如何在排他性獨(dú)占的情況下,甚至讓系統(tǒng)的timer tick也不打斷獨(dú)占任務(wù),從而實(shí)現(xiàn)最低的延遲抖動。

本文目錄:

1. 工程需求

2. 用戶態(tài)隔離

3. 內(nèi)核態(tài)隔離

3.1 中斷

3.2 內(nèi)核線程

4. 最佳實(shí)踐指南

Part 1

工程需求

在一個SMP或者NUMA系統(tǒng)中,CPU的數(shù)量大于1。在工程中,我們有時候有一種需求,就是讓某個能夠獨(dú)占CPU,這個CPU什么都不做,就只做指定的任務(wù),從而獲得低延遲、高實(shí)時的好處。

比如在DPDK中,通過設(shè)置

GRUB_CMDLINE_LINUX_DEFAULT=“isolcpus=0-3,5,7”

隔離CPU0,3,5,7,讓DPDK的任務(wù)在運(yùn)行的時候,其他任務(wù)不會和DPDK的任務(wù)進(jìn)行上下文切換,從而保證網(wǎng)絡(luò)性能最佳[1]。在Realtime應(yīng)用場景中,通過isolcpus=2隔離CPU2,然后把實(shí)時應(yīng)用通過taskset綁定到隔離的核:

taskset-c 2 pn_dev

從而保證低延遲要求[2]。

Part 2

用戶態(tài)隔離

這個地方,我們可以看出,它們統(tǒng)一都使用了isolcpus這樣一個啟動參數(shù)。

實(shí)踐是檢驗(yàn)真理的唯一標(biāo)準(zhǔn),下面我們來啟動一個8核的ARM64系統(tǒng),運(yùn)行Ubuntu,并指定isolcpus=2這個啟動參數(shù):

3724778a-71ad-11eb-8b86-12bb97331649.png

系統(tǒng)啟動后,我們運(yùn)行下面簡單的程序(啟動8個進(jìn)程運(yùn)行while死循環(huán)):

375f64ee-71ad-11eb-8b86-12bb97331649.png

我們是8核的,現(xiàn)在又是運(yùn)行8個進(jìn)程,所以理論上來講,負(fù)載均衡后,8個進(jìn)程應(yīng)該均分地運(yùn)行在8個核上面,但是我們來看看實(shí)際的htop結(jié)果:

37807ec2-71ad-11eb-8b86-12bb97331649.png

我們發(fā)現(xiàn)3(也就是CPU2)上面的CPU占用率是0.0%。這實(shí)證了CPU2已經(jīng)被隔離,用戶空間的進(jìn)程不能在它上面跑。

當(dāng)然,這個時候,我們可以通過taskset,強(qiáng)行把其中的一個a.out,綁定到CPU2上面去:

37cd7dd0-71ad-11eb-8b86-12bb97331649.png

從上面命令的結(jié)果看出,663原本的affinity list只有0,1,3-7是沒有2的,而我們強(qiáng)行把它設(shè)置為了2,之后再看htop,CPU2上面占用100%:

380fa0f2-71ad-11eb-8b86-12bb97331649.png

通過上面的實(shí)驗(yàn),我們明顯可以看出isolcpus=2使得CPU2上無法再運(yùn)行用戶空間的進(jìn)程了(除非手動設(shè)置affinity)。

Part 3

內(nèi)核態(tài)隔離

中斷

但是,能在CPU2上面運(yùn)行的,不是只有用戶態(tài)的任務(wù),還可以有內(nèi)核線程、中斷等,那么isolcpus=能否隔離內(nèi)核線程和中斷呢?

對于中斷,我們特別容易查看,就是實(shí)際去驗(yàn)證每個IRQ的smp_affinity就好了:

3841b6c8-71ad-11eb-8b86-12bb97331649.png

從上圖明顯可以看出,對于44、47號這種外設(shè)的中斷,Linux內(nèi)核把smp_affinity設(shè)置為了FB(11111011),明顯避開了CPU2,所以,實(shí)際外設(shè)中斷也不會在CPU2發(fā)生,除非我們強(qiáng)行給中斷綁核,比如讓44號中斷綁定到CPU2:

echo 2 》/proc/irq/44/smp_affinity_list

之后,我們發(fā)現(xiàn)44號中斷在CPU2可以發(fā)生:

386bdfca-71ad-11eb-8b86-12bb97331649.png

但是,系統(tǒng)的timer中斷、IPI,由于是Linux系統(tǒng)的運(yùn)行基石,實(shí)際還是要在CPU2上面運(yùn)行的。這里面最可能給任務(wù)帶來延遲抖動的,自然是timer tick。

下面我們重點(diǎn)探討下tick的問題,由于Linux一般情況下,已經(jīng)配置IDLE狀態(tài)的NO_HZ tickless,所以CPU2上面什么都不跑的時候,實(shí)際timer中斷幾乎不發(fā)生。

下面,我們還是在isolcpus=2的情況下,運(yùn)行前面那個8個進(jìn)程的a.out,默認(rèn)情況下沒有任務(wù)會占用CPU2。通過先后運(yùn)行幾次cat /proc/interrupts | head 2,我們會看到其他core的timer中斷頻繁發(fā)生,而CPU2幾乎不變,這顯然是IDLE時候的NO_HZ在發(fā)揮省電的作用:

388fdf92-71ad-11eb-8b86-12bb97331649.png

但是,一旦我們放任務(wù)到CPU2,哪怕只是放1個,就會發(fā)現(xiàn)CPU2上面的timer中斷開始增加:

38b28a6a-71ad-11eb-8b86-12bb97331649.png

這說明一點(diǎn),哪怕隔離的CPU上面只有一個線程去跑,timer tick就會開始跑,當(dāng)然,這個timer tick也會頻繁打斷這一個線程,從而造成大量的上下文切換。你肯定會覺得Linux怎么這么傻,既然只有一個人,那也沒有時間片分片的必要,不需要在2個或者多個任務(wù)進(jìn)行時間片劃分地調(diào)度,為啥還要跑tick?其實(shí)原因是我們的內(nèi)核默認(rèn)只是使能了IDLE的NO_HZ:

390e92c4-71ad-11eb-8b86-12bb97331649.png

我們來重新編譯一個內(nèi)核,使能NO_HZ_FULL:

39338926-71ad-11eb-8b86-12bb97331649.png

當(dāng)我們使能了NO_HZ_FULL后,Linux支持在CPU上僅有1個任務(wù)的時候,是可以NO_HZ的。但是有2個就傻眼了,所以這個“FULL”也不是真地FULL[3]。這當(dāng)然也可以理解,因?yàn)橛?個就涉及到時間片調(diào)度的問題。什么時候應(yīng)該使能NO_HZ_FULL,內(nèi)核文檔Documentation/timers/no_hz.rst有明確地“指示”,只有在實(shí)時和HPC等的場景,才需要,否則默認(rèn)的NO_HZ_IDLE是你最好的選擇:

3959e594-71ad-11eb-8b86-12bb97331649.png

我們重新編譯了內(nèi)核,選中了NO_HZ_FULL,下面啟動Linux,注意啟動的時候參數(shù)添加nohz_full=2,讓CPU2支持NO_HZ_FULL:

3a7d168a-71ad-11eb-8b86-12bb97331649.png

重新運(yùn)行CPU2只有一個任務(wù)的場景,看看它的timer中斷發(fā)生情況:

3abb29a2-71ad-11eb-8b86-12bb97331649.png

發(fā)現(xiàn)CPU2上面的tick穩(wěn)定在188上面,這樣相信你會更加開心,因?yàn)槟悛?dú)占地更加徹底了!

下面,我們再放一個task進(jìn)去CPU2,有2個任務(wù)的情況下,CPU2上面的timer tick開始增加:

3aed457c-71ad-11eb-8b86-12bb97331649.png

不過,這或許不是個問題,因?yàn)槲覀冋f好了“獨(dú)占”,1個任務(wù)獨(dú)占的時候,timer tick不來打擾,應(yīng)該已經(jīng)是非常理想的情況了!

內(nèi)核態(tài)線程

內(nèi)核態(tài)的線程其實(shí)和用戶態(tài)差不多,當(dāng)它們沒有綁定到隔離的CPU的時候,是不會跑到隔離CPU運(yùn)行的。下面用筆者在內(nèi)核里面添加的dma_map_benchmark來做實(shí)驗(yàn)[4],開啟16個內(nèi)核線程來進(jìn)行DMA map和unmap(注意我們只有8個核):

。/dma_map_benchmark -s 120 -t 16

我們看到CPU2上面的CPU占用也是0:

3b193696-71ad-11eb-8b86-12bb97331649.png

內(nèi)核里面的dma_map_benchmark線程在狂占CPU0-1, 3-7,但是就是不去占CPU2:

3b3b2788-71ad-11eb-8b86-12bb97331649.png

但是,內(nèi)核線程如果用kthread_bind_mask()類似API把線程綁定到了隔離的CPU,則情況就不一樣了,這就類似用taskset把用戶態(tài)的任務(wù)綁定到CPU一樣。

Part 4

最佳實(shí)踐指南

對于實(shí)時性要求高、高性能計算等場景,如果要讓某個任務(wù)獨(dú)占CPU,最理想的選擇是:

1. 采用isolcpus隔離CPU

2. 將指定任務(wù)綁定到隔離CPU

3. 小心意外地把中斷、內(nèi)核線程綁定到了隔離CPU,排查到這些“意外”分子

4. 使能NO_HZ_FULL,則效果更佳,因?yàn)檫Btimer tick中斷也不打擾你了。

原文標(biāo)題:宋寶華:談一談Linux讓實(shí)時/高性能任務(wù)獨(dú)占CPU的事

文章出處:【微信公眾號:Linuxer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11281

    瀏覽量

    225100
  • Linux
    +關(guān)注

    關(guān)注

    88

    文章

    11764

    瀏覽量

    219092

原文標(biāo)題:宋寶華:談一談Linux讓實(shí)時/高性能任務(wù)獨(dú)占CPU的事

文章出處:【微信號:LinuxDev,微信公眾號:Linux閱碼場】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    直播 | 睿擎平臺AMP混合部署實(shí)戰(zhàn):如何Linux和RT-Thread高效協(xié)同工作

    在工業(yè)控制器、機(jī)器人或高端設(shè)備開發(fā)中,你是否正被這樣的問題困擾:實(shí)時任務(wù)(如電機(jī)控制、數(shù)據(jù)采集)需要RT-Thread的微秒級響應(yīng),但上層應(yīng)用(如UI、AI算法、網(wǎng)絡(luò)服務(wù))又離不開Linux的豐富
    的頭像 發(fā)表于 01-27 19:41 ?491次閱讀
    直播 | 睿擎平臺AMP混合部署實(shí)戰(zhàn):如何<b class='flag-5'>讓</b><b class='flag-5'>Linux</b>和RT-Thread高效協(xié)同工作

    直播預(yù)告 | 睿擎平臺AMP混合部署實(shí)戰(zhàn):如何Linux和RT-Thread高效協(xié)同工作

    在工業(yè)控制器、機(jī)器人或高端設(shè)備開發(fā)中,你是否正被這樣的問題困擾:實(shí)時任務(wù)(如電機(jī)控制、數(shù)據(jù)采集)需要RT-Thread的微秒級響應(yīng),但上層應(yīng)用(如UI、AI算法、網(wǎng)絡(luò)服務(wù))又離不開Linux的豐富
    的頭像 發(fā)表于 01-23 11:06 ?543次閱讀
    直播預(yù)告 | 睿擎平臺AMP混合部署實(shí)戰(zhàn):如何<b class='flag-5'>讓</b><b class='flag-5'>Linux</b>和RT-Thread高效協(xié)同工作

    米爾RK3506核心板SDK重磅升級,解鎖三核A7實(shí)時控制新架構(gòu)

    出來,獨(dú)立運(yùn)行實(shí)時操作系統(tǒng)RT-Thread。此架構(gòu)實(shí)現(xiàn)了完美的任務(wù)隔離:兩顆A7核運(yùn)行通用Linux,處理網(wǎng)絡(luò)、存儲等復(fù)雜業(yè)務(wù);被隔離的A7核則專司硬實(shí)時任務(wù),確保微秒級響應(yīng)。這為傳
    發(fā)表于 12-19 20:35

    Linux-RT特點(diǎn)及簡單應(yīng)用

    以及使用適當(dāng)?shù)腁PI來創(chuàng)建和管理任務(wù)。以下是在Linux-RT上創(chuàng)建和管理實(shí)時任務(wù)般步驟: 選擇合適的調(diào)度策略:Linux-RT內(nèi)核支持
    發(fā)表于 12-05 07:37

    技術(shù)分享 | RK3588增加Xenomai3實(shí)時補(bǔ)丁

    Xenomai是套為嵌入式系統(tǒng)設(shè)計的實(shí)時開發(fā)框架,通過“雙內(nèi)核”架構(gòu),Linux既能處理復(fù)雜的通用任務(wù),又能可靠地完成那些對響應(yīng)時間有極
    的頭像 發(fā)表于 11-27 17:29 ?1615次閱讀
    技術(shù)分享 | RK3588增加Xenomai3<b class='flag-5'>實(shí)時</b>補(bǔ)丁

    【飛凌OK-T153 開發(fā)板試用】實(shí)時性測試

    中斷發(fā)生到進(jìn)入中斷處理程序ISR的延時 調(diào)度延時(scheduling latency),即當(dāng)任務(wù)被喚醒到任務(wù)真正獲得CPU使用權(quán)中間的延時 cyclictest創(chuàng)建的任務(wù)均是
    發(fā)表于 11-22 05:29

    嵌入式實(shí)時操作系統(tǒng)的特點(diǎn)

    任務(wù)的系統(tǒng)。 實(shí)時嵌入式操作系統(tǒng)與傳統(tǒng)的桌面操作系統(tǒng)相比,更注重對實(shí)時任務(wù)的響應(yīng)和精確控制。它們在資源利用、可靠性、可預(yù)測性、任務(wù)調(diào)度和中斷處理等方面提供了更加嚴(yán)格的要求和機(jī)制。
    發(fā)表于 11-13 06:30

    【米爾RK3506國產(chǎn)開發(fā)板評測】3、實(shí)時補(bǔ)丁以及EtherCAT IGH移植

    EtherCAT IgH需要保證高實(shí)時性,Preempt-RT是種針對實(shí)時性能進(jìn)行了優(yōu)化的Linux內(nèi)核。與普通的Linux內(nèi)核相比,Pr
    發(fā)表于 10-27 10:09

    從微秒級響應(yīng)到確定性延遲:深入解析米爾全志T536核心板的實(shí)時性技術(shù)突破

    ,通過CPU隔離技術(shù)將特定核心專用于實(shí)時任務(wù),減少系統(tǒng)干擾。 優(yōu)勢:無需修改內(nèi)核,配置相對簡單。 挑戰(zhàn):隔離不徹底,Linux內(nèi)核活動仍可能影響實(shí)時任務(wù),最壞情況延遲改善有限。 2.3
    發(fā)表于 10-22 17:25

    深入解析米爾全志T536核心板的實(shí)時性技術(shù)突破

    CPU隔離技術(shù)將特定核心專用于實(shí)時任務(wù),減少系統(tǒng)干擾。優(yōu)勢:無需修改內(nèi)核,配置相對簡單。挑戰(zhàn):隔離不徹底,Linux內(nèi)核活動仍可能影響實(shí)時任務(wù),最壞情況延遲改善有限。2.3 RT-PR
    發(fā)表于 10-17 17:41

    請問rt_kprintf會影響RT-Threat系統(tǒng)的實(shí)時性嗎?

    有人說頻繁調(diào)用rt_kprintf可能阻塞實(shí)時任務(wù),影響系統(tǒng)響應(yīng),是這樣嗎?
    發(fā)表于 09-23 07:06

    Crontab定時任務(wù)完全指南

    在凌晨3點(diǎn),當(dāng)大多數(shù)人還在熟睡時,位運(yùn)維工程師的手機(jī)突然響起——線上數(shù)據(jù)庫備份失敗了。他匆忙起床,打開電腦,手動執(zhí)行備份腳本,整個過程耗時2小時。這樣的場景,在我剛?cè)胄袝r經(jīng)常遇到。直到我真正掌握了crontab定時任務(wù),才徹底擺脫了"人肉運(yùn)維"的窘境。
    的頭像 發(fā)表于 09-05 10:03 ?866次閱讀

    文讀懂:嵌入式Linux實(shí)時性進(jìn)階

    能夠在限定的時間內(nèi)對外部時間做出相應(yīng)的特性。 Linux可以通過任務(wù)調(diào)度與相應(yīng)時間,中斷延遲與搶占延遲,內(nèi)核可搶占性與實(shí)時補(bǔ)丁,實(shí)時調(diào)度策略,硬件支持來提高其
    發(fā)表于 07-10 15:26

    linux服務(wù)器挖礦病毒處理方案

    情況說明:挖礦進(jìn)程被隱藏(CPU占用50%,htop/top卻看不到異常進(jìn)程),結(jié)束挖礦進(jìn)程后馬上又會運(yùn)行起來(crontab -l查看發(fā)現(xiàn)沒有定時任務(wù))。
    的頭像 發(fā)表于 04-09 10:33 ?1248次閱讀
    <b class='flag-5'>linux</b>服務(wù)器挖礦病毒處理方案

    【第四章 定時任務(wù)】手把手教你玩轉(zhuǎn)新版正點(diǎn)原子云

    【第四章 定時任務(wù)】手把手教你玩轉(zhuǎn)新版正點(diǎn)原子云 承接上篇,除了報警聯(lián)動這個功能,原子云還有個特色功能也是各開發(fā)者喜歡用的,定時任務(wù)功能。 【正點(diǎn)原子】云平臺:原子云(點(diǎn)擊登錄原子云) 前言
    發(fā)表于 03-13 10:19