91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從三個(gè)方面闡述Cache

Linux閱碼場 ? 來源:Linux閱碼場 ? 作者:甄建勇 ? 2021-11-21 11:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

關(guān)于cache,大概可以從三個(gè)方面進(jìn)行闡述:內(nèi)存到cache的映射方式,cache的寫策略,cache的替換策略。

映射方式

內(nèi)存到cache的映射方式,大致可以分為三種,分別是:直接映射(directmapped),全相連(fullyassociative),組相連(setassociative)。

為了便于理解,現(xiàn)在假設(shè)一個(gè)例子,比如咱們的內(nèi)存只有16bytes,而cache只有4bytes(cacheline是1byte),那么對于分別采用三種不同的映射方式,會(huì)是什么情況呢?如下圖所示:

(direct mapped:直接映射 ; fully associative:全相連 ;set associative:組相連)

(1)directmapped

對于directmapped(直接映射),為了便于數(shù)據(jù)查找,一般規(guī)定內(nèi)存數(shù)據(jù)只能置于緩存的特定區(qū)域。對于直接匹配緩存,每一個(gè)內(nèi)存塊地址都可通過模運(yùn)算對應(yīng)到一個(gè)唯一緩存塊上。注意這是一個(gè)多對一匹配:多個(gè)內(nèi)存塊地址須共享一個(gè)緩存區(qū)域。

對于咱們這個(gè)例子來說,內(nèi)存的0地址只能映射到cache的第0個(gè)(0%4=0)cacheline,內(nèi)存的1地址只能映射到cache的第1個(gè)(1%4=1)cacheline,內(nèi)存的2地址只能映射到cache的第2個(gè)(2%4=2)cacheline,內(nèi)存的3地址只能映射到cache的第3個(gè)(3%4=3)cacheline,內(nèi)存的4地址只能映射到cache的第0個(gè)(4%4=0)cacheline,。。。。。。如此循環(huán)下去。

所以如果采用directmapped的話,core在訪問cache時(shí),根據(jù)TLB處理之后的物理地址,進(jìn)行取模(%)運(yùn)算,就可以直接確定其cache的位置,由于一個(gè)cacheline可能對應(yīng)不同的內(nèi)存地址(具有相同模運(yùn)算結(jié)果的內(nèi)存),然后將物理地址的tag部分與cache的tag部分進(jìn)行一次比較,就可以確定是cache hit,還是cachemiss。

directmapped的特點(diǎn)是,邏輯簡單,延遲短(只進(jìn)行一次比較),但命中率低。

(2)fullyassociative

對于fullyassociative(全相連),這種方式,內(nèi)存中的數(shù)據(jù)塊可以被放置到cache的任意區(qū)域。這種相聯(lián)完全免去了索引的使用,而直接通過在整個(gè)緩存空間上匹配標(biāo)簽進(jìn)行查找。

對于咱們的這個(gè)例子來說,內(nèi)存的某個(gè)地址,可以映射到cache的任意個(gè)cacheline。內(nèi)存的0地址能映射到cache的第0個(gè)cacheline,也可以映射到第1個(gè)cacheline,也可以映射到第2個(gè)cache line,也可以映射到第3個(gè)cacheline。

所以如果采用fullyassociative的話,core在訪問cache時(shí),根據(jù)TLB處理之后的物理地址,要依次和所有的cacheline的tag進(jìn)行比較。

fullyassociative的特點(diǎn)是:控制復(fù)雜,查找造成的電路延遲最長,因此僅在特殊場合,如緩存極小時(shí),才會(huì)使用,命中率較高。

(3)setassociative

set associative(組相連)是directmapped 和fully associative兩種方式的一個(gè)折中。

對于咱們這個(gè)例子來說,我們將4個(gè)cacheline分成了兩組,內(nèi)存的0地址只能映射到cache的第0個(gè)組(0%2=0),但是在組內(nèi)是任意的,既可以映射到組內(nèi)的第0個(gè)cacheline,也可以映射到第1個(gè)cacheline。內(nèi)存的1地址只能映射到cache的第1個(gè)組(1%2=1),但是在組內(nèi)也是任意的,既可以映射到組內(nèi)的第0個(gè)cacheline,也可以映射到第1個(gè)cacheline。內(nèi)存的2地址只能映射到cache的第0個(gè)組(2%2=0),但是在組內(nèi)也是任意的,既可以映射到組內(nèi)的第0個(gè)cacheline,也可以映射到第1個(gè)cacheline,。。。。。。。依次類推。

所以,如果采用setassociative的話,core在訪問cache時(shí),根據(jù)TLB處理之后的物理地址,先將物理地址取模,得到其可能的cache的組,然后再依次與組內(nèi)的所有cacheline的tag進(jìn)行比較,確定是cache hit還是cachemiss。

setassociative是折中方案,所以其特點(diǎn)就是集directmapped 和fully associative之所長。是一個(gè)平衡方案。

咱們這個(gè)例子是2 way setassociative,即兩路組相連,所謂的兩路,是指每個(gè)cache組內(nèi)的cacheline的數(shù)目,不是分組的數(shù)目。比如是4路組相連,指的是每個(gè)cache組內(nèi)有4個(gè)cacheline。

對于直接映射,由于緩存字節(jié)數(shù)和緩存塊數(shù)均為2的冪,上述運(yùn)算可以由硬件通過移位極快地完成。直接匹配緩存盡管在電路邏輯上十分簡單,但是存在顯著的沖突問題。由于多個(gè)不同的內(nèi)存塊僅共享一個(gè)緩存塊,一旦發(fā)生緩存失效就必須將緩存塊的當(dāng)前內(nèi)容清除出去。這種做法不但因?yàn)轭l繁的更換緩存內(nèi)容造成了大量延遲,而且未能有效利用程序運(yùn)行期所具有的時(shí)間局部性。

組相聯(lián)(SetAssociativity)是解決這一問題的主要辦法。使用組相聯(lián)的緩存把存儲空間組織成多個(gè)組,每個(gè)組有若干數(shù)據(jù)塊。通過建立內(nèi)存數(shù)據(jù)和組索引的對應(yīng)關(guān)系,一個(gè)內(nèi)存塊可以被載入到對應(yīng)組內(nèi)的任一數(shù)據(jù)塊上。

直接映射可以認(rèn)為是單路組相聯(lián)。經(jīng)驗(yàn)規(guī)則表明,在緩存小于128KB時(shí),欲達(dá)到相同失效率,一個(gè)雙路組相聯(lián)緩存僅需相當(dāng)于直接匹配緩存一半的存儲空間。

為了和下級存儲(如內(nèi)存)保持?jǐn)?shù)據(jù)一致性,就必須把數(shù)據(jù)更新適時(shí)傳播下去。這種傳播通過回寫來完成。

寫策略

一般有兩種回寫策略:寫回(Writeback)和寫通(Writethrough)。

寫回是指,僅當(dāng)一個(gè)緩存塊需要被替換回內(nèi)存時(shí),才將其內(nèi)容寫入內(nèi)存。如果緩存命中,則總是不用更新內(nèi)存。為了減少內(nèi)存寫操作,緩存塊通常還設(shè)有一個(gè)臟位(dirtybit),用以標(biāo)識該塊在被載入之后是否發(fā)生過更新。如果一個(gè)緩存塊在被置換回內(nèi)存之前從未被寫入過,則可以免去回寫操作。

寫回的優(yōu)點(diǎn)是節(jié)省了大量的寫操作。這主要是因?yàn)?,對一個(gè)數(shù)據(jù)塊內(nèi)不同單元的更新僅需一次寫操作即可完成。這種內(nèi)存帶寬上的節(jié)省進(jìn)一步降低了能耗,因此頗適用于嵌入式系統(tǒng)

寫通是指,每當(dāng)緩存接收到寫數(shù)據(jù)指令,都直接將數(shù)據(jù)寫回到內(nèi)存。如果此數(shù)據(jù)地址也在緩存中,則必須同時(shí)更新緩存。由于這種設(shè)計(jì)會(huì)引發(fā)造成大量寫內(nèi)存操作,有必要設(shè)置一個(gè)緩沖來減少硬件沖突。這個(gè)緩沖稱作寫緩沖器(Writebuffer),通常不超過4個(gè)緩存塊大小。不過,出于同樣的目的,寫緩沖器也可以用于寫回型緩存。

寫通較寫回易于實(shí)現(xiàn),并且能更簡單地維持?jǐn)?shù)據(jù)一致性。

當(dāng)發(fā)生寫失效時(shí),緩存可有兩種處理策略,分別稱為分配寫(Writeallocate)和非分配寫(No-writeallocate)。

分配寫是指,先如處理讀失效一樣,將所需數(shù)據(jù)讀入緩存,然后再將數(shù)據(jù)寫到被讀入的單元。非分配寫則總是直接將數(shù)據(jù)寫回內(nèi)存。

設(shè)計(jì)緩存時(shí)可以使用回寫策略和分配策略的任意組合。對于不同組合,發(fā)生數(shù)據(jù)寫操作時(shí)的行為也有所不同。

對于組相聯(lián)緩存,當(dāng)一個(gè)組的全部緩存塊都被占滿后,如果再次發(fā)生緩存失效,就必須選擇一個(gè)緩存塊來替換掉。存在多種策略決定哪個(gè)塊被替換。

替換策略

顯然,最理想的替換塊應(yīng)當(dāng)是距下一次被訪問最晚的那個(gè)。這種理想策略無法真正實(shí)現(xiàn),但它為設(shè)計(jì)其他策略提供了方向。

先進(jìn)先出算法(FIFO)替換掉進(jìn)入組內(nèi)時(shí)間最長的緩存塊。最久未使用算法(LRU)則跟蹤各個(gè)緩存塊的使用狀況,并根據(jù)統(tǒng)計(jì)比較出哪個(gè)塊已經(jīng)最長時(shí)間未被訪問。對于2路以上相聯(lián),這個(gè)算法的時(shí)間代價(jià)會(huì)非常高。

對最久未使用算法的一個(gè)近似是非最近使用(NMRU)。這個(gè)算法僅記錄哪一個(gè)緩存塊是最近被使用的。在替換時(shí),會(huì)隨機(jī)替換掉任何一個(gè)其他的塊。故稱非最近使用。相比于LRU,這種算法僅需硬件為每一個(gè)緩存塊增加一個(gè)使用位(usebit)即可。

此外,也可使用純粹的隨機(jī)替換法。測試表明完全隨機(jī)替換的性能近似于LRU。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 內(nèi)存
    +關(guān)注

    關(guān)注

    9

    文章

    3212

    瀏覽量

    76387
  • Cache
    +關(guān)注

    關(guān)注

    0

    文章

    130

    瀏覽量

    29716

原文標(biāo)題:甄建勇:五分鐘搞定Cache(上)

文章出處:【微信號:LinuxDev,微信公眾號:Linux閱碼場】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    解析碳化硅MOS管在型號替換背后存在的三個(gè)主要差異

    碳化硅MOS管為什么不能簡單根據(jù)型號直接替代?參數(shù)匹配到系統(tǒng)驗(yàn)證主要有三個(gè)差異。當(dāng)工程師看到一份標(biāo)注著“耐壓1200V、電流33A、導(dǎo)通電阻60mΩ”的產(chǎn)品規(guī)格書時(shí),第一反應(yīng)往往是尋找參數(shù)相同
    的頭像 發(fā)表于 02-28 10:50 ?461次閱讀

    駿馬奔騰,芯向未來:SiC功率器件的“三個(gè)必然”與丙午馬年的產(chǎn)業(yè)躍遷

    駿馬奔騰,芯向未來:SiC功率器件的“三個(gè)必然”與丙午馬年的產(chǎn)業(yè)躍遷 日期: 2026年 丙午馬年 除夕 主題: 傾佳電子楊茜“三個(gè)必然”戰(zhàn)略論斷與基本半導(dǎo)體碳化硅技術(shù)的產(chǎn)業(yè)替代邏輯 關(guān)鍵詞
    的頭像 發(fā)表于 02-15 10:33 ?57次閱讀
    駿馬奔騰,芯向未來:SiC功率器件的“<b class='flag-5'>三個(gè)</b>必然”與丙午馬年的產(chǎn)業(yè)躍遷

    altium designer 如何畫短路兩個(gè)或者三個(gè)網(wǎng)絡(luò)的封裝?

    如何我畫了一個(gè)天線,有3個(gè)引腳,TX1,TX2,GND, 但實(shí)際上這三個(gè)引腳是連在一起的。我導(dǎo)入pcb后,會(huì)報(bào)DRC警告,這個(gè)該怎么解決?
    發(fā)表于 02-12 19:30

    三個(gè)經(jīng)典開關(guān)電源實(shí)際問題解析

    下面三個(gè)關(guān)于多路輸出電源連續(xù)工作模式的問題,測試一下您的電源設(shè)計(jì)知識。然后核對您的答案。
    的頭像 發(fā)表于 01-22 16:08 ?2010次閱讀
    <b class='flag-5'>三個(gè)</b>經(jīng)典開關(guān)電源實(shí)際問題解析

    MDD工程故障看極管三個(gè)極的設(shè)計(jì)誤區(qū)與失效案例

    一、為什么極管問題總是“看起來很隨機(jī)”?在FAE現(xiàn)場支持中,經(jīng)常遇到如下問題:-同一電路,有的板子正常,有的異常-高溫下工作不穩(wěn)定-更換批次后性能漂移這些問題,90%都與三個(gè)極的設(shè)計(jì)與使用方式有關(guān)
    的頭像 發(fā)表于 01-19 11:48 ?222次閱讀
    MDD<b class='flag-5'>從</b>工程故障看<b class='flag-5'>三</b>極管<b class='flag-5'>三個(gè)</b>極的設(shè)計(jì)誤區(qū)與失效案例

    請問030系列集成的PreFetch 和 Cache怎么用呀?

    各位大佬,030系列集成的PreFetch 和 Cache怎么用呀?有這方面的demo或者pdf操作流程么?
    發(fā)表于 01-19 07:07

    三個(gè)必然”戰(zhàn)略論斷下的SiC碳化硅功率半導(dǎo)體產(chǎn)業(yè)演進(jìn)與自主可控之路

    三個(gè)必然”戰(zhàn)略論斷下的SiC碳化硅功率半導(dǎo)體產(chǎn)業(yè)演進(jìn)與自主可控之路 在全球能源結(jié)構(gòu)轉(zhuǎn)型與“雙碳”目標(biāo)的宏觀背景下,功率半導(dǎo)體作為電力電子系統(tǒng)的“心臟”,正經(jīng)歷著硅(Si)基材料向?qū)捊麕В╓BG
    的頭像 發(fā)表于 01-08 21:35 ?230次閱讀

    束管式光纜最簡單三個(gè)步驟

    束管式光纜的安裝或施工可簡化為以下三個(gè)核心步驟,確保光纖傳輸性能穩(wěn)定且操作高效: 第一步:路由規(guī)劃與準(zhǔn)備 路徑勘察 確定光纜敷設(shè)路線,避開強(qiáng)電磁干擾源(如高壓線)、尖銳物體或易受外力破壞的區(qū)域(如
    的頭像 發(fā)表于 01-07 10:12 ?257次閱讀

    未來工業(yè)AI發(fā)展的三個(gè)必然階段

    與優(yōu)化 能力的深層革命。 未來十年,工業(yè)AI的發(fā)展將經(jīng)歷三個(gè)清晰的階段:? 智能輔助 → 智能決策 → 自主優(yōu)化 。這次進(jìn)化,構(gòu)成了工業(yè)“人控機(jī)器”到“機(jī)器共智”的核心路徑。 一、第一階段:智能輔助(AI for Assis
    的頭像 發(fā)表于 10-27 15:47 ?464次閱讀
    未來工業(yè)AI發(fā)展的<b class='flag-5'>三個(gè)</b>必然階段

    三個(gè)方面分析波長對光纖表現(xiàn)的決定性作用

    挑戰(zhàn)三個(gè)方面展開分析: 一、波長對光纖傳輸性能的決定性作用 衰減特性:波長決定光信號的“生存能力” 光纖的衰減系數(shù)隨波長變化顯著。在1310nm波段,衰減主要由瑞利散射主導(dǎo),衰減系數(shù)較低(約0.3-0.4dB/km);而在1550nm波段,衰減
    的頭像 發(fā)表于 10-09 10:26 ?892次閱讀

    淺談Sn-Bi-Ag低溫錫膏的晶界強(qiáng)化機(jī)制

    Sn-Bi-Ag低溫錫膏的晶界強(qiáng)化機(jī)制是一個(gè)多因素協(xié)同作用的過程,以下各機(jī)制的具體作用、研究案例及數(shù)據(jù)支持、協(xié)同效應(yīng)三個(gè)角度進(jìn)行詳細(xì)闡述
    的頭像 發(fā)表于 08-13 09:08 ?656次閱讀

    請問K230D的三個(gè)相機(jī)能同步采樣嗎?

    如題 K230D的三個(gè)相機(jī)能同步采樣嗎?
    發(fā)表于 08-04 06:32

    怎么結(jié)合嵌入式,Linux,和FPGA三個(gè)方向達(dá)到一個(gè)均衡發(fā)展?

    在嵌入式領(lǐng)域,不少人都懷揣著讓嵌入式、Linux 和 FPGA 三個(gè)方向?qū)崿F(xiàn)均衡發(fā)展的夢想,然而實(shí)踐中卻面臨諸多挑戰(zhàn)。就像備受矚目的全棧工程師稚暉君,他大學(xué)玩單片機(jī)起步,憑借將智能算法融入嵌入式而
    的頭像 發(fā)表于 06-25 10:08 ?880次閱讀
    怎么結(jié)合嵌入式,Linux,和FPGA<b class='flag-5'>三個(gè)</b>方向達(dá)到一<b class='flag-5'>個(gè)</b>均衡發(fā)展?

    請問并聯(lián)三個(gè)LT3092擴(kuò)展電流是否可行?

    使用LT3092作為脈沖電流源驅(qū)動(dòng)150mA使用,現(xiàn)在需要擴(kuò)展電流至400~500mA。電流需求穩(wěn)定。①請問并聯(lián)三個(gè)LT3092擴(kuò)展電流是否可行。電路設(shè)計(jì)中是否需要注意其他事項(xiàng)。②如下圖,手冊給出2種2路并聯(lián)的方案,路并聯(lián)選擇哪種電路較合適?③脈沖開關(guān)如何添加?
    發(fā)表于 06-19 07:13

    半導(dǎo)體制造過程中的三個(gè)主要階段

    前段工藝(Front-End)、中段工藝(Middle-End)和后段工藝(Back-End)是半導(dǎo)體制造過程中的三個(gè)主要階段,它們在制造過程中扮演著不同的角色。
    的頭像 發(fā)表于 03-28 09:47 ?7440次閱讀
    半導(dǎo)體制造過程中的<b class='flag-5'>三個(gè)</b>主要階段