91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于FDP SSD的ROCKSDB寫放大優(yōu)化

三星半導(dǎo)體和顯示官方 ? 來源:三星半導(dǎo)體和顯示官方 ? 2026-03-23 09:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

基于FDP SSD的ROCKSDB寫放大優(yōu)化

作為SSD的關(guān)鍵指標(biāo),寫放大(WriteAmplification,WA)始終是SSD領(lǐng)域待攻克的技術(shù)難題之一。其本質(zhì)表現(xiàn)為SSD的實際物理寫入量超過主機(jī)原始請求寫入量。這一現(xiàn)象的根本原因在于NAND閃存介質(zhì)必須以塊(BIoCK)為單位進(jìn)行擦除,而主機(jī)端的寫入請求往往以頁(Page)為單位分散分布于多個塊中。當(dāng)某塊內(nèi)有效數(shù)據(jù)占比低于闊值時,SSD控制器啟動垃圾回收(Garbage Collection,GC)機(jī)制,將尚存的有效數(shù)據(jù)搬運(yùn)至新擦除的塊中,同時釋放原塊以供復(fù)用,這一過程必然產(chǎn)生額外的寫入量。這些額外的寫開銷不僅影響系統(tǒng)整體性能,導(dǎo)致吞吐量下降和延遲升高,還會縮短SSD的使用壽命。

這一挑戰(zhàn)推動了SSD領(lǐng)域的一個重要研究方向一數(shù)據(jù)放置技術(shù)。SSD數(shù)據(jù)放置技術(shù)是通過硬件與軟件的深度協(xié)同設(shè)計,對主機(jī)數(shù)據(jù)在SSD介質(zhì)中的物理布局進(jìn)行優(yōu)化的技術(shù)方案,其核心在于通過降低GC的觸發(fā)頻率,從根本上抑制寫放大(Write Amplification,WA)效應(yīng)的產(chǎn)生機(jī)制。

NVMev2.1規(guī)范所定義的靈活數(shù)據(jù)放置(Flexible Data Placement,F(xiàn)DP)技術(shù),既從底層閃存管理層面顯著減少無效GC操作引I發(fā)的超額寫入流量,又通過FDP的控制指令集降低了上層存儲棧的適配復(fù)雜度。此外,F(xiàn)DP還具有向后兼容能力,能夠復(fù)用當(dāng)前的軟件棧,最終在解決寫放大問題與軟件生態(tài)兼容性之間建立了技術(shù)平衡點(diǎn)。FDP突破了傳統(tǒng)SSD被動式數(shù)據(jù)管理的局限,通過向主機(jī)公開設(shè)備資源信息,并提供數(shù)據(jù)分類放置接口,使主機(jī)能夠根據(jù)數(shù)據(jù)特性(如冷/熱數(shù)據(jù))主動將數(shù)據(jù)分類放置在SSD上不同的存儲單元中。這一機(jī)制實現(xiàn)了數(shù)據(jù)的分流隔離和存儲單元的精細(xì)化布局,從根本上解決了不同特性數(shù)據(jù)混合存儲導(dǎo)致的的余搬移問題。關(guān)于FDP技術(shù)的實現(xiàn)機(jī)制的深度解析,可參考我們發(fā)布在ODCC官網(wǎng)上的《FDPSSD技術(shù)與應(yīng)用白皮書》。

Linux虛擬文件系統(tǒng)(VFS)從版本4.13起,定義了文件生命周期的管理機(jī)制,分別為SHORT(短周期),MEDIUM(中周期),LONG(長周期)和EXTREME(超長周期)。應(yīng)用可通過fcntI(2)系統(tǒng)調(diào)用對文件顯式的指定上述生命周期等級。此外,VFS還定義了NOT_SET和NONE兩種類型,NOT_SET為VFS默認(rèn)類型,表示當(dāng)文件沒有被顯示聲明生命周期時的類型。

NONE表示文件不關(guān)聯(lián)任何生命周期屬性的配置。該機(jī)制與FDP SSD相結(jié)合時,可將不同生命周期的文件映射至FDP內(nèi)部預(yù)設(shè)數(shù)據(jù)流中降低寫放大效應(yīng)。

RocksDB是Meta公司開源的一款高性能嵌入式鍵值對存儲系統(tǒng),其核心架構(gòu)基于Log-StructuredMerge-Tree(LSM-Tree)算法設(shè)計,采用分層存儲結(jié)構(gòu)進(jìn)行數(shù)據(jù)管理,通過追加寫(Append-only)與合并(Compaction)兩大核心機(jī)制實現(xiàn)高吞吐與低延遲特性。其中,SSTable(Sorted String Table),是RocksDB持久化存儲的核心文件,以鍵值對有序序列的形式存儲數(shù)據(jù),并按層級(Level)進(jìn)行組織。較新的數(shù)據(jù)存儲在Levelo中,較老的數(shù)據(jù)隨著合并(Compaction)過程逐步歸并在編號更高的Level中。

ROCkSDB默認(rèn)的數(shù)據(jù)分類策略是將文件的層級特性映射為VFS的文件生命周期標(biāo)識,具體表現(xiàn)為:預(yù)寫日志(WAL)文件被標(biāo)記為SHORT;LeVelO和LeVel1的SSTable文件被標(biāo)記為MEDIUM;LeVeI2的SSTable文件被標(biāo)記為LONG;LeVeI3及更高層級的SSTable文件則被標(biāo)記為EXTREME;其它文件(包括MANIFEST、CURRENT、檢查點(diǎn)日志等)未進(jìn)行顯式生命周期標(biāo)記,默認(rèn)保留為NOT_SET標(biāo)識。

通過對ROockSDB的數(shù)據(jù)分類策略進(jìn)行系統(tǒng)性分析,我們發(fā)現(xiàn)SSTable文件在LSM-Tree層級中的生命周期存在顯著的階段性分布特征:位于LevelO至Level3的SSTable文件具有相對較短的駐留周期,而Level4以及上的文件則展現(xiàn)出最長的存活時間?;谶@一觀測結(jié)果,本實驗摒棄了RoCkSDB原生的數(shù)據(jù)分類策略,轉(zhuǎn)而提出一種優(yōu)化的分類方案。即WAL文件標(biāo)記保持不變,將LeVeI03文件標(biāo)記為MEDIUM,LeVel4文件標(biāo)記為LONG,LeVeI5及以上文件標(biāo)記為EXTREME,其余未歸類文件統(tǒng)一標(biāo)記為NOT_SET。如表1所示:

wKgZPGnAlQ6AFNhcAACbDjD-rKI989.png

表 1:RocksDB 分類策略對比

我們采用FDPSSD(型號U.2PM9D3a,7.68TB容量),針對優(yōu)化前后的ROCkSDB分類方案進(jìn)行了對比測試。通過YCSB基準(zhǔn)測試工具對2億條記錄進(jìn)行數(shù)據(jù)加載(Load)與更新(Update)操作,全面評估不同分類策略的表現(xiàn)。測試結(jié)果表明,RocksDB的原生分類方案在FDPSSD上的WAF相比普通SSD降低了約8%,而優(yōu)化后的分類方案將WAF顯著降低30%。此外,優(yōu)化后的分類方案使每秒操作數(shù)(OPS)提升了10%,同時p99.9延遲得到了55%的改善。

wKgZPGnAlSyALDJvAAFQlD60AvM494.png

圖1. RocksDB 在關(guān)閉 FDP,開啟 FDP 使用原生分類策略和優(yōu)化分類策略的 WAF 對比

wKgZPGnAlVuAQpJgAAFLwyyc95c873.png

圖 2. 寫放大和 SSD 容量利用率的相關(guān)性

wKgZO2nAlZaAectMAAH-FciJQy4331.png

圖3.ROCKSDB在關(guān)閉FDP,開啟FDP使用優(yōu)化分類策略的性能對比

除了在文件系統(tǒng)層面支持FDPSSD外,我們還為ROCKSDB開發(fā)了基于FDPSSD的端到端解決方案。ROCKSDB通過抽象封裝API支持多種存儲后端,我們開發(fā)了RoCkSDB擴(kuò)展插件一TorFS。該插件通過深度集成FDP特性,實現(xiàn)了面向FDPSSD的數(shù)據(jù)分流。在IO調(diào)度層,依托xNVMe開源庫實現(xiàn)多路徑IO的支持。為促進(jìn)生態(tài)發(fā)展,TorFS提供了標(biāo)準(zhǔn)化IO接口,允許第三方開發(fā)者集成定制化的10路徑。

wKgZO2nAlbSAIlmgAAE3IeBMTRA478.png

圖 4. TorFS 架構(gòu)

基于TorFS的端到端方案進(jìn)行測試,測試結(jié)果表明,RocksDB成功實現(xiàn)了對寫放大效應(yīng)的顯著抑制,其寫放大因子(WAF)值近乎趨近于理論極限的1,同時系統(tǒng)性能指標(biāo)達(dá)到最優(yōu)水平,展現(xiàn)出低延遲、高吞吐量與穩(wěn)定持久化的綜合優(yōu)勢。

wKgZPGnAlc6AFck1AAGzwa3btrk947.png

圖5.RocksDB使用TorFS端到端解決方案的寫放大和性能

上述實驗證實,通過對數(shù)據(jù)生命周期管理,F(xiàn)DP技術(shù)顯著提升了SSD的性能與壽命指標(biāo)。我們期待將這項技術(shù)及優(yōu)勢帶給整個超大規(guī)模數(shù)據(jù)中心。我們致力于將這一技術(shù)及優(yōu)勢推廣至超大規(guī)模數(shù)據(jù)中心生態(tài)系統(tǒng),以實現(xiàn)存儲架構(gòu)中數(shù)據(jù)布局與底層介質(zhì)特性的深度適配。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Linux
    +關(guān)注

    關(guān)注

    88

    文章

    11781

    瀏覽量

    219229
  • SSD
    SSD
    +關(guān)注

    關(guān)注

    21

    文章

    3124

    瀏覽量

    122326
  • 數(shù)據(jù)庫
    +關(guān)注

    關(guān)注

    7

    文章

    4044

    瀏覽量

    68427

原文標(biāo)題:科技之心|優(yōu)化數(shù)據(jù)庫寫入:FDP SSD 的新思路

文章出處:【微信號:sdschina_2021,微信公眾號:三星半導(dǎo)體和顯示官方】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    SSD是什么意思,什么是SSD

    、SONY等一大批國外實力廠家的不斷開發(fā)研究,SSD市場已經(jīng)全面開花了。不過不要擔(dān)心,中國第一款SSD已經(jīng)由深圳億正存儲科技公司于2007年1月1日宣布研發(fā)完成,并可以大批量進(jìn)行生產(chǎn),而且讀與速度均大于
    發(fā)表于 03-25 16:20

    SSD優(yōu)化

    一、確定你的電腦運(yùn)行在AHCI模式優(yōu)化SSD的第一步首先就是要確保你的磁盤讀寫模式為AHCI,一般來講如果你的電腦是windows7系統(tǒng),只需要在安裝系統(tǒng)前進(jìn)入BIOS設(shè)置下磁盤讀寫模式為“AHCI
    發(fā)表于 12-24 02:22

    SSD1289寄存器函數(shù)

    ;}這是一個例程的關(guān)于SSD1289寄存器的一個函數(shù),有兩點(diǎn)不明白:1、這個 (u32)0x6c000000中的0x6c000000代表什么,為什么有這個數(shù)字,難道涉及SSD1289的寄存器地址范圍?2
    發(fā)表于 03-21 21:12

    基于全HDD aarch64服務(wù)器的Ceph性能調(diào)優(yōu)實踐總結(jié)

    rocksdb的調(diào)優(yōu)是對放大,讀放大,空間放大之間的權(quán)衡。7 總結(jié)本文介紹了基于全HDD aarch64服務(wù)器的Ceph性能調(diào)優(yōu)實踐,希望
    發(fā)表于 07-05 14:26

    面向多目標(biāo)優(yōu)化的自適應(yīng)SSD緩存系統(tǒng)

    SSD(solid state drive)為代表的新型存儲介質(zhì)在虛擬化環(huán)境下得到了廣泛的應(yīng)用,通常作為虛擬機(jī)讀寫緩存。起到優(yōu)化磁盤I/O性能的作用.已有研究往往關(guān)注SSD緩存的容量規(guī)劃,依據(jù)緩存
    發(fā)表于 12-26 17:13 ?0次下載
    面向多目標(biāo)<b class='flag-5'>優(yōu)化</b>的自適應(yīng)<b class='flag-5'>SSD</b>緩存系統(tǒng)

    全面優(yōu)化SSD,浪潮智能全閃存儲G2-F滿足企業(yè)關(guān)鍵業(yè)務(wù)需求

    ,從全閃存存儲架構(gòu)、效率、可靠性等方面進(jìn)行了全面優(yōu)化,將閃存技術(shù)與企業(yè)級高可靠數(shù)據(jù)存儲平臺深度融合,滿足了IO密集型企業(yè)關(guān)鍵業(yè)務(wù)的數(shù)據(jù)存儲需求。 擦寫壽命限制及放大先天弱點(diǎn),挑戰(zhàn)全閃存存儲系統(tǒng) 相對傳統(tǒng)機(jī)械磁盤,
    發(fā)表于 02-23 15:37 ?579次閱讀

    怎么使用SSD才能避免越越慢?

    江湖傳言:SSD越慢。沒錯,其實這是有科學(xué)依據(jù)的:可用閃存空間富裕時,SSD是無需做GC的,因為總有空閑的空間可寫。SSD使用早期,由于沒有觸發(fā)GC,無需額外的讀寫,所以速度很快。
    的頭像 發(fā)表于 06-02 10:58 ?5826次閱讀
    怎么使用<b class='flag-5'>SSD</b>才能避免越<b class='flag-5'>寫</b>越慢?

    SSD中有個重要參數(shù),就是放大

    小方塊時,每個小方塊的平均有效數(shù)據(jù)為180/216 = 0.83,一個閃存塊上的有效數(shù)據(jù)為0.83*9 = 7.5,也就是一個閃存塊上面平均有7.5個小綠塊和1.5個小紅塊。為了1.5個用戶數(shù)據(jù)方塊,需要寫9個方塊的數(shù)據(jù)(原有7.5個有效數(shù)據(jù),加1.5個用戶數(shù)據(jù)),
    的頭像 發(fā)表于 07-24 15:39 ?1w次閱讀
    <b class='flag-5'>SSD</b>中有個重要參數(shù),就是<b class='flag-5'>寫</b><b class='flag-5'>放大</b>

    SSD 上使用 btrfs 文件系統(tǒng)的相關(guān)優(yōu)化

    btrfs 文件系統(tǒng)有對 SSD 進(jìn)行優(yōu)化,在掛載參數(shù)中加入 ssd 即可。該參數(shù)不會自動啟用 TRIM/discard。
    發(fā)表于 04-27 14:06 ?3218次閱讀

    FDP4D5N10C N通道屏蔽柵極PowerTrench

    電子發(fā)燒友網(wǎng)為你提供()FDP4D5N10C相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊,更有FDP4D5N10C的引腳圖、接線圖、封裝手冊、中文資料、英文資料,FDP4D5N10C真值表,FDP4D5N1
    發(fā)表于 04-18 23:09

    FDP8D5N10C N通道屏蔽柵極PowerTrench

    電子發(fā)燒友網(wǎng)為你提供()FDP8D5N10C相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊,更有FDP8D5N10C的引腳圖、接線圖、封裝手冊、中文資料、英文資料,FDP8D5N10C真值表,FDP8D5N1
    發(fā)表于 04-18 23:08

    讀、、擦除是SSD對NAND的三大基本操作

    通過一系列的介紹和實驗驗證,我們看到了TRIM的價值和實現(xiàn)原理。在TRIM的幫助下,NVMe SSD的GC等操作效率更高,進(jìn)而達(dá)到降低放大,提高產(chǎn)品性能和壽命的效果。
    的頭像 發(fā)表于 04-28 11:39 ?1.2w次閱讀

    Rocksdb原理簡介

    Rocksdb作為當(dāng)下nosql中性能的代表被各個存儲組件(mysql、tikv、pmdk、bluestore)作為存儲引擎底座
    的頭像 發(fā)表于 06-01 17:17 ?1728次閱讀
    <b class='flag-5'>Rocksdb</b>原理簡介

    下一代ZNS?淺談FDP在企業(yè)級SSD應(yīng)用前景

    ,通過系統(tǒng)側(cè)的主動垃圾回收(Garbage Collection,簡稱GC),將SSD內(nèi)的GC削減到0。一方面,可以減少系統(tǒng)和SSD兩層GC帶來的放大和讀寫沖突,延長盤片使用壽命,也
    的頭像 發(fā)表于 10-12 15:55 ?3689次閱讀
    下一代ZNS?淺談<b class='flag-5'>FDP</b>在企業(yè)級<b class='flag-5'>SSD</b>應(yīng)用前景

    KIOXIA推出全新開源軟件,提升RocksDB中閃存存儲的壽命和性能

    支持靈活數(shù)據(jù)放置(FDP)的SSD,公司將在即將召開的Open Compute Project (OCP)全球峰會上展示這一技術(shù)進(jìn)展。 在4驅(qū)動器RAID 5配置中,Kioxia的這款新插件將
    的頭像 發(fā)表于 10-13 11:15 ?431次閱讀