91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何評(píng)估憶聯(lián)Gen5 eSSD UH812a在AI場景中的性能表現(xiàn)

UnionMemory憶聯(lián) ? 來源:UnionMemory憶聯(lián) ? 2026-02-05 09:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著AI大模型進(jìn)入萬億參數(shù)時(shí)代,傳統(tǒng)存儲(chǔ)性能測試已難以真實(shí)反映存儲(chǔ)系統(tǒng)在實(shí)際訓(xùn)練場景中對(duì)成本與效率的核心影響。為此,全球權(quán)威AI基準(zhǔn)測評(píng)組織MLCommons正式推出MLPerf Storage基準(zhǔn)測試套件,為行業(yè)建立起一套貼合實(shí)際、具有指導(dǎo)意義的權(quán)威評(píng)估框架。

區(qū)別于傳統(tǒng)存儲(chǔ)性能測試,MLPerf Storage基準(zhǔn)的核心價(jià)值在于直接評(píng)估存儲(chǔ)系統(tǒng)能否支撐GPU集群達(dá)到并維持高利用率——這直接決定了整體訓(xùn)練耗時(shí)與算力資源成本。該基準(zhǔn)在v2.0版本中進(jìn)一步引入Checkpoint工作負(fù)載,精準(zhǔn)模擬大模型訓(xùn)練中的容災(zāi)恢復(fù)環(huán)節(jié),使評(píng)測更貼近前沿場景的實(shí)際需求。

為評(píng)估憶聯(lián)Gen5 eSSD UH812a在AI場景中的性能表現(xiàn),本次測試基于MLPerf Storage v2.0默認(rèn)參數(shù)展開,并特別針對(duì)對(duì)數(shù)據(jù)供給要求更高的NVIDIA H100加速器進(jìn)行模擬驗(yàn)證,以檢驗(yàn)存儲(chǔ)系統(tǒng)能否充分適配新一代算力平臺(tái)的性能需求。此次測試覆蓋了MLPerf Storage v2.0包含的全部訓(xùn)練負(fù)載,包括U-Net 3D、ResNet50、CosmoFlow和Checkpoint。

結(jié)果顯示,在四項(xiàng)訓(xùn)練模型中,UH812a的 GPU利用率均超過基準(zhǔn)要求,表現(xiàn)出強(qiáng)勁的性能;同時(shí)在可支持的加速器數(shù)量上亦領(lǐng)先于行業(yè)同類產(chǎn)品,有力驗(yàn)證了其在高負(fù)載AI訓(xùn)練場景下可提供穩(wěn)定且高性能的存儲(chǔ)支持。

01測試環(huán)境

部件 配置信息
CPU Intel(R) Xeon(R)
Gold 6430 CPU @ 2.1GHz*2
內(nèi)存 512 GB
存儲(chǔ) 系統(tǒng)盤:
Union Memory SATA 2*480 GB
數(shù)據(jù)盤:
Union Memory UH812a 7.68 TB
Linux內(nèi)核版本 Linux 6.17.4-1.el8.elrepo.x86_64
性能測試軟件 MLPerf Storage v2.0

02測試結(jié)果

U-Net 3D訓(xùn)練場景

該場景模擬醫(yī)療影像等大體積3D數(shù)據(jù)的訓(xùn)練過程,要求存儲(chǔ)系統(tǒng)持續(xù)為多個(gè)并發(fā)GPU客戶端提供大型數(shù)據(jù)文件,旨在測試存儲(chǔ)的極限順序讀寫帶寬,確保GPU不會(huì)因數(shù)據(jù)供給不足而出現(xiàn)空閑等待。

在U-Net3D場景負(fù)載下,我們共使用了42000個(gè)文件進(jìn)行訓(xùn)練,模擬了1到5顆GPU的訓(xùn)練過程。如圖1所示,UH812a在模擬5顆H100 GPU的負(fù)載下,實(shí)現(xiàn)了14566.46 MB/s的最高吞吐量,接近標(biāo)稱讀帶寬(14900 MB/s),此時(shí)GPU利用率(AU)高達(dá)96%,遠(yuǎn)高于基準(zhǔn)所要求的90%以上水平。通過圖1也可看見,UH812a的性能隨著GPU數(shù)量增加而線性提升,且GPU利用率僅出現(xiàn)微弱波動(dòng),證明其在多客戶端高并發(fā)訪問場景下仍能持續(xù)提供穩(wěn)定、高帶寬的數(shù)據(jù)流。

7b276e18-00e8-11f1-90a1-92fbcf53809c.jpg

◎圖1:UH812a在不同數(shù)量H100環(huán)境下的性能測試結(jié)果

此外,在該場景測試中,UH812a可支持高達(dá)5顆H100加速器,優(yōu)于對(duì)比競品(僅支持4顆),凸顯了其在大體積3D數(shù)據(jù)訓(xùn)練負(fù)載下更強(qiáng)的并發(fā)處理能力與性能優(yōu)勢。

7b826886-00e8-11f1-90a1-92fbcf53809c.png

◎圖2:UH812a與競品可支持的H100數(shù)量對(duì)比

ResNet50訓(xùn)練場景

此場景模擬常規(guī)圖像分類模型的訓(xùn)練流程,要求存儲(chǔ)系統(tǒng)能夠應(yīng)對(duì)海量GPU客戶端的高并發(fā)、隨機(jī)讀取需求,處理大量小型圖片文件,從而充分考驗(yàn)存儲(chǔ)系統(tǒng)的高IOPS和低延遲元數(shù)據(jù)處理能力。

在ResNet-50場景測試中,我們使用了19163個(gè)文件進(jìn)行訓(xùn)練,模擬了10至78顆GPU的訓(xùn)練過程。如圖3所示,在模擬78顆H100 GPU的負(fù)載下,UH812a實(shí)現(xiàn)了14008.66 MB/s的最大吞吐量,GPU利用率穩(wěn)定在92.2%,同樣超過基準(zhǔn)要求(AU>90%),體現(xiàn)出其能夠?yàn)閺?fù)雜訓(xùn)練任務(wù)持續(xù)提供充足的存儲(chǔ)性能支持。

7bdb3b78-00e8-11f1-90a1-92fbcf53809c.jpg

◎圖3:UH812a在不同數(shù)量H100環(huán)境下的性能測試結(jié)果

另外,在此場景測試中,UH812a可支持高達(dá)78顆H100加速器同時(shí)高效工作,顯著領(lǐng)先于競品(分別為65顆和64顆)。這一優(yōu)勢表明,UH812a具備支撐更大規(guī)模AI訓(xùn)練集群的潛力,能為極致擴(kuò)展的模型訓(xùn)練任務(wù)提供穩(wěn)定可靠的數(shù)據(jù)供給基礎(chǔ)。

7c337612-00e8-11f1-90a1-92fbcf53809c.png

◎圖4:UH812a與競品可支持的H100數(shù)量對(duì)比

CosmoFlow訓(xùn)練場景

該場景主要模擬氣候、宇宙學(xué)等科學(xué)計(jì)算中的大規(guī)模訓(xùn)練任務(wù),要求存儲(chǔ)系統(tǒng)能夠支持從8個(gè)到數(shù)千個(gè)客戶端的GPU集群擴(kuò)展,同時(shí)高效讀取海量中等尺寸文件。其核心挑戰(zhàn)在于存儲(chǔ)系統(tǒng)的可擴(kuò)展性與延遲穩(wěn)定性——任何局部的訪問延遲都可能拖慢整個(gè)分布式訓(xùn)練作業(yè),因此對(duì)存儲(chǔ)系統(tǒng)的并發(fā)處理與響應(yīng)一致性要求更高。

在CosmoFlow場景的實(shí)際驗(yàn)證中,我們累計(jì)使用了971819個(gè)文件進(jìn)行訓(xùn)練,并模擬了1至26顆GPU的訓(xùn)練過程。如圖5所示,當(dāng)加速器數(shù)量達(dá)到23顆及以上時(shí),UH812a的吞吐量穩(wěn)定維持在約14000MB/s,同時(shí)GPU利用率始終高于基準(zhǔn)要求(AU>70%),展現(xiàn)出卓越的系統(tǒng)可擴(kuò)展性與持續(xù)穩(wěn)定的高并發(fā)數(shù)據(jù)供給能力。

7c8e04e2-00e8-11f1-90a1-92fbcf53809c.jpg

◎圖5:UH812a在不同數(shù)量H100環(huán)境下的性能測試結(jié)果

此外,在這一場景下,UH812a可支持26顆H100加速器,相比于競品(支持21顆和16顆),支持GPU數(shù)量更多,可為高負(fù)載場景提供穩(wěn)定可靠的存儲(chǔ)。

7ce5a878-00e8-11f1-90a1-92fbcf53809c.png

◎圖6:UH812a與競品可支持的H100數(shù)量對(duì)比

Checkpoint訓(xùn)練場景

此場景模擬大模型訓(xùn)練中保存和恢復(fù)訓(xùn)練狀態(tài)的關(guān)鍵操作,要求所有GPU同時(shí)將完整的模型狀態(tài)(參數(shù)、優(yōu)化器等,規(guī)模可達(dá)數(shù)TB)順序?qū)懭氪鎯?chǔ),再快速讀取。該過程是對(duì)存儲(chǔ)系統(tǒng)高并發(fā)順序讀寫帶寬的終極考驗(yàn),其性能直接決定了訓(xùn)練任務(wù)因中斷而損失的時(shí)間。

在Checkpoint場景的實(shí)測中,受限于時(shí)間等因素,我們以Llama3-8b為模型進(jìn)行了寫入測試,圖7實(shí)測結(jié)果顯示,UH812a的帶寬達(dá)到13053.4 MB/s,較競品A提升24%,較競品B提升11%,可為用戶提供高性能的讀寫體驗(yàn)。

7d424fb0-00e8-11f1-90a1-92fbcf53809c.png

◎圖7:Llama3-8b模型下UH812a與競品表現(xiàn)對(duì)比

MLPerf Storage v2.0的測試結(jié)果表明,UH812a能夠充分滿足前沿AI場景對(duì)存儲(chǔ)系統(tǒng)的嚴(yán)苛性能需求,尤其在數(shù)據(jù)供給能力和穩(wěn)定性方面展現(xiàn)出顯著優(yōu)勢,性能領(lǐng)先于業(yè)界同類產(chǎn)品。這不僅印證了其在加速AI工作負(fù)載方面的卓越能力,也體現(xiàn)了其作為智能算力底座關(guān)鍵一環(huán)的核心價(jià)值。

未來,憶聯(lián)將繼續(xù)聚焦AI存儲(chǔ)技術(shù)創(chuàng)新與產(chǎn)品研發(fā),致力于通過更高性能、更可靠的存儲(chǔ)解決方案,持續(xù)賦能智能算力基礎(chǔ)設(shè)施建設(shè),與產(chǎn)業(yè)伙伴共同推動(dòng)人工智能技術(shù)的規(guī)?;涞嘏c持續(xù)演進(jìn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 存儲(chǔ)
    +關(guān)注

    關(guān)注

    13

    文章

    4787

    瀏覽量

    90057
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135427
  • 算力
    +關(guān)注

    關(guān)注

    2

    文章

    1528

    瀏覽量

    16740
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3648

    瀏覽量

    5179

原文標(biāo)題:憶聯(lián)UH812a以MLPerf Storage標(biāo)桿級(jí)驗(yàn)證,重塑AI存儲(chǔ)效能,奠定智能算力基石

文章出處:【微信號(hào):UnionMemory憶聯(lián),微信公眾號(hào):UnionMemory憶聯(lián)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    正面對(duì)決A19 Pro,驍龍8 Elite Gen5殺瘋了,誰是2025手機(jī)真旗艦SoC?

    隨著驍龍 8 Elite Gen5A19 Pro處理器的發(fā)布,高通與蘋果(Apple)移動(dòng)芯片領(lǐng)域的競爭正升級(jí)到新高度。 高通宣稱要在CPU單核性能上超越蘋果,而蘋果
    的頭像 發(fā)表于 09-29 09:03 ?1.9w次閱讀
    正面對(duì)決<b class='flag-5'>A</b>19 Pro,驍龍8 Elite <b class='flag-5'>Gen5</b>殺瘋了,誰是2025手機(jī)真旗艦SoC?

    聯(lián)UH812a以極致存力破局大模型載入瓶頸

    隨著大模型技術(shù)規(guī)?;涞兀?b class='flag-5'>AI應(yīng)用的實(shí)時(shí)性正成為企業(yè)競爭力的核心。然而,算力持續(xù)升級(jí)的同時(shí),模型從存儲(chǔ)層加載至計(jì)算單元的環(huán)節(jié)卻日漸成為制約系統(tǒng)效率與彈性的關(guān)鍵瓶頸。緩慢或波動(dòng)的加載過程,不僅會(huì)導(dǎo)致
    的頭像 發(fā)表于 03-04 16:22 ?631次閱讀
    <b class='flag-5'>憶</b><b class='flag-5'>聯(lián)</b><b class='flag-5'>UH812a</b>以極致存力破局大模型載入瓶頸

    英特爾與聯(lián)重磅推出企業(yè)級(jí)網(wǎng)絡(luò)存儲(chǔ)解決方案

    白皮書,旨在充分發(fā)揮至強(qiáng)6處理器與聯(lián)UH812a企業(yè)級(jí)SSD的性能潛力,全面滿足AI訓(xùn)練與推理場景
    的頭像 發(fā)表于 02-02 09:14 ?965次閱讀
    英特爾與<b class='flag-5'>憶</b><b class='flag-5'>聯(lián)</b>重磅推出企業(yè)級(jí)網(wǎng)絡(luò)存儲(chǔ)解決方案

    探索RC192xx:PCIe Gen5/6 2 - 輸入時(shí)鐘復(fù)用器家族的卓越性能

    RC19202、RC19204、RC19208和RC19216,憑借其對(duì)PCIe Gen5Gen6的支持,以及一系列出色的特性,成為了眾多應(yīng)用場景的理想選擇。今天,我們就來深入了解
    的頭像 發(fā)表于 12-30 09:55 ?621次閱讀

    深入解析RC190xx:PCIe Gen5/6高性能扇出緩沖器家族

    深入解析RC190xx:PCIe Gen5/6高性能扇出緩沖器家族 在當(dāng)今高速發(fā)展的電子科技領(lǐng)域,PCIe Gen5/6技術(shù)的應(yīng)用越來越廣泛,對(duì)高性能扇出緩沖器的需求也愈發(fā)迫切。Ren
    的頭像 發(fā)表于 12-30 09:55 ?726次閱讀

    【道生物聯(lián)TKB-623評(píng)估板試用】功能綜合測試

    TKB-623 模組實(shí)際應(yīng)用場景的通信性能、穩(wěn)定性、易用性及其與我司目標(biāo)產(chǎn)品的兼容性。 2. 評(píng)估板簡介
    發(fā)表于 11-09 14:35

    PCIe Gen5/Gen6 信號(hào)傳輸可以用極細(xì)同軸線束嗎?

    極細(xì)同軸線束不僅能在結(jié)構(gòu)空間上提供靈活性,還能在信號(hào)層面保持可控的損耗和低串?dāng)_,滿足高速互聯(lián)需求。極細(xì)同軸線束可在特定條件下用于 PCIe Gen5/Gen6 信號(hào)傳輸,但必須建立高質(zhì)量線束、嚴(yán)格的阻抗控制、專業(yè)的連接器選型與
    的頭像 發(fā)表于 10-27 18:27 ?2635次閱讀
    PCIe <b class='flag-5'>Gen5</b>/<b class='flag-5'>Gen</b>6 信號(hào)傳輸可以用極細(xì)同軸線束嗎?

    聯(lián)PCIe 5.0企業(yè)級(jí)固態(tài)硬盤UH812a評(píng)測

    近日,國內(nèi)知名計(jì)算機(jī)硬件評(píng)測媒體PCEVA對(duì)聯(lián)PCIe 5.0企業(yè)級(jí)固態(tài)硬盤UH812a進(jìn)行了全面評(píng)測,測試數(shù)據(jù)顯示該產(chǎn)品不僅在性能上達(dá)到業(yè)界領(lǐng)先水平,更在Oracle數(shù)據(jù)庫、VSI
    的頭像 發(fā)表于 08-21 11:27 ?4472次閱讀
    <b class='flag-5'>憶</b><b class='flag-5'>聯(lián)</b>PCIe 5.0企業(yè)級(jí)固態(tài)硬盤<b class='flag-5'>UH812a</b>評(píng)測

    英特爾Benchmark驗(yàn)證!聯(lián)UH812a問鼎PCIe Gen5企業(yè)級(jí)存儲(chǔ)性能巔峰

    達(dá)3538K,延遲改善43%,多盤擴(kuò)展性能線性增長至230GB/s。通過全場景驗(yàn)證,UH812a展現(xiàn)了卓越的穩(wěn)定性與擴(kuò)展性,標(biāo)志著聯(lián)與英特
    的頭像 發(fā)表于 07-07 16:33 ?766次閱讀
    英特爾Benchmark驗(yàn)證!<b class='flag-5'>憶</b><b class='flag-5'>聯(lián)</b><b class='flag-5'>UH812a</b>問鼎PCIe <b class='flag-5'>Gen5</b>企業(yè)級(jí)存儲(chǔ)<b class='flag-5'>性能</b>巔峰

    聯(lián) Docker+MySQL 流控方案:打造安全高效存儲(chǔ)底座,釋放 AI 極致性能

    探討基于Docker部署的MySQL數(shù)據(jù)庫AI應(yīng)用的關(guān)鍵作用。通過聯(lián)PCIe5.0企業(yè)級(jí)SSD(U
    的頭像 發(fā)表于 06-26 13:53 ?445次閱讀
    <b class='flag-5'>憶</b><b class='flag-5'>聯(lián)</b> Docker+MySQL 流控方案:打造安全高效存儲(chǔ)底座,釋放 <b class='flag-5'>AI</b> 極致<b class='flag-5'>性能</b>

    聯(lián)攜手新華三 SPEC基準(zhǔn)測試再創(chuàng)新高,樹立企業(yè)級(jí)存儲(chǔ)領(lǐng)域新標(biāo)桿

    引言:PCIe 5.0時(shí)代的存儲(chǔ)革新 隨著大模型訓(xùn)練、邊緣計(jì)算與超大規(guī)模數(shù)據(jù)中心的快速發(fā)展,存儲(chǔ)系統(tǒng)面臨性能、效率以及可靠性的多重挑戰(zhàn)。聯(lián)PCIe 5.0企業(yè)級(jí)固態(tài)硬盤(ESSD
    的頭像 發(fā)表于 05-08 13:52 ?644次閱讀
    <b class='flag-5'>憶</b><b class='flag-5'>聯(lián)</b>攜手新華三 SPEC基準(zhǔn)測試再創(chuàng)新高,樹立企業(yè)級(jí)存儲(chǔ)領(lǐng)域新標(biāo)桿

    誰說高性能必須高能耗?揭秘企業(yè)級(jí)SSD功耗管理“黑科技”

    維護(hù)需求,助力數(shù)據(jù)中心實(shí)現(xiàn)可持續(xù)的降本增效目標(biāo)。 數(shù)據(jù)中心更低功耗、更優(yōu)TCO,從聯(lián)新一代PCIe Gen5 ESSD UH812a/
    的頭像 發(fā)表于 04-22 17:19 ?781次閱讀
    誰說高<b class='flag-5'>性能</b>必須高能耗?揭秘企業(yè)級(jí)SSD功耗管理“黑科技”

    聯(lián)UH812a獲英特爾BKC與PCIe鏈路雙認(rèn)證,賦能企業(yè)級(jí)存儲(chǔ)解決方案

    SSD UH812a以零缺陷表現(xiàn)全項(xiàng)通過嚴(yán)苛的英特爾BKC認(rèn)證標(biāo)準(zhǔn)與PCIe鏈路穩(wěn)定性測試,憑借超強(qiáng)兼容性、可靠性及極致性能,為大模型推理、高密度計(jì)算等場景提供穩(wěn)定高效的存儲(chǔ)支撐。 該
    的頭像 發(fā)表于 04-02 13:47 ?683次閱讀
    <b class='flag-5'>憶</b><b class='flag-5'>聯(lián)</b><b class='flag-5'>UH812a</b>獲英特爾BKC與PCIe鏈路雙認(rèn)證,賦能企業(yè)級(jí)存儲(chǔ)解決方案

    聯(lián)PCIe5.0 SSD以軟硬協(xié)同的高可靠性,支撐大模型全流程訓(xùn)練

    訓(xùn)練效率與穩(wěn)定性的關(guān)鍵。 從海量數(shù)據(jù)的預(yù)處理到高頻參數(shù)迭代,從模型微調(diào)到實(shí)時(shí)推理,大模型運(yùn)行的每一個(gè)環(huán)節(jié)都需存儲(chǔ)設(shè)備"硬指標(biāo)"與"軟實(shí)力"間達(dá)成平衡。從產(chǎn)品可靠性視角出發(fā),聯(lián)新一代PCIe
    的頭像 發(fā)表于 03-12 10:18 ?1082次閱讀
    <b class='flag-5'>憶</b><b class='flag-5'>聯(lián)</b>PCIe5.0 SSD以軟硬協(xié)同的高可靠性,支撐大模型全流程訓(xùn)練

    聯(lián)PCIe 5.0 SSD支撐大模型全流程訓(xùn)練

    到高頻參數(shù)迭代,從模型微調(diào)到實(shí)時(shí)推理,大模型運(yùn)行的每一個(gè)環(huán)節(jié)都需存儲(chǔ)設(shè)備“硬指標(biāo)”與“軟實(shí)力”間達(dá)成平衡。從產(chǎn)品可靠性視角出發(fā),聯(lián)新一代PCIe Gen5
    的頭像 發(fā)表于 03-11 10:26 ?1138次閱讀
    <b class='flag-5'>憶</b><b class='flag-5'>聯(lián)</b>PCIe 5.0 SSD支撐大模型全流程訓(xùn)練