·通過評估新算法、組件或協(xié)議提高AI訓練的性能
·在不投資昂貴的大規(guī)模部署的情況下,調(diào)整和優(yōu)化AI工作負載和系統(tǒng)基礎設施的參數(shù)
是德科技(NYSE: KEYS )推出Keysight AI (KAI)數(shù)據(jù)中心構(gòu)建器,這是一款先進的軟件套件,通過模擬真實工作負載來評估新算法、組件和協(xié)議對AI訓練性能的影響。KAI數(shù)據(jù)中心構(gòu)建器的工作負載模擬功能將大型語言模型(LLM)和其他人工智能(AI)模型訓練工作負載集成到AI基礎設施組件的設計和驗證中——包括網(wǎng)絡、主機和加速器。該解決方案實現(xiàn)了硬件設計、協(xié)議、架構(gòu)和AI訓練算法之間的更緊密協(xié)同,提升系統(tǒng)性能。
Keysight AI (KAI)數(shù)據(jù)中心構(gòu)建器是一款先進的軟件套件,通過模擬真實工作負載來評估新算法、組件和協(xié)議對AI訓練性能的影響
AI服務提供商使用各種并行處理策略(也稱為數(shù)據(jù)或模型并行)來加速AI模型訓練。將模型并行與AI集群拓撲和配置對齊可以提高訓練性能。在AI集群設計階段,關(guān)鍵問題最好通過實驗來回答。許多問題集中在圖形處理單元(GPU)之間的數(shù)據(jù)傳輸效率上。關(guān)鍵考慮因素包括:
·AI主機或機架內(nèi)GPU互連的scale up設計
·Scale out網(wǎng)絡設計,包括每個GPU的帶寬和拓撲
·網(wǎng)絡負載均衡和擁塞控制的配置
·訓練框架參數(shù)的調(diào)整
KAI數(shù)據(jù)中心構(gòu)建器的工作負載模擬解決方案再現(xiàn)了真實AI訓練任務的網(wǎng)絡通信模式,加速實驗,降低達到熟練程度所需的學習曲線,并更深入洞察性能下降的原因,這些是通過真實AI訓練任務實驗難以獲得的。是德科技客戶可以訪問包括GPT和Llama在內(nèi)的LLM工作負載庫,以及數(shù)據(jù)并行(DP)、全分片數(shù)據(jù)并行(FSDP)和三維(3D)并行等流行的模型分區(qū)方案。
使用KAI數(shù)據(jù)中心構(gòu)建器中的工作負載模擬應用程序,AI服務提供商可以:
·實驗并行參數(shù),包括并行數(shù)據(jù)大小及其在可用AI基礎設施上的分布(調(diào)度)
·了解并行內(nèi)和并行間通信對整體任務完成時間(JCT)的影響
·識別低性能的集合通信操作并深入識別瓶頸
·分析網(wǎng)絡利用率、尾部延遲和擁塞,了解它們對JCT的影響
KAI數(shù)據(jù)中心構(gòu)建器的新工作負載模擬功能使AI服務提供商、GPU云提供商和基礎設施供應商能夠?qū)⒄鎸嵉腁I工作負載引入其實驗室環(huán)境,以驗證AI集群和新組件的不斷演變的設計。他們還可以通過實驗微調(diào)模型并行方案、參數(shù)和算法,以優(yōu)化基礎設施并提高AI工作負載性能。
是德科技網(wǎng)絡測試與安全解決方案副總裁兼總經(jīng)理Ram Periakaruppan表示:“隨著AI基礎設施規(guī)模和復雜性的增長,對全棧驗證和優(yōu)化的需求變得至關(guān)重要。為了避免昂貴的延誤和返工,必須將驗證轉(zhuǎn)移到設計和制造周期的早期階段。KAI數(shù)據(jù)中心構(gòu)建器的工作負載模擬為AI組件和系統(tǒng)設計提供了非常高的真實性,優(yōu)化工作負載以實現(xiàn)最佳性能。”
KAI數(shù)據(jù)中心構(gòu)建器是是德科技人工智能(KAI)架構(gòu)的基礎,這是一系列端到端解決方案,旨在通過使用真實AI工作負載模擬驗證AI集群組件,幫助客戶在數(shù)據(jù)中心擴展人工智能(AI)處理能力。
是德科技在2025年4月1日至3日于舊金山Moscone中心舉行的OFC 2025會議上展示KAI數(shù)據(jù)中心構(gòu)建器及其工作負載模擬功能,展位號1301。
關(guān)于是德科技
是德科技(NYSE:KEYS)啟迪并賦能創(chuàng)新者,助力他們將改變世界的技術(shù)帶入生活。作為一家標準普爾 500 指數(shù)公司,我們提供先進的設計、仿真和測試解決方案,旨在幫助工程師在整個產(chǎn)品生命周期中更快地完成開發(fā)和部署,同時控制好風險。我們的客戶遍及全球通信、工業(yè)自動化、航空航天與國防、汽車、半導體和通用電子等市場。我們與客戶攜手,加速創(chuàng)新,創(chuàng)造一個安全互聯(lián)的世界。了解更多信息,請訪問是德科技官網(wǎng)。
審核編輯 黃宇
-
數(shù)據(jù)中心
+關(guān)注
關(guān)注
18文章
5647瀏覽量
75008 -
AI
+關(guān)注
關(guān)注
91文章
39755瀏覽量
301356 -
是德科技
+關(guān)注
關(guān)注
21文章
1060瀏覽量
85585
發(fā)布評論請先 登錄
1分鐘帶你了解數(shù)據(jù)中心供電架構(gòu) #電子元器件 #數(shù)據(jù)中心 #供電架構(gòu)
是德科技推出AI軟件完整性構(gòu)建器解決方案
NVIDIA如何優(yōu)化AI工廠的網(wǎng)絡可靠性與功耗
睿海光電以高效交付與廣泛兼容助力AI數(shù)據(jù)中心800G光模塊升級
華為面向拉美地區(qū)發(fā)布全新星河AI數(shù)據(jù)中心網(wǎng)絡方案
PCIe協(xié)議分析儀在數(shù)據(jù)中心中有何作用?
中型數(shù)據(jù)中心中的差分晶體振蕩器應用與匹配方案
華為面向亞太地區(qū)發(fā)布全新星河AI數(shù)據(jù)中心網(wǎng)絡方案
華為面向中東中亞地區(qū)發(fā)布全新星河AI數(shù)據(jù)中心網(wǎng)絡
是德科技推出用于大規(guī)模AI數(shù)據(jù)中心的系列解決方案
是德科技推出AI數(shù)據(jù)中心構(gòu)建器
適用于數(shù)據(jù)中心和AI時代的800G網(wǎng)絡
華為全新升級星河AI數(shù)據(jù)中心網(wǎng)絡
優(yōu)化800G數(shù)據(jù)中心:高速線纜、有源光纜和光纖跳線解決方案
華為發(fā)布新一代站點能源架構(gòu)及AI數(shù)據(jù)中心建設理念
是德科技推出AI數(shù)據(jù)中心構(gòu)建器以驗證和優(yōu)化網(wǎng)絡架構(gòu)和主機設計
評論