91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

9個為人工智能、機器學(xué)習(xí)和深度學(xué)習(xí)準(zhǔn)備數(shù)據(jù)中心的優(yōu)秀實踐

如意 ? 來源:企業(yè)網(wǎng)D1Net ? 作者:HERO編譯 ? 2020-10-09 15:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

圍繞圖形處理單元(GPU)計算的生態(tài)系統(tǒng)如今正在迅速發(fā)展,以提高GPU工作負(fù)載的效率和可擴展性。然而,在避免存儲和網(wǎng)絡(luò)中潛在的瓶頸的同時,也有一些技巧可以很大限度地提高GPU的利用率。

人工智能機器學(xué)習(xí)、深度學(xué)習(xí)應(yīng)用程序的密集需求對數(shù)據(jù)中心的性能、可靠性和可擴展性提出了挑戰(zhàn),尤其是在IT架構(gòu)師模仿公共云的設(shè)計以簡化向混合云和內(nèi)部部署的過渡時。

Excelero公司首席技術(shù)官Sven Breuner和首席架構(gòu)師Kirill Shoikhet為此分享了9個為人工智能、機器學(xué)習(xí)和深度學(xué)習(xí)準(zhǔn)備數(shù)據(jù)中心的優(yōu)秀實踐。

數(shù)據(jù)點1:了解目標(biāo)系統(tǒng)性能、投資回報率和可擴展性計劃。

隨著人工智能成為核心業(yè)務(wù)的重要組成部分,大多數(shù)組織都從最初的少量預(yù)算和少量培訓(xùn)數(shù)據(jù)集入手,并為無縫快速的系統(tǒng)增長準(zhǔn)備基礎(chǔ)設(shè)施。需要構(gòu)建所選的硬件和軟件基礎(chǔ)設(shè)施,以實現(xiàn)靈活的橫向擴展,以避免在每個新的增長階段產(chǎn)生破壞性的變化。數(shù)據(jù)科學(xué)家與系統(tǒng)管理員之間的密切協(xié)作對于了解性能要求,并了解基礎(chǔ)設(shè)施可能需要隨著時間的發(fā)展而變得至關(guān)重要。

數(shù)據(jù)點2:現(xiàn)在或?qū)碓u估集群多個GPU系統(tǒng)。

在一臺服務(wù)器中采用多個GPU可以在系統(tǒng)內(nèi)部實現(xiàn)有效的數(shù)據(jù)共享和通信,并具有成本效益,參考設(shè)計假定將來可以集群使用,并且在單個服務(wù)器中最多支持16個GPU。多個GPU服務(wù)器需要準(zhǔn)備好以很高的速率讀取傳入的數(shù)據(jù),以使GPU高效運行,這意味著它需要一個超高速的網(wǎng)絡(luò)連接,以及用于訓(xùn)練數(shù)據(jù)庫的存儲系統(tǒng)。但是在某個時候,單臺服務(wù)器將不再足以在合理的時間內(nèi)處理增長的訓(xùn)練數(shù)據(jù)庫,因此在設(shè)計中構(gòu)建共享存儲基礎(chǔ)設(shè)施將使隨著人工智能、機器學(xué)習(xí)、深度學(xué)習(xí)使用的擴展,添加GPU服務(wù)器變得更容易。

數(shù)據(jù)點3:評估人工智能工作流程各個階段的瓶頸。

數(shù)據(jù)中心基礎(chǔ)設(shè)施需要能夠同時處理人工智能工作流程的所有階段。對于具有成本效益的數(shù)據(jù)中心來說,擁有一個可靠的資源調(diào)度和共享概念是至關(guān)重要的。因此,盡管數(shù)據(jù)科學(xué)家獲得了需要攝取和準(zhǔn)備的新數(shù)據(jù),但其他人將訓(xùn)練他們的可用數(shù)據(jù),而其他人則使用先前生成的模型進(jìn)行訓(xùn)練用于生產(chǎn)。Kubernetes已成為解決這一問題的一種主要解決方案,使云計算技術(shù)易于在內(nèi)部部署使用,并使混合部署變得可行。

數(shù)據(jù)點4:查看用于優(yōu)化GPU利用率和性能的策略。

許多人工智能、機器學(xué)習(xí)、深度學(xué)習(xí)應(yīng)用程序的計算密集型性質(zhì)使基于GPU的服務(wù)器成為常見選擇。但是,盡管GPU可以有效地從內(nèi)存加載數(shù)據(jù),但是訓(xùn)練數(shù)據(jù)集通常遠(yuǎn)遠(yuǎn)超過內(nèi)存,并且涉及的大量文件變得更加難以攝取。在GPU服務(wù)器之間以及與存儲基礎(chǔ)設(shè)施之間,實現(xiàn)GPU數(shù)量與可用CPU功率、內(nèi)存和網(wǎng)絡(luò)帶寬之間的優(yōu)秀平衡至關(guān)重要。

數(shù)據(jù)點5:支持訓(xùn)練和推理階段的需求。

在訓(xùn)練系統(tǒng)“看貓”的經(jīng)典示例中,計算機執(zhí)行一個數(shù)字游戲,需要查看大量不同顏色的貓。由于包含大量并行文件讀取的訪問的性質(zhì),NVMe閃存通過提供超低的訪問延遲和每秒的大量讀取操作很好地滿足了這些要求。在推理階段,挑戰(zhàn)是相似的,因為對象識別通常是實時發(fā)生的——另一個使用案例中,NVMe閃存也提供了延遲優(yōu)勢。

數(shù)據(jù)點6:考慮并行文件系統(tǒng)和替代方案。

諸如IBM公司的SpectrumScale或BeeGFS之類的并行文件系統(tǒng)可以幫助有效地處理大量小文件的元數(shù)據(jù),并通過在網(wǎng)絡(luò)上每秒交付數(shù)萬個小文件,從而使機器學(xué)習(xí)數(shù)據(jù)集的分析速度提高3到4倍。鑒于訓(xùn)練數(shù)據(jù)的只讀性質(zhì),因此在將數(shù)據(jù)卷直接提供給GPU服務(wù)器并通過Kubernetes之類的框架以共享方式共享它們時,也可以完全避免使用并行文件系統(tǒng)。

數(shù)據(jù)點7:選擇正確的網(wǎng)絡(luò)主干。

人工智能、機器學(xué)習(xí)、深度學(xué)習(xí)通常是一種新的工作負(fù)載,將其重新安裝到現(xiàn)有的網(wǎng)絡(luò)基礎(chǔ)設(shè)施中通常無法支持復(fù)雜計算和快速高效數(shù)據(jù)傳輸所需的低延遲、高帶寬、高消息速率和智能卸載?;赗DMA的網(wǎng)絡(luò)傳輸RoCE(融合以太網(wǎng)上的RDMA)和InfiniBand已成為滿足這些新需求的標(biāo)準(zhǔn)。

數(shù)據(jù)點8:考慮四個存儲系統(tǒng)的性價比杠桿。

(1)高讀取吞吐量和低延遲,不限制混合部署,可以在云平臺或內(nèi)部部署資源上運行。

(2)數(shù)據(jù)保護(hù)。人工智能、機器學(xué)習(xí)、深度學(xué)習(xí)存儲系統(tǒng)通常比數(shù)據(jù)中心中的其他系統(tǒng)要快得多,因此在發(fā)生故障后從備份中恢復(fù)可能會花費很長時間,并且會中斷正在進(jìn)行的操作。深度學(xué)習(xí)訓(xùn)練的只讀性質(zhì)使其非常適合于分布式擦除編碼,在這種存儲中,最高容錯能力已經(jīng)內(nèi)置在主存儲系統(tǒng)中,原始容量和可用容量之間的差異很小。

(3)容量彈性可適應(yīng)任何大小或類型的驅(qū)動器,以便隨著閃存介質(zhì)的發(fā)展和閃存驅(qū)動器特性的擴展,數(shù)據(jù)中心可以在最重要的情況下很大限度地提高性價比。

(4)性能。由于人工智能數(shù)據(jù)集需要隨著時間的推移而增長,以進(jìn)一步提高模型的準(zhǔn)確性,因此存儲基礎(chǔ)設(shè)施應(yīng)實現(xiàn)接近線性的縮放系數(shù),在這種情況下,每增加一次存儲都會帶來同等的增量性能。這使得組織可以從小規(guī)模開始,并根據(jù)業(yè)務(wù)需要而無中斷地增長。

數(shù)據(jù)點9:設(shè)置基準(zhǔn)和性能指標(biāo)以幫助實現(xiàn)可擴展性。

例如,對于深度學(xué)習(xí)存儲,一個重要指標(biāo)可能是每個GPU每秒處理X個文件(通常為數(shù)千或數(shù)萬個),其中每個文件的平均大小為Y(從幾十個到數(shù)千個)kB 。預(yù)先建立適當(dāng)?shù)幕鶞?zhǔn)和性能指標(biāo)有助于從一開始就確定架構(gòu)方法和解決方案,并指導(dǎo)后續(xù)擴展。
責(zé)編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40660

    瀏覽量

    302313
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    67

    文章

    8560

    瀏覽量

    137152
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5603

    瀏覽量

    124569
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    智能檢測】基于AI深度學(xué)習(xí)與飛拍技術(shù)的影像測量系統(tǒng):實現(xiàn)高效精準(zhǔn)的全自動光學(xué)檢測與智能制造數(shù)據(jù)閉環(huán)

    內(nèi)容概要:文檔內(nèi)容介紹了中圖儀器(Chotest)影像測量儀融合人工智能深度學(xué)習(xí)與飛拍技術(shù)的自動化檢測解決方案。系統(tǒng)通過AI深度學(xué)習(xí)實現(xiàn)
    發(fā)表于 03-31 17:11

    人工智能機器學(xué)習(xí)在這些行業(yè)的深度應(yīng)用

    人工智能機器學(xué)習(xí)問世以來,多個在線領(lǐng)域的數(shù)字化格局迎來了翻天覆地的變化。這些技術(shù)從誕生之初就為企業(yè)賦予了競爭優(yōu)勢,而在線行業(yè)正是受其影響最為顯著的領(lǐng)域。人工智能(AI)與
    的頭像 發(fā)表于 02-04 14:44 ?623次閱讀

    主線科技入選“人工智能+”創(chuàng)新應(yīng)用實踐案例

    正式收錄于新華網(wǎng)聯(lián)合中國軟件評測中心編制的《實體經(jīng)濟(jì)和數(shù)字經(jīng)濟(jì)深度融合發(fā)展報告(2025)——“人工智能+”創(chuàng)新應(yīng)用》,成為物流行業(yè)數(shù)智化轉(zhuǎn)型的標(biāo)志案例。
    的頭像 發(fā)表于 01-12 09:23 ?466次閱讀

    機器學(xué)習(xí)深度學(xué)習(xí)中需避免的 7 常見錯誤與局限性

    ,并驗證輸出結(jié)果,就能不斷提升專業(yè)技能,養(yǎng)成優(yōu)秀數(shù)據(jù)科學(xué)家的工作習(xí)慣。需避免的機器學(xué)習(xí)深度學(xué)習(xí)
    的頭像 發(fā)表于 01-07 15:37 ?301次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>和<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 <b class='flag-5'>個</b>常見錯誤與局限性

    人工智能數(shù)據(jù)中心的光纖布線策略

    隨著人工智能(AI)技術(shù)的飛速發(fā)展,數(shù)據(jù)中心的光纖布線策略正面臨前所未有的挑戰(zhàn)和機遇。AI的高帶寬需求、低延遲要求以及大規(guī)模并行計算的特點,對數(shù)據(jù)中心的光纖布線提出了更高的要求。本文將從多個方面探討
    的頭像 發(fā)表于 11-21 10:21 ?537次閱讀

    納微GaN與SiC技術(shù)革新數(shù)據(jù)中心電力架構(gòu)

    隨著云端大規(guī)模人工智能(AI)的迅速發(fā)展與部署,包括OpenAI開發(fā)的ChatGPT在內(nèi),越來越多高性能的、為特定目標(biāo)設(shè)計的AI處理器正被集成至數(shù)據(jù)中心服務(wù)器中。人工智能技術(shù)涵蓋機器
    的頭像 發(fā)表于 10-30 14:11 ?4407次閱讀
    納微GaN與SiC技術(shù)革新<b class='flag-5'>數(shù)據(jù)中心</b>電力架構(gòu)

    如何在機器視覺中部署深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)

    圖 1:基于深度學(xué)習(xí)的目標(biāo)檢測可定位已訓(xùn)練的目標(biāo)類別,并通過矩形框(邊界框)對其進(jìn)行標(biāo)識。 在討論人工智能(AI)或深度學(xué)習(xí)時,經(jīng)常會出現(xiàn)“
    的頭像 發(fā)表于 09-10 17:38 ?1000次閱讀
    如何在<b class='flag-5'>機器</b>視覺中部署<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>神經(jīng)網(wǎng)絡(luò)

    賦能人工智能未來:ADI宣布支持800 VDC數(shù)據(jù)中心架構(gòu)

    , Inc. (ADI)推出創(chuàng)新解決方案,為數(shù)據(jù)中心下一代800 VDC架構(gòu)提供有力支持。該系列解決方案包含高可靠性熱插拔與一級電源產(chǎn)品,旨在實現(xiàn)安全、高效且智能的配電,精準(zhǔn)滿足現(xiàn)代AI工廠系統(tǒng)的供電需求。 賦能人工智能未來:A
    的頭像 發(fā)表于 08-28 21:18 ?1197次閱讀
    賦能<b class='flag-5'>人工智能</b>未來:ADI宣布支持800 VDC<b class='flag-5'>數(shù)據(jù)中心</b>架構(gòu)

    深度學(xué)習(xí)對工業(yè)物聯(lián)網(wǎng)有哪些幫助

    深度學(xué)習(xí)作為人工智能的核心分支,通過模擬人腦神經(jīng)網(wǎng)絡(luò)的層級結(jié)構(gòu),能夠自動從海量工業(yè)數(shù)據(jù)中提取復(fù)雜特征,為工業(yè)物聯(lián)網(wǎng)(IIoT)提供了從數(shù)據(jù)感知到智能
    的頭像 發(fā)表于 08-20 14:56 ?1151次閱讀

    Molex莫仕PCIe解決方案如何塑造數(shù)據(jù)中心格局

    隨著人工智能(AI)、機器學(xué)習(xí)(ML)和云計算的發(fā)展,數(shù)據(jù)中心不得不面對爆炸式增長的數(shù)據(jù),壓力不斷增長。這些工作負(fù)載需要更快、更高效的基礎(chǔ)設(shè)
    的頭像 發(fā)表于 08-14 09:59 ?2637次閱讀
    Molex莫仕PCIe解決方案如何塑造<b class='flag-5'>數(shù)據(jù)中心</b>格局

    挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器

    應(yīng)用場景。從數(shù)據(jù)采集,到模型推理,都能完整且自如地參與,輕松解鎖人工智能全流程實訓(xùn),讓你深度體驗AI技術(shù)的魅力 。 四、九門課程全覆蓋,滿足多元學(xué)習(xí)需求 對于高校教學(xué)或者技術(shù)
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!

    應(yīng)用場景。從數(shù)據(jù)采集,到模型推理,都能完整且自如地參與,輕松解鎖人工智能全流程實訓(xùn),讓你深度體驗AI技術(shù)的魅力 。 四、九門課程全覆蓋,滿足多元學(xué)習(xí)需求 對于高校教學(xué)或者技術(shù)
    發(fā)表于 08-07 14:23

    超小型Neuton機器學(xué)習(xí)模型, 在任何系統(tǒng)級芯片(SoC)上解鎖邊緣人工智能應(yīng)用.

    Neuton 是一家邊緣AI 公司,致力于讓機器 學(xué)習(xí)模型更易于使用。它創(chuàng)建的模型比競爭對手的框架小10 倍,速度也快10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文中,我們將介紹
    發(fā)表于 07-31 11:38

    最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會發(fā)展的當(dāng)下,無論是探索未來職業(yè)方向,還是更新技術(shù)儲備,掌握大模型知識都已成為新時代的必修課。從職場上輔助工作的智能助手,到課堂用于學(xué)術(shù)研究的智能工具,大模型正在工作生活
    發(fā)表于 07-04 11:10

    如何有效地管理人工智能數(shù)據(jù)中心的電源

    作者:Kenton Williston 投稿人:DigiKey 北美編輯 人工智能 (AI) 和機器學(xué)習(xí) (ML) 的興起提出了前所未有的電力需求。下一代數(shù)據(jù)中心在電源管理、效率和可靠
    的頭像 發(fā)表于 05-25 11:30 ?1131次閱讀
    如何有效地管理<b class='flag-5'>人工智能</b><b class='flag-5'>數(shù)據(jù)中心</b>的電源