91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

進一步了解大規(guī)模部署AI的更優(yōu)解:Habana? Gaudi?2

英特爾中國 ? 來源:未知 ? 2023-07-21 18:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大語言模型(Large Language Model,下文簡稱為:LLM)的發(fā)展如火如荼。以ChatGPT為代表的LLM可執(zhí)行更為廣泛的任務(wù)并具有更高的智能化程度,刷新了人們對AI技術(shù)的新認知。當(dāng)然,LLM規(guī)模龐大,通常包含數(shù)十億參數(shù),需要海量的訓(xùn)練數(shù)據(jù)與強大算力支撐才能達到預(yù)期的效果。

其實,無論LLM還是其他應(yīng)用越來越廣泛的深度學(xué)習(xí)模型,從模型訓(xùn)練到推理應(yīng)用,都需要高性能、可擴展的基礎(chǔ)設(shè)施作為底層支撐,這往往也意味著高昂的成本。近日,英特爾發(fā)布的最新Habana Gaudi2,專為訓(xùn)練大語言模型而構(gòu)建,并為數(shù)據(jù)中心大規(guī)模擴展而設(shè)計,同時為深度學(xué)習(xí)訓(xùn)練和推理工作負載提供極具性價比的解決方案。

在6月公布的MLCommonsMLPerf基準測中,Gaudi2在GPT-3模型、計算機視覺模型ResNet-50(使用8個加速器)、Unet3D(使用8個加速器),以及自然語言處理模型BERT(使用8個和64個加速器)上均取得了優(yōu)異的訓(xùn)練結(jié)果。與市場上其他面向大規(guī)模生成式AI和大語言模型的產(chǎn)品相比,Gaudi2擁有卓越的性能與領(lǐng)先的性價比優(yōu)勢,能夠幫助用戶提升運營效率的同時,降低運營成本。

Gaudi2實現(xiàn)性能、可擴展性和能效飛躍

第二代Gaudi AI深度學(xué)習(xí)夾層卡 HL-225B 專為數(shù)據(jù)中心實現(xiàn)大規(guī)模橫向擴展而設(shè)計。其AI處理器基于第一代 Gaudi的高效架構(gòu)打造而成,目前采用7納米制程工藝,在性能、可擴展性和能效方面均實現(xiàn)了飛躍。

夾層卡搭載的HL-2080 處理器擁有24個完全可編程的第四代張量處理器核心(TPC)。這些核心原生設(shè)計便能夠為廣泛的深度學(xué)習(xí)工作負載加速,同時還賦予用戶按需進行優(yōu)化和創(chuàng)新的靈活性。此外,它還集成了96GB HBM2e內(nèi)存和48MB SRAM,支持600瓦夾層卡級熱設(shè)計功耗(TDP)。

Gaudi2 處理器具備出色的2.1 Tbps 網(wǎng)絡(luò)容量可擴展性,原生集成21個100 Gbps RoCE v2 RDMA端口,可通過直接路由實現(xiàn)Guadi 處理器間通信。Gaudi2處理器集成了專用媒體處理器,用于圖像和視頻解碼及預(yù)處理。

此外,Gaudi2 深度學(xué)習(xí)夾層卡符合OCP OAM 1.1(開放計算平臺之開放加速器模塊)等多種規(guī)范,可以為客戶帶來系統(tǒng)設(shè)計的靈活性。

wKgZomToEiOAHhCbAANfFZZIFfw645.pngwKgZomToEiOAKQBNAADoVCpclaA981.png

圖:Gaudi2 深度學(xué)習(xí)夾層卡 HL-225B 主要參數(shù)

多維度技術(shù)創(chuàng)新,實現(xiàn)卓越性價比

Gaudi2 處理器是一款高性能、完全可編程的AI處理器,它整合了多項技術(shù)創(chuàng)新,從計算架構(gòu)、內(nèi)存和擴展能力三個維度打造全新的AI 專用處理器。同時,它具有高內(nèi)存帶寬/容量和基于標(biāo)準以太網(wǎng)技術(shù)的縱向擴展能力,支持使用外接網(wǎng)卡通過PCIe接口實現(xiàn)橫向擴展,滿足多節(jié)點集群需要。

[ 性能更高的計算架構(gòu) ]

Gaudi2 采用經(jīng)過驗證的高性能深度學(xué)習(xí)AI訓(xùn)練處理器架構(gòu),利用Habana完全可編程的TPC和GEMM引擎,支持面向AI的高級數(shù)據(jù)類型:FP8、BF16、FP16、TF32和FP32。TPC核心旨在支持深度學(xué)習(xí)訓(xùn)練和推理工作負載。TPC是一款VLIW SIMD矢量處理器,其指令集和郵件經(jīng)過定制,可高效處理上述工作負載。

[ 更先進的內(nèi)存技術(shù) ]

內(nèi)存帶寬和容量與計算能力同樣重要。Gaudi2 采用先進的HBM內(nèi)存技術(shù),內(nèi)存容量高達96GB,內(nèi)存帶寬高達2.4TB/s。Gaudi先進的HBM控制器已針對隨機訪問和線性訪問進行了優(yōu)化,在各種訪問模式下均可提供高內(nèi)存帶寬。

[ 通過集成RDMA實現(xiàn)縱向擴展 ]

Gaudi AI訓(xùn)練處理器芯片上集成了RDMA(RoCEv2),可與成熟且廣泛使用的以太網(wǎng)進行連接。HL-2080芯片互連技術(shù)基于42對56 Gbps Tx/Rx PAM4 SerDes(配置為21個100 GbE端口)發(fā)揮作用。

與廣泛的軟件生態(tài)一起,
幫助簡化模型的開發(fā)和遷移

為支持客戶輕松構(gòu)建模型,或?qū)?dāng)前基于GPU的模型業(yè)務(wù)和系統(tǒng)遷移到基于全新Gaudi2服務(wù)器,并幫助保護軟件開發(fā)投入,SynapseAI軟件套件針對Gaudi平臺深度學(xué)習(xí)業(yè)務(wù)進行了優(yōu)化,旨在與廣泛的軟件生態(tài)系統(tǒng)一起,幫助簡化模型的開發(fā)和遷移。

SynapseAI 軟件套件旨在提高 Habana AI處理器的易用性和支持高性能訓(xùn)練,能夠?qū)?a href="http://www.makelele.cn/tags/神經(jīng)網(wǎng)絡(luò)/" target="_blank">神經(jīng)網(wǎng)絡(luò)拓撲高效映射到Gaudi系列硬件上。該軟件套件包括Habana 的圖編譯器和運行時、經(jīng)過性能優(yōu)化的TPC算子庫、固件和驅(qū)動程序以及開放工具,例如用于自定義核心開發(fā)的TPC 編程工具套件和SynapseAI 圖編譯器。SynapseAI與TensorFlow和PyTorch等主流框架集成,并已針對基于Gaudi AI 處理器家族產(chǎn)品的訓(xùn)練進行了優(yōu)化。數(shù)據(jù)科學(xué)家和開發(fā)人員在這里可以找到開始基于Gaudi AI 處理器進行訓(xùn)練所需的各類信息資料,包括教程、參考模型、操作指南、文檔等。

wKgZomToEiSACjlXAAGSCOwikSM850.jpg

擴展AI產(chǎn)品陣容,加速AI落地

Gaudi2不僅以高性能為AI模型的訓(xùn)練與推理加速,其高擴展性和性價比,也將加速AI應(yīng)用落地的進程。多年來,借助強大的軟硬件基礎(chǔ),英特爾基于全面的AI產(chǎn)品和解決方案,與廣泛合作伙伴一同構(gòu)建開放生態(tài),為越來越多不同需求和場景的AI應(yīng)用落地提供更多元的解決方案,持續(xù)引領(lǐng)產(chǎn)品技術(shù)發(fā)展,進一步加速大規(guī)模深度學(xué)習(xí)部署,助力中國本地AI市場發(fā)展。

wKgZomToEiSAIdlVAAJPLzW-Bdw902.jpg

想看更多“芯”資訊


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10302

    瀏覽量

    180562
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11285

    瀏覽量

    225145

原文標(biāo)題:進一步了解大規(guī)模部署AI的更優(yōu)解:Habana? Gaudi?2

文章出處:【微信號:英特爾中國,微信公眾號:英特爾中國】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    偉創(chuàng)力與AMD進一步深化戰(zhàn)略合作

    近日,偉創(chuàng)力宣布與全球領(lǐng)先的高性能與自適應(yīng)計算芯片公司 AMD(超威半導(dǎo)體) 進一步深化戰(zhàn)略合作,在美國本土制造 AMD Instinct 平臺,加速先進 AI 基礎(chǔ)設(shè)施落地。作為合作的首個成果
    的頭像 發(fā)表于 03-11 15:11 ?84次閱讀

    百度蘿卜快跑與Uber進一步深化戰(zhàn)略合作

    今天,蘿卜快跑與全球最大的移動出行服務(wù)平臺Uber共同宣布,雙方將進一步深化戰(zhàn)略合作,計劃于2026年第季度在阿聯(lián)酋迪拜正式推出全無人駕駛出行服務(wù),這也是迪拜首次迎來全無人駕駛出行服務(wù)。
    的頭像 發(fā)表于 02-11 16:50 ?1168次閱讀

    天合儲能與Lightshift Energy進一步擴大戰(zhàn)略合作

    近日,天合儲能宣布將與美國領(lǐng)先的儲能開發(fā)、建設(shè)及運營方 Lightshift Energy(以下簡稱 “Lightshift”) 進一步擴大戰(zhàn)略合作。在既有合作基礎(chǔ)上,雙方歷史累計及在建、將建項目合計,保障聯(lián)合交付儲能項目規(guī)模超過 1GWh,持續(xù)支持美國多個州的電網(wǎng)建設(shè)與
    的頭像 發(fā)表于 12-22 15:14 ?389次閱讀

    晶科儲能進一步擴大英國儲能項目布局

    晶科儲能近日宣布進一步擴大其在英國的項目布局,新增加套140MWh的電網(wǎng)級儲能系統(tǒng)。首期的140MWh項目正在交付過程中,兩期項目合計容量達到280MWh,成為英國規(guī)模最大的電池儲能項目之
    的頭像 發(fā)表于 12-09 15:19 ?729次閱讀

    BlackBerry QNX與芯馳科技進一步深化戰(zhàn)略合作

    BlackBerry有限公司(紐約證券交易所代碼:BB;多倫多證券交易所代碼:BB)旗下業(yè)務(wù)部門QNX與中國創(chuàng)新汽車半導(dǎo)體供應(yīng)商芯馳科技今日宣布,雙方將進一步深化合作,基于芯馳科技最新代X10
    的頭像 發(fā)表于 12-04 16:42 ?1809次閱讀

    BlackBerry QNX與眾森軟件進一步深化戰(zhàn)略合作

    今日,深圳市眾森軟件有限公司(以下簡稱"眾森軟件")正式宣布與全球領(lǐng)先的實時操作系統(tǒng)與嵌入式軟件供應(yīng)商 QNX(BlackBerry有限公司旗下部門QNX)進一步深化戰(zhàn)略合作。此次合作將進一步推動下代智能網(wǎng)聯(lián)汽車與智慧出行解決
    的頭像 發(fā)表于 12-04 16:40 ?1927次閱讀

    納微半導(dǎo)體與文曄科技進一步強化戰(zhàn)略合作

    ——文曄科技股份有限公司(臺股代碼:3036)今日宣布雙方將進一步強化戰(zhàn)略合作,共同為亞洲市場提供更強大的氮化鎵與碳化硅功率器件技術(shù)支持與供應(yīng)鏈服務(wù)。
    的頭像 發(fā)表于 12-04 15:13 ?1467次閱讀

    上汽奧迪與創(chuàng)維汽車智能合作進一步深化升級

    近日,創(chuàng)維汽車智能迎來重要突破:上汽奧迪客戶將當(dāng)前公司開發(fā)的顯示屏項目沿用至上汽奧迪其他主力車型。這決定不僅體現(xiàn)了客戶對創(chuàng)維汽車智能技術(shù)實力與服務(wù)品質(zhì)的高度認可,更標(biāo)志著雙方合作進一步深化升級。
    的頭像 發(fā)表于 11-25 10:32 ?744次閱讀

    美國 | FCC即將通過新規(guī),進一步封堵華為、海康威視

    FCC即將通過新規(guī),進一步封堵華為、海康威視2025年10月7日,美國聯(lián)邦通信委員會(FCC)主席宣布,F(xiàn)CC委員會即將投票表決項新規(guī),旨在填補現(xiàn)有法規(guī)中可能被利用的兩大漏洞,以阻止存在“風(fēng)險
    的頭像 發(fā)表于 10-13 18:11 ?981次閱讀
    美國 | FCC即將通過新規(guī),<b class='flag-5'>進一步</b>封堵華為、??低? />    </a>
</div>                              <div   id=

    云知聲與頭部財產(chǎn)保險公司進一步擴大合作

    近日,云知聲智能科技股份有限公司(以下簡稱“云知聲”,股票代碼:9678.HK)與某頭部財產(chǎn)保險公司(以下簡稱“該財險公司”)進一步擴大合作,雙方正式簽署協(xié)議,將業(yè)務(wù)從智能醫(yī)療審核延伸至該財險公司關(guān)注的傷殘等級、三期鑒定等更多維度的車險核賠風(fēng)控業(yè)務(wù),標(biāo)志著雙方合作進入規(guī)模
    的頭像 發(fā)表于 09-10 15:43 ?865次閱讀

    使用Ansible實現(xiàn)大規(guī)模集群自動化部署

    當(dāng)你面對1000+服務(wù)器需要部署時,你還在臺臺手工操作嗎?本文將揭秘如何用Ansible實現(xiàn)大規(guī)模集群的自動化部署,讓運維效率提升10倍!
    的頭像 發(fā)表于 08-27 14:41 ?828次閱讀

    蔚來進一步拓展其全球業(yè)務(wù)

    8月18日,蔚來公司宣布將于2025年至2026年期間陸續(xù)進入新加坡、烏茲別克斯坦和哥斯達黎加三個市場,進一步拓展其全球業(yè)務(wù),為當(dāng)?shù)赜脩魩韯?chuàng)新、可持續(xù)、高品質(zhì)的智能電動出行體驗。
    的頭像 發(fā)表于 08-20 17:00 ?1350次閱讀

    軟通動力與中國聯(lián)通合作關(guān)系進一步深化

    近日,軟通動力成功中標(biāo)聯(lián)通(廣東)產(chǎn)業(yè)互聯(lián)網(wǎng)有限公司2025年軟件技術(shù)開發(fā)集中采購項目,中標(biāo)份額位列榜首。這突破性成果,不僅彰顯了軟通動力在數(shù)字技術(shù)服務(wù)領(lǐng)域的綜合實力,也標(biāo)志著其與中國聯(lián)通合作關(guān)系的進一步深化。
    的頭像 發(fā)表于 07-01 09:18 ?1181次閱讀

    晶圓級封裝:連接密度提升的關(guān)鍵一步

    了解晶圓級封裝如何進一步提高芯片的連接密度,為后續(xù)技術(shù)發(fā)展奠定基礎(chǔ)。
    的頭像 發(fā)表于 06-27 16:51 ?762次閱讀

    ST EDGE AI云服務(wù)最后一步無法下載工程是怎么回事?

    ST EDGE AI云服務(wù)我選擇使用ST提供的模型,使用cube ai 9.0.0,選擇STM32板卡。之后就按照文檔一步一步操作,基準測試也能運行的到結(jié)果(說明云端是生成工程并編譯下
    發(fā)表于 03-13 08:17