91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Cygnus超算成為第一臺進入超算top500榜單的GPU、FPGA混合加速超級計算機

DPVg_AI_era ? 來源:lp ? 2019-04-21 09:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

異構超級計算機時代已經(jīng)到來。近日,日本筑波大學上線的Cygnus超算成為第一臺進入超算top500榜單的GPU、FPGA混合加速超級計算機。在如何讓CPU、GPU、FPGA多硬件協(xié)調、高效、同步提供算力上邁出了重要一步。

如果說“異構超級計算機”的時代已經(jīng)到來,那么本月早些時候在日本筑波大學上線的 CPU、GPU、FPGA混合硬件超算系統(tǒng)就是這個時代的首批探索者之一。

這臺超算名為Cygnus,由NEC制造,目前在日本筑波大計算科學中心(CCS)運行,由Intel Xeon CPU,Nvidia Tesla GPU和Intel Stratix 10 FPGA共同提供硬件支持。

Cygnus系統(tǒng)架構:所有80個Cygnus節(jié)點都配備了兩個Xeon“Skylake”黃金 CPU和四個Tesla V100 GPU,同時在32個節(jié)點中,還和GPU搭載了兩個Stratix 10 FPGA。48個CPU-GPU專用節(jié)點稱為“Deneb節(jié)點”(以最亮的Cygnus A星命名),而32個CPU-GPU-FPGA節(jié)點稱為Albireo節(jié)點(以Cygnus A雙星命名)。

FPGA型號為Bittware 520N PCIe卡,供應商為Nallatech,這些“重型”FPGA卡可以提供10 teraflops的單精度性能,以及四組DDR4內存。尤其是,該卡配備了四個100G光纖網(wǎng)絡端口,共提供400Gbps帶寬,可以通過自身結構直接與其他520N FPGA進行通信。在Cygnus中,可將8×8的2D環(huán)形網(wǎng)絡中的64個FPGA相互連接。Bittware包括一個板級支持包(BSP),可供OpenCL開發(fā)人員使用。

每個Cygnus節(jié)點的雙精度浮點性能為30 teraflops,其中28個節(jié)點算力由四個V100 GPU提供。由兩個Stratix 10器件在配備FPGA的節(jié)點上提供20個單精度teraflops。整機可提供算力為2.4 petaflop(64位浮點)或5.12 petaflop(32位浮點)算力。

目前,Cygnus正在取代該機構之前使用的COMA,COMA是一款由Intel Xeon CPU和Xeon Phi協(xié)處理器驅動的Cray CS300計算機集群。它于2014年組建,今年3月底退役,為Cygnus讓位。

Mellanox HDR InfiniBand負責Cygnus上的系統(tǒng)互連,與獨立的FPGA網(wǎng)絡一樣,系統(tǒng)設計人員確保了足夠的帶寬來進行節(jié)點間通信。每個節(jié)點使用四個100Gbps HDR通道,連接為全二分fat樹網(wǎng)絡。InfiniBand網(wǎng)絡還用于訪問托管在DataDirect Networks ES14KX設備上的2.5 PB Lustre文件系統(tǒng)。

盡管“雙加速硬件”的設定很新潮,但其實Cygnus并不是試驗機。其組建的主要用途是為宇宙學、粒子物理學、生命科學和人工智能等領域科學研究提供生產(chǎn)力。通過CPUGPUFPGA的組合,力求在實際科學研究中最有效地發(fā)揮這些硬件各自的計算優(yōu)勢。

具體來說,GPU負責提供粗粒度并行計算,主要擅長SIMD友好型計算,而FPGA提供細粒度并行計算,更適合應用于非SIMD算法。而對于氣候模擬,生物信息學、分子動力學、地球物理學和線性代數(shù)中使用的一些特定算法,F(xiàn)PGA已經(jīng)證明能夠實現(xiàn)比CPU、GPU更快、更高效的運算。不過,在科學上可以通過代碼同時高效利用這兩種架構。

Cygnus系統(tǒng)架構圖

Cygnus的目標應用之一是模擬早期宇宙,模擬光源的輻射傳輸。模擬過程是在一個套為ARGOT的代碼中實現(xiàn)的,其中名為“ART”(真實輻射傳輸)的光線追蹤算法是該模擬中的重要部分,ART部分更適合FPGA硬件平臺上的大規(guī)模運行。

不過,ARGOT的其他部分在GPU上運行更合適,因此利用“雙硬件加速”成為最佳解決方案。該應用程序在GPU和FPGA之間使用基于PCIe的直接存儲器訪問來實現(xiàn)協(xié)調,避免了使CPU受到影響而出現(xiàn)延遲。

ART實現(xiàn)是使用相對較高級別的OpenCL實現(xiàn)的,這表明其他開發(fā)人員也可以這樣做。Bittware方面表示,使用OpenCL實現(xiàn)的用戶與嚴格使用硬件描述語言(HDL)實現(xiàn)的用戶進行對比發(fā)現(xiàn),在許多情況下,OpenCL實現(xiàn)在性能方面與后者“足夠接近”。

過去幾年來,F(xiàn)PGA軟件開發(fā)的進展促使微軟、亞馬遜和百度等巨頭越來越廣泛地采用FPGA硬件,尤其是在機器學習和推理等應用上。

但是,在高性能計算平臺中,使用FPGA的設備更少。筑波大學的這臺Cygnus將是唯一一個進入超算TOP500榜單的采用FPGA加速的超級計算機。德國帕德博恩大學去年安裝了一臺使用FPGA的超算,Cray CS500超級計算機,配備了32塊Bittware 520N卡,不過該機沒有配備GPU。

還有一些其他FPGA式的HPC集群遍布世界各地,包括美國佛羅里達州的CHREC(現(xiàn)改稱SHREC)的Nova-G#系統(tǒng),英國Hartree中心的Maxeler HPC-X以及Catapult 1和TACC的HARP v2計算機集群。

未來是否會有更多更強大的異構超級計算機誕生?這不僅取決于使用者的需求,更多還要取決于硬件廠商和開發(fā)者是否繼續(xù)從上到下推動生態(tài)系統(tǒng)建設。

從Bittware的角度來看,關鍵的推動力一定是來自中間層面的,同時有賴于對高級語言和更成熟的開發(fā)工具更充分的支持。目前的好消息是,業(yè)界最大的兩家FPGA制造商——英特爾和賽林思都在為開發(fā)人員提供更好的工具,并將這些工具與下一代FPGA產(chǎn)品整合在一起。

從這一點上看,我們似乎可以對異構超算的未來保持一份謹慎的樂觀。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1661

    文章

    22434

    瀏覽量

    637153
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5213

    瀏覽量

    135621
  • 超級計算機
    +關注

    關注

    2

    文章

    482

    瀏覽量

    43406

原文標題:迎接“異構超算”新時代:日本Cygnus超算GPU和FPGA雙硬件加持,TOP500榜單只此一臺

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    AI驅動量子化學計算!4100萬核心國產(chǎn)取得世界級突破!

    電子發(fā)燒友網(wǎng)報道(文/梁浩斌)中國的高光時刻,是2016年到2017年期間,神威·太湖之光連續(xù)四次登頂全球超級計算機TOP
    的頭像 發(fā)表于 10-26 06:15 ?1w次閱讀

    上汽大眾第一臺EA211黃金增程器正式下線

    近日,上汽大眾第一臺EA211黃金增程器正式下線,并將率先搭載于ID. ERA 9X車型,新車將于3月底正式開啟預售。作為MQB平臺的核心動力基石之,EA211發(fā)動機家族自2011年誕生以來,全國累計保有量已突破2,000萬
    的頭像 發(fā)表于 03-03 16:32 ?567次閱讀

    邁向云端力巔峰:昆侖芯K200 AI加速卡全面解讀

    槽位設計,支持從計算機視覺到自然語言處理的混合精度計算。K200與邊緣側K100共享軟件生態(tài),實現(xiàn)云邊端力協(xié)同,為金融、政務等領域提供了高性能國產(chǎn)化
    的頭像 發(fā)表于 12-14 11:17 ?1988次閱讀
    邁向云端<b class='flag-5'>算</b>力巔峰:昆侖芯K200 AI<b class='flag-5'>加速</b>卡全面解讀

    深圳中國首個光量子計算機制造工廠落成

    據(jù)央視新聞報道;在24日;深圳南山區(qū)國內首個光量子計算機制造工廠正式進入小規(guī)模生產(chǎn)階段,據(jù)悉該工廠是隸屬于玻色量子;總面積約5000平方米,集研發(fā)、制造、測試于體,用于實現(xiàn)光量子計算機
    的頭像 發(fā)表于 11-25 17:17 ?2065次閱讀

    CCF HPC China 2025鄂爾多斯完美謝幕,共譜新篇章

    全球三大盛會之,本屆大會延續(xù) “學術引領、產(chǎn)業(yè)融合” 特色,以學術研討的深度突破為核心,聯(lián)動全球力產(chǎn)業(yè)生態(tài)視野,交出了份兼具學術高
    的頭像 發(fā)表于 08-21 13:06 ?531次閱讀
    CCF HPC China 2025鄂爾多斯完美謝幕,共譜<b class='flag-5'>超</b><b class='flag-5'>算</b>新篇章

    能發(fā)布節(jié)點服務器,128顆BM1690芯片組成

    的BM1690芯片組成的128顆芯片節(jié)點,每層有16顆芯片,共8層,統(tǒng)裝在個服務器里。 ? 節(jié)點是通過高速互聯(lián)技術,將大量服務器芯
    的頭像 發(fā)表于 08-03 07:33 ?7858次閱讀
    <b class='flag-5'>算</b>能發(fā)布<b class='flag-5'>超</b>節(jié)點服務器,128顆BM1690芯片組成

    力板卡:驅動智能時代的核心引擎

    在人工智能、大數(shù)據(jù)和云計算高速發(fā)展的今天,力已成為推動技術進步的關鍵資源。作為力的物理載體,力板卡(如
    的頭像 發(fā)表于 08-01 10:25 ?1502次閱讀

    NVIDIA助力AI超級計算機Isambard-AI投入使用

    英國布里斯托大學的超級計算機 Isambard-AI 采用 NVIDIA Grace Hopper 超級芯片,其 AI 力達到了 21 ExaFLOPS,不僅是英國最快的系統(tǒng),同時也
    的頭像 發(fā)表于 07-28 15:07 ?1290次閱讀

    NVIDIA驅動的現(xiàn)代超級計算機如何突破速度極限并推動科學發(fā)展

    ,研究人員用個人電腦構建了強大的集群,甚至改造游戲顯卡,把它們用于科學研究。 當今的高性能計算系統(tǒng)專為高速計算而設計,其中許多都采用了 NVIDIA 加速計算技術。在 ISC 2025
    的頭像 發(fā)表于 06-26 19:39 ?1295次閱讀
    NVIDIA驅動的現(xiàn)代<b class='flag-5'>超級</b><b class='flag-5'>計算機</b>如何突破速度極限并推動科學發(fā)展

    【「力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】+NVlink技術從應用到原理

    自家GPU 提出的多卡力互連技術,是早期為了應對深度學習對超高力需求而單卡力不足的局面的解決方案,當然這都是官方用來吹牛的話術。我自己在2019年左右
    發(fā)表于 06-18 19:31

    軟通智完成億級A輪融資,加速AI力產(chǎn)業(yè)布局

    北京 2025年6月18日 /美通社/ -- 近日,軟通動力旗下軟通智科技(廣東)集團有限公司(以下簡稱"軟通智")完成億級A輪融資,本輪融資由盛景嘉成創(chuàng)投領投,廣發(fā)信德、毅達資本等多家知名
    的頭像 發(fā)表于 06-18 15:37 ?602次閱讀

    Blue Lion超級計算機將在NVIDIA Vera Rubin上運行

    德國萊布尼茨中心(LRZ)將迎來全新超級計算機 Blue Lion,其力比該中心現(xiàn)有的 SuperMUC-NG 高性能
    的頭像 發(fā)表于 06-12 15:39 ?1187次閱讀

    NVIDIA技術賦能歐洲最快超級計算機JUPITER

    NVIDIA 宣布,搭載 NVIDIA Grace Hopper 平臺的 JUPITER 超級計算機成為歐洲最快超級計算機,其運行 HPC
    的頭像 發(fā)表于 06-12 15:33 ?1472次閱讀

    加速卡是什么東西?它真能在AI戰(zhàn)場上干掉GPU和TPU!

    隨著AI技術火得塌糊涂,大家都在談"大模型"、"AI加速"、"智能計算",可真到了落地環(huán)節(jié),力才是硬通貨。你有沒有發(fā)現(xiàn),現(xiàn)在越來越多的AI企業(yè)不光用
    的頭像 發(fā)表于 06-05 13:39 ?1707次閱讀
    智<b class='flag-5'>算</b><b class='flag-5'>加速</b>卡是什么東西?它真能在AI戰(zhàn)場上干掉<b class='flag-5'>GPU</b>和TPU!

    力領域常用名詞解釋

    、力評估指標以及力戰(zhàn)略概念?;A概念力(ComputingPower):是指計算機系統(tǒng)處理數(shù)據(jù)的能力。它通常用FLOPS(每秒浮點運算次數(shù))來衡量,表示
    的頭像 發(fā)表于 04-07 11:21 ?1619次閱讀
    <b class='flag-5'>算</b>力領域常用名詞解釋