91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Fugaku超級計算機程序已實現(xiàn)100倍的速度提升

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 作者:NVIDIA英偉達企業(yè)解 ? 2021-12-28 09:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在不到18個月的時間里,密歇根大學(xué)的一個團隊采用GPU,為一個基于復(fù)雜數(shù)學(xué)的程序?qū)崿F(xiàn)了20倍的提速。該程序為量子科學(xué)奠定了基礎(chǔ)。

Vikram Gavini 的實驗室以創(chuàng)紀(jì)錄的速度,跨越了微觀世界的一座重要里程碑。

這支由三人組成的密歇根大學(xué)團隊創(chuàng)建了一個使用復(fù)雜的數(shù)學(xué)來深入觀察原子世界的程序。該程序?qū)⑼苿釉S多科學(xué)領(lǐng)域的發(fā)展,以及多重領(lǐng)域的設(shè)計工作——從更輕的汽車到更高效的藥物。

憑借 GPU ,該團隊開放源碼庫中的代碼在短短18個月內(nèi)實現(xiàn)了20倍速度提升。

通往Summit的旅程

2018年年中,當(dāng)該團隊正準(zhǔn)備發(fā)布一個在 CPU 上運行的代碼版本時,他們收到了橡樹嶺國家實驗室 GPU 黑客馬拉松的邀請。全球最快的超級計算機之一—— Summit 就位于該實驗室。

機械工程和材料科學(xué)教授 Gavini 表示:“我們當(dāng)時的想法是看看我們能實現(xiàn)什么?!?/p>

該實驗室的博士后 Sambit Das 參加了這場為期五天的活動。他認(rèn)為:“我們很快意識到我們的代碼可以充分發(fā)揮GPU大規(guī)模并行處理的能力。”

在活動結(jié)束前, Das 和另一位實驗室成員 Phani Motamarri 將代碼轉(zhuǎn)移到 CUDA 及其庫中,實現(xiàn)了5倍速度提升。這也讓他們意識到,未來能實現(xiàn)的還有更多。

6個月內(nèi)實現(xiàn)從5倍到20倍的速度提升

在接下來的幾個月里,該實驗室繼續(xù)對該程序進行調(diào)優(yōu),使其能夠?qū)?萬個鎂原子中的10萬個電子進行分析。到2019年初,該程序已經(jīng)可以在 Summit 上運行。

隨著 Summit 的節(jié)點數(shù)量不斷增加,該實驗室采用迭代法,在節(jié)點上運行越來越多的代碼。截止4月,該實驗室使用了該系統(tǒng)27,000個 GPU 中的大部分,實現(xiàn)了近 46 petaflops 的性能,達到了之前的20倍。

對于一個基于密度泛函理論(DFT)的程序來說,這是一個前所未有的結(jié)果。密度函數(shù)理論是一項解釋亞原子粒子之間量子相互作用的復(fù)雜數(shù)學(xué)理論。

適用于高難度算法的分布式計算

DFT 算法的復(fù)雜性和基礎(chǔ)性使其目前占用了所有公共研究計算機四分之一的時間。在被引用次數(shù)最多的100篇科學(xué)論文中,有12篇是 DFT 為主題的。該計算還被用來分析從天體物理學(xué)到 DNA 鏈的一切。

最初,根據(jù)該實驗室的報告,該程序使用了 Summit 的頂尖理論性能的近30%,這是一個異常高的效率。相比之下,大多數(shù)其他 DFT 代碼除了能夠使用數(shù)個處理器之外,很難實現(xiàn)進一步的擴展,因此就連效率報告都沒有。

Gavini 表示:“能實現(xiàn)這一前所未有的效率令我們感到非常高興?!?/p>

聲名鵲起

2019年底,該團隊被提名為戈登貝爾獎的入圍者。這是該實驗室首次參加這一“高性能計算領(lǐng)域諾貝爾獎”的評選。

Gavini 表示:“這為我們的實驗室和大學(xué)帶來了很高的知名度,我認(rèn)為這次努力還只是一個開始。”

事實上,自評選以來,實驗室在 Summit 上,將代碼的性能提升到了 64 petaflops ,效率亦達到38%。并且該實驗室已經(jīng)在探索在其他系統(tǒng)和應(yīng)用上的使用。

尋求更多的應(yīng)用和更高的性能

最初,這項工作被用于分析鎂。這種比當(dāng)今汽車和飛機使用的鋼和鋁輕得多的金屬有望大幅節(jié)省燃料。去年,該實驗室與另一團隊合作,研究電子在 DNA 中的移動方式,這項工作可以幫助其他研究者研發(fā)出更有效的藥物。

接下來重要的一步是在 Perlmutter 上運行代碼。這是一臺使用最新 NVIDIA A100 Tensor Core GPU 的超級計算機。根據(jù)Das的報告,基于A100 GPU對TensorFloat-32的支持,與 Summit GPU 相比,這臺計算機目前已經(jīng)實現(xiàn)了4倍速度提升。TensorFloat-32 是一種既能提供快速結(jié)果,又能實現(xiàn)高精度的混合精度格式。

與其他 DFT 代碼相比,該實驗室程序已實現(xiàn)100倍的速度提升,但 Gavini 并沒有就此止步。他已經(jīng)在考慮在 Fugaku 上測試它。Fugaku 是基于 Arm 系統(tǒng)的全球最快的超級計算機。

他表示:“眼下的收獲總會令人欣喜,但‘路漫漫其修遠(yuǎn)兮,吾將上下而求索’。這次的成果也是我們新征程的開始?!?/p>

原文標(biāo)題:借助數(shù)學(xué)的力量:密歇根團隊破解亞原子世界的密碼

文章出處:【微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

審核編輯:彭菁
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5200

    瀏覽量

    135538
  • 計算機
    +關(guān)注

    關(guān)注

    19

    文章

    7810

    瀏覽量

    93245
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4970

    瀏覽量

    74024

原文標(biāo)題:借助數(shù)學(xué)的力量:密歇根團隊破解亞原子世界的密碼

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    使用NVIDIA技術(shù)驅(qū)動的超級計算機助力開放科學(xué)研究

    五個備受矚目的 HPC 獎決賽入圍項目憑借 Alps、JUPITER 和 Perlmutter 超級計算機的支持在氣候建模、流體模擬等領(lǐng)域取得了重大突破。
    的頭像 發(fā)表于 11-25 11:17 ?837次閱讀

    快450000000!超導(dǎo)量子計算機“天衍-287”建成

    平臺誕生,處理特定問題的速度較當(dāng)前最快超級計算機快4.5億,成為全球量子計算實用化進程中的關(guān)鍵里程碑。 ? ? “天衍-287”的核心競爭
    的頭像 發(fā)表于 11-18 08:40 ?8660次閱讀
    快450000000<b class='flag-5'>倍</b>!超導(dǎo)量子<b class='flag-5'>計算機</b>“天衍-287”建成

    谷歌芯片實現(xiàn)量子計算新突破,比超算快13000

    在特定任務(wù)上的運行速度比傳統(tǒng)超級計算機快13000,并且這種算法可以在類似平臺上得到重現(xiàn)。 ? 量子比特極易受到環(huán)境干擾,導(dǎo)致計算錯誤,這
    的頭像 發(fā)表于 10-27 06:51 ?9722次閱讀

    今日看點:谷歌芯片實現(xiàn)量子計算比經(jīng)典超算快13000;NFC 技術(shù)突破:讀取距離從 5 毫米提升至 20 毫米

    性能甚至超越了最快的經(jīng)典超級計算機,速度快 13000 。 ? Willow是谷歌于去年12月宣布推出的量子芯片。當(dāng)時,Willow量子芯片在5分鐘內(nèi)完成了一項傳統(tǒng)
    發(fā)表于 10-23 10:20 ?1573次閱讀

    NVIDIA助力AI超級計算機Isambard-AI投入使用

    英國布里斯托大學(xué)的超級計算機 Isambard-AI 采用 NVIDIA Grace Hopper 超級芯片,其 AI 算力達到了 21 ExaFLOPS,不僅是英國最快的系統(tǒng),同時也是全球能效最高的系統(tǒng)之一。
    的頭像 發(fā)表于 07-28 15:07 ?1264次閱讀

    自動化計算機的功能與用途

    工業(yè)自動化是指利用自動化計算機來控制工業(yè)環(huán)境中的流程、機器人和機械,以制造產(chǎn)品或其部件。工業(yè)自動化的目的是提高生產(chǎn)率、增加靈活性,并提升制造過程的質(zhì)量。工業(yè)自動化在汽車制造中體現(xiàn)得最為明顯,其中許多
    的頭像 發(fā)表于 07-15 16:32 ?756次閱讀
    自動化<b class='flag-5'>計算機</b>的功能與用途

    NVIDIA驅(qū)動的現(xiàn)代超級計算機如何突破速度極限并推動科學(xué)發(fā)展

    現(xiàn)代高性能計算不僅使得更快的計算成為可能,它正驅(qū)動著 AI 系統(tǒng)解鎖更多領(lǐng)域的科學(xué)突破。 高性能計算經(jīng)歷了多次迭代,每一次都源于對技術(shù)的創(chuàng)造性再利用。例如,早期的超級
    的頭像 發(fā)表于 06-26 19:39 ?1279次閱讀
    NVIDIA驅(qū)動的現(xiàn)代<b class='flag-5'>超級</b><b class='flag-5'>計算機</b>如何突破<b class='flag-5'>速度</b>極限并推動科學(xué)發(fā)展

    Blue Lion超級計算機將在NVIDIA Vera Rubin上運行

    德國萊布尼茨超算中心(LRZ)將迎來全新超級計算機 Blue Lion,其算力比該中心現(xiàn)有的 SuperMUC-NG 高性能計算機提升了約 30
    的頭像 發(fā)表于 06-12 15:39 ?1167次閱讀

    NVIDIA技術(shù)賦能歐洲最快超級計算機JUPITER

    NVIDIA 宣布,搭載 NVIDIA Grace Hopper 平臺的 JUPITER 超級計算機成為歐洲最快超級計算機,其運行 HPC 和 AI 工作負(fù)載的
    的頭像 發(fā)表于 06-12 15:33 ?1455次閱讀

    NVIDIA助力全球最大量子研究超級計算機

    NVIDIA 宣布將開設(shè)量子-AI 技術(shù)商業(yè)應(yīng)用全球研發(fā)中心(G-QuAT),該中心部署了全球最大量子計算研究專用超級計算機 ABCI-Q。
    的頭像 發(fā)表于 05-22 09:44 ?923次閱讀

    一文帶你了解工業(yè)計算機尺寸

    一項艱巨的任務(wù)。本博客將指導(dǎo)您了解關(guān)鍵的工業(yè)計算機尺寸、使用案例。關(guān)鍵工業(yè)計算機外形要素及其使用案例一、工業(yè)微型PC尺寸范圍:寬度:100毫米-180毫米深度:10
    的頭像 發(fā)表于 04-24 13:35 ?1065次閱讀
    一文帶你了解工業(yè)<b class='flag-5'>計算機</b>尺寸

    計算機網(wǎng)絡(luò)入門指南

    計算機網(wǎng)絡(luò)是指將地理位置不同且具有獨立功能的多臺計算機及其外部設(shè)備,通過通信線路連接起來,在網(wǎng)絡(luò)操作系統(tǒng)、網(wǎng)絡(luò)管理軟件及網(wǎng)絡(luò)通信協(xié)議的管理和協(xié)調(diào)下,實現(xiàn)資源共享和信息傳遞的計算機系統(tǒng)。
    的頭像 發(fā)表于 04-22 14:29 ?2286次閱讀
    <b class='flag-5'>計算機</b>網(wǎng)絡(luò)入門指南

    AWG全新DDS固件如何提升量子計算機的開發(fā)效率?

    凱澤斯勞滕理工大學(xué)通過引入先進的德思特任意波形發(fā)生器(AWG)新DDS固件選件,顯著加速了量子計算機的開發(fā)進程。德思特帶您了解AWG全新DDS固件如何提升量子計算機的開發(fā)效率。
    的頭像 發(fā)表于 03-21 16:50 ?781次閱讀
    AWG全新DDS固件如何<b class='flag-5'>提升</b>量子<b class='flag-5'>計算機</b>的開發(fā)效率?

    NVIDIA 宣布推出 DGX Spark 個人 AI 計算機

    臺式超級計算機由 NVIDIA Grace Blackwell 驅(qū)動,為開發(fā)者、研究人員和數(shù)據(jù)科學(xué)家提供加速 AI 功能;系統(tǒng)由頭部計算機制造商(包括華碩、Dell Technologies、HP
    發(fā)表于 03-19 09:59 ?796次閱讀
       NVIDIA 宣布推出 DGX Spark 個人 AI <b class='flag-5'>計算機</b>

    超級計算與 HPC 之間的界限日趨模糊

    本文由半導(dǎo)體產(chǎn)業(yè)縱橫(ID:ICVIEWS)編譯自semiengineering由于人工智能和分解而加速的性能改進正在推動計算前沿的重大變革。由于人工智能的普及,超級計算機和高性能計算機
    的頭像 發(fā)表于 03-17 10:33 ?1044次閱讀
    <b class='flag-5'>超級</b><b class='flag-5'>計算</b>與 HPC 之間的界限日趨模糊