91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

電子發(fā)燒友App

硬聲App

掃碼添加小助手

加入工程師交流群

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>電子資料>新型的分布式并行稠密矩陣乘算法

新型的分布式并行稠密矩陣乘算法

2021-06-01 | pdf | 4.84 MB | 次下載 | 免費(fèi)

資料介紹

  并行矩陣乘法是線性代數(shù)中最重要的基本運(yùn)算之一,同時(shí)也是許多科學(xué)應(yīng)用的基石。隨著高性能計(jì)算(HPC)向E級(jí)計(jì)算發(fā)展,并行矩陣乘法的通信開(kāi)銷所占比重越來(lái)越大。如何降低并行矩陣乘法的通信開(kāi)銷,提高并行矩陣乘的可擴(kuò)展性是當(dāng)前研究的熱點(diǎn)之一。本文提出一種新型的分布式并行稠密矩陣乘算法,即2.5D版本的PUMMA( Parallel Universal matrix Multiplication Algorithm)算法,該算法是通過(guò)將初始的進(jìn)程分成c組,利用計(jì)算節(jié)點(diǎn)的額外內(nèi)存,在每個(gè)進(jìn)程組上同時(shí)存儲(chǔ)矩陣A、B和執(zhí)行1/c的 PUMMA算法,最后通過(guò)規(guī)約操作來(lái)得到矩陣乘的最終結(jié)果。本文基于 BLACS( Basic Linear Algebra Communication Subprograms)通信庫(kù)實(shí)現(xiàn)了一種從2D到2.5D的新型數(shù)據(jù)重分配算法,與 PUMMA算法相結(jié)合,最終得到2.5 D PUMMA算法,可直接替換 PDGEM( Parallel double- precision General Matrix-matrix Multiplication),具有良好的可移植性。與國(guó)際標(biāo)準(zhǔn)算法庫(kù) ScalaPACK( Scalable Linear algebra Package)中的 PDGEMM等經(jīng)典D算法相比,本文算法縮減了通信次數(shù),提高了數(shù)據(jù)局部性,具有更好的可擴(kuò)展性。在進(jìn)程數(shù)較多時(shí),例如4096進(jìn)程時(shí),系統(tǒng)測(cè)試表明相對(duì) PDGEMM的加速比可達(dá)到2.20~2.93.進(jìn)一步地,本文將2.5 D PUMMA算法應(yīng)用于加速計(jì)算對(duì)稱三對(duì)角矩陣的特征值分解,其加速比可達(dá)到1.2以上本文通過(guò)大量數(shù)值算例分析了2.5DMMA算法的性能,并給出了實(shí)用性建議和總結(jié)了未來(lái)的工作。

算法 矩陣 分布式
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評(píng)論

查看更多

下載排行

本周

  1. 1新一代網(wǎng)絡(luò)可視化(NPB 2.0)
  2. 3.40 MB  |  1次下載  |  免費(fèi)
  3. 2冷柜-電氣控制系統(tǒng)講解
  4. 13.68 MB   |  1次下載  |  10 積分
  5. 3MDD品牌三極管MMBT3906數(shù)據(jù)手冊(cè)
  6. 2.33 MB  |  次下載  |  免費(fèi)
  7. 4MDD品牌三極管S9012數(shù)據(jù)手冊(cè)
  8. 2.62 MB  |  次下載  |  免費(fèi)
  9. 5LAT1218 如何選擇和設(shè)置外部晶體適配 BlueNRG-X
  10. 0.60 MB   |  次下載  |  3 積分
  11. 6LAT1216 Blue NRG-1/2 系列芯片 Flash 操作與 BLE 事件的互斥處理
  12. 0.89 MB   |  次下載  |  3 積分
  13. 7收音環(huán)繞擴(kuò)音機(jī) AVR-1507手冊(cè)
  14. 2.50 MB   |  次下載  |  免費(fèi)
  15. 8MS1000TA 超聲波測(cè)量模擬前端芯片技術(shù)手冊(cè)
  16. 0.60 MB   |  次下載  |  免費(fèi)

本月

  1. 1愛(ài)華AIWA HS-J202維修手冊(cè)
  2. 3.34 MB   |  37次下載  |  免費(fèi)
  3. 2PC5502負(fù)載均流控制電路數(shù)據(jù)手冊(cè)
  4. 1.63 MB   |  23次下載  |  免費(fèi)
  5. 3NB-IoT芯片廠商的資料說(shuō)明
  6. 0.31 MB   |  22次下載  |  1 積分
  7. 4UWB653Pro USB口測(cè)距通信定位模塊規(guī)格書(shū)
  8. 838.47 KB  |  5次下載  |  免費(fèi)
  9. 5蘇泊爾DCL6907(即CHK-S007)單芯片電磁爐原理圖資料
  10. 0.04 MB   |  4次下載  |  1 積分
  11. 6蘇泊爾DCL6909(即CHK-S009)單芯片電磁爐原理圖資料
  12. 0.08 MB   |  2次下載  |  1 積分
  13. 7100W準(zhǔn)諧振反激式恒流電源電路圖資料
  14. 0.09 MB   |  2次下載  |  1 積分
  15. 8FS8025B USB的PD和OC快充協(xié)議電壓誘騙控制器IC技術(shù)手冊(cè)
  16. 1.81 MB   |  1次下載  |  免費(fèi)

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935137次下載  |  10 積分
  3. 2開(kāi)源硬件-PMP21529.1-4 開(kāi)關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
  4. 1.48MB  |  420064次下載  |  10 積分
  5. 3Altium DXP2002下載入口
  6. 未知  |  233089次下載  |  10 積分
  7. 4電路仿真軟件multisim 10.0免費(fèi)下載
  8. 340992  |  191439次下載  |  10 積分
  9. 5十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
  10. 158M  |  183353次下載  |  10 積分
  11. 6labview8.5下載
  12. 未知  |  81602次下載  |  10 積分
  13. 7Keil工具M(jìn)DK-Arm免費(fèi)下載
  14. 0.02 MB  |  73822次下載  |  10 積分
  15. 8LabVIEW 8.6下載
  16. 未知  |  65991次下載  |  10 積分