91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

深度解析HBM內存技術

架構師技術聯(lián)盟 ? 來源:架構師技術聯(lián)盟 ? 2024-01-02 09:59 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

HBM作為基于3D堆棧工藝的高性能DRAM,打破內存帶寬及功耗瓶頸。HBM(High Bandwidth Memory)即高帶寬存儲器,通過使用先進封裝(如TSV硅通孔、微凸塊)將多個DRAM芯片進行堆疊,并與GPU一同進行封裝,形成大容量、高帶寬的DDR組合陣列。

HBM通過與處理器相同的“Interposer”中間介質層與計算芯片實現(xiàn)緊湊連接,一方面既節(jié)省了芯片面積,另一方面又顯著減少了數(shù)據(jù)傳輸時間;此外HBM采用TSV工藝進行3D堆疊,不僅顯著提升了帶寬,同時降低了功耗,實現(xiàn)了更高的集成度。

6c359f5a-a623-11ee-8b88-92fbcf53809c.png

HBM性能遠超GDDR,成為當前GPU存儲單元理想解決方案。GPU顯存一般采用GDDR或者HBM兩種方案,但HBM性能遠超GDDR。

根據(jù)AMD數(shù)據(jù),從顯存位寬來看,GDDR5為32-bit,HBM為其四倍,達到了1024-bit;從時鐘頻率來看,HBM為500MHz,遠遠小于GDDR5的1750MHz;從顯存帶寬來看,HBM的一個stack大于100GB/s,而GDDR5的一顆芯片才25GB/s,所以HBM的數(shù)據(jù)傳輸速率遠遠高于GDDR5。

從空間利用角度來看,HBM由于與GPU封裝在一塊,從而大幅度減少了顯卡PCB的空間,而GDDR5芯片面積為HBM芯片三倍,這意味著HBM能夠在更小的空間內,實現(xiàn)更大的容量。因此,HBM可以在實現(xiàn)高帶寬和高容量的同時節(jié)約芯片面積和功耗,被視為GPU存儲單元理想解決方案。

6c443ace-a623-11ee-8b88-92fbcf53809c.png

在高性能GPU需求推動下,HBM目前已經(jīng)成為AI服務器的搭載標配。AI大模型的興起催生了海量算力需求,而數(shù)據(jù)處理量和傳輸速率大幅提升使得AI服務器對芯片內存容量和傳輸帶寬提出更高要求。

HBM具備高帶寬、高容量、低延時和低功耗優(yōu)勢,目前已逐步成為AI服務器中GPU的搭載標配。英偉達推出的多款用于AI訓練的芯片A100、H100和H200,都采用了HBM顯存。

其中,A100和H100芯片搭載了40GB的HBM2e和80GB的HBM3顯存,最新的H200芯片搭載了速率更快、容量更高的HBM3e。AMD的MI300系列也都采用了HBM3技術,MI300A的容量與前一代相同為128GB,而更高端的MI300X則將容量提升至192GB,增長了50%,相當于H100容量的2.4倍。

HBM市場競爭激烈,HBM產(chǎn)品向低能耗、高帶寬、高容量加速迭代。從2016年第一代HBM1發(fā)布開始,HBM目前已經(jīng)迭代到第五代產(chǎn)品——HBM3e,縱觀五代HBM產(chǎn)品性能變化,可以發(fā)現(xiàn)HBM在帶寬、I/O速率、容量、工藝節(jié)點等方面取得較大突破,其中帶寬由初代的128GB/s迭代至HBM3e的1TB/s,I/O速率由1Gbps迭代至8Gbps,容量從1GB增至最高36GB,制造工藝則取得進一步突破,達到5nm級別。

最新一代HBM3e數(shù)據(jù)處理速度最高可達到1.15TB/s,HBM系列產(chǎn)品的更新迭代將在低能耗、高帶寬、高容量上持續(xù)發(fā)力,以高性能牽引AI技術進一步革新。

6c481310-a623-11ee-8b88-92fbcf53809c.png

HBM產(chǎn)品迭代助力AI芯片性能升級。當?shù)貢r間2023年11月13日,英偉達發(fā)布了首款搭載最先進存儲技術HBM3e的GPU芯片H200。H200作為首款搭載最先進存儲技術HBM3e的GPU,擁有141GB顯存容量和4.8TB/s顯存帶寬,與H100的80GB和3.35TB/s相比,顯存容量增加76%,顯存帶寬增加43%。

盡管GPU核心未升級,但H200憑借更大容量、更高帶寬的顯存,依舊在人工智能大模型計算方面實現(xiàn)顯著提升。根據(jù)英偉達官方數(shù)據(jù),在單卡性能方面,H200相比H100,在Llama2的130億參數(shù)訓練中速度提升40%,在GPT-3的1750億參數(shù)訓練中提升60%,在Llama2的700億參數(shù)訓練中提升90%;在降低能耗、減少成本方面,H200的TCO(總擁有成本)達到了新水平,最高可降低一半的能耗。

6c5d14d6-a623-11ee-8b88-92fbcf53809c.png

HBM市場目前被三大原廠占據(jù),其中海力士份額領先,占據(jù)HBM市場主導地位。據(jù)TrendForce數(shù)據(jù),三大原廠海力士、三星、美光2022年HBM市占率分別為50%、40%、10%。2023年年初至今,生成式AI市場呈爆發(fā)式增長,大模型參數(shù)量、預訓練數(shù)據(jù)量攀升,驅動AI服務器對高帶寬、高容量的HBM需求迅速增加。

作為最先開發(fā)出HBM芯片的海力士,在AIGC行業(yè)迅速發(fā)展背景下得以搶占先機,率先實現(xiàn)HBM3量產(chǎn),搶占市場份額。2023年下半年英偉達高性能GPUH100與AMD MI300將搭載海力士生產(chǎn)的HBM3,海力士市占率將進一步提升,預計2023年海力士、三星、美光市占率分別為53%、38%、9%。

6c60d3b4-a623-11ee-8b88-92fbcf53809c.png

6c79aed4-a623-11ee-8b88-92fbcf53809c.png

TSV技術通過垂直堆疊多個DRAM,能顯著提升存儲容量、帶寬并降低功耗。TSV(硅通孔)技術通過在芯片與芯片之間、晶圓和晶圓之間制作垂直導通,并通過銅、鎢、多晶硅等導電物質的填充,實現(xiàn)硅通孔的垂直電氣互聯(lián)。

作為實現(xiàn)3D先進封裝的關鍵技術之一,對比wire bond疊層封裝,TSV可以提供更高的互連密度和更短的數(shù)據(jù)傳輸路徑,因此具有更高的性能和傳輸速度。隨著摩爾定律放緩,芯片特征尺寸接近物理極限,半導體器件的微型化也越來越依賴于集成TSV的先進封裝。目前DRAM行業(yè)中,3D-TSVDRAM和HBM已經(jīng)成功生產(chǎn)TSV,克服了容量和帶寬的限制。

6c8cd018-a623-11ee-8b88-92fbcf53809c.png

TSV為HBM核心工藝,在HBM3D封裝成本中占比約30%。根據(jù)SAMSUNG,3D TSV工藝較傳統(tǒng)POP封裝形式節(jié)省了35%的封裝尺寸,降低了50%的功耗,并且對比帶來了8倍的帶寬提升。對4層存儲芯片和一層邏輯裸芯進行3D堆疊的成本進行分析,TSV形成和顯露的成本合計占比,對應99.5%和99%兩種鍵合良率的情形分別為30%和28%,超過了前/后道工藝的成本占比,是HBM3D封裝中成本占比最高的部分。

6c9ee028-a623-11ee-8b88-92fbcf53809c.png

TSV技術主要涉及深孔刻蝕、沉積、減薄拋光等關鍵工藝。TSV首先利用深反應離子刻蝕(DRIE)法制作通孔;然后使用化學氣相沉積(PECVD)的方法沉積制作介電層、使用物理氣相沉積(PVD)的方法沉積制作阻擋層和種子層;再選擇電鍍銅(Cu)進行填孔;最后使用化學和機械拋光(CMP)法去除多余的銅。另外,由于芯片堆疊集成的需要,在完成銅填充后,還需要晶圓減薄和鍵合。

6ca42ad8-a623-11ee-8b88-92fbcf53809c.png

HBM多層堆疊結構提升工序步驟,帶動封裝設備需求持續(xù)提升。(1)前道環(huán)節(jié):HBM需要通過TSV進行垂直方向連接,增加了TSV刻蝕設備需求,同時HBM中TSV、微凸點、硅中介層等工藝大量增加了前道工序,給前道檢、量測設備帶來增量;(2)后道環(huán)節(jié):HBM堆疊結構增多,要求晶圓厚度不斷降低,這意味著對減薄、鍵合等設備的需求提升;HBM多層堆疊結構依靠超薄晶圓和銅銅混合鍵合工藝增加了對臨時鍵合/解鍵合等設備的需求;(3)各層DRAM Die的保護材料也非常關鍵,對注塑或壓塑設備提出了較高要求。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 存儲器
    +關注

    關注

    39

    文章

    7739

    瀏覽量

    171697
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5196

    瀏覽量

    135504
  • 內存
    +關注

    關注

    9

    文章

    3211

    瀏覽量

    76377
  • 內存技術
    +關注

    關注

    0

    文章

    29

    瀏覽量

    10031
  • HBM
    HBM
    +關注

    關注

    2

    文章

    431

    瀏覽量

    15836

原文標題:HBM內存技術全面對比分析

文章出處:【微信號:架構師技術聯(lián)盟,微信公眾號:架構師技術聯(lián)盟】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    AUTOSAR架構深度解析 精選資料推薦

    AUTOSAR架構深度解析本文轉載于:AUTOSAR架構深度解析目錄AUTOSAR架構深度解析A
    發(fā)表于 07-28 07:40

    AUTOSAR架構深度解析 精選資料分享

    AUTOSAR架構深度解析本文轉載于:AUTOSAR架構深度解析AUTOSAR的分層式設計,用于支持完整的軟件和硬件模塊的獨立性(Independence),中間RTE(Runtime
    發(fā)表于 07-28 07:02

    C語言深度解析

    C語言深度解析,本資料來源于網(wǎng)絡,對C語言的學習有很大的幫助,有著較為深刻的解析,可能會對讀者有一定的幫助。
    發(fā)表于 09-28 07:00

    全面解構FuzionSC如何高速組裝HBM內存

    環(huán)球儀器旗下的FuzionSC半導體貼片機系列,能以表面貼裝速度實現(xiàn)半導體封裝的精準技術。FuzionSC貼片機之所以能精確高組裝HBM內存,皆因配備以下神器:
    的頭像 發(fā)表于 09-04 09:28 ?2842次閱讀
    全面解構FuzionSC如何高速組裝<b class='flag-5'>HBM</b><b class='flag-5'>內存</b>

    HBM內存:韓國人的游戲

    HBM技術之下,DRAM芯片從2D轉變?yōu)?D,可以在很小的物理空間里實現(xiàn)高容量、高帶寬、低延時與低功耗,因而HBM被業(yè)界視為新一代內存解決方案。
    的頭像 發(fā)表于 06-30 16:31 ?1928次閱讀
    <b class='flag-5'>HBM</b><b class='flag-5'>內存</b>:韓國人的游戲

    一文解析HBM技術原理及優(yōu)勢

    HBM技術是一種基于3D堆疊工藝的高性能DRAM,它可以為高性能計算、人工智能、數(shù)據(jù)中心等領域提供高帶寬、高容量、低延遲和低功耗的存儲解決方案。本文將介紹HBM技術的原理、優(yōu)勢、應用和
    發(fā)表于 11-09 12:32 ?2.1w次閱讀

    英偉達斥資預購HBM3內存,為H200及超級芯片儲備產(chǎn)能

    據(jù)最新傳聞,英偉達正在籌劃發(fā)布兩款搭載HBM3E內存的新品——包括141GB HBM3E的H200 GPU及GH200超級芯片,這也進一步說明了對于HBM
    的頭像 發(fā)表于 01-02 09:27 ?1538次閱讀

    什么是HBM3E內存?Rambus HBM3E/3內存控制器內核

    Rambus HBM3E/3 內存控制器內核針對高帶寬和低延遲進行了優(yōu)化,以緊湊的外形和高能效的封裝為人工智能訓練提供了最大的性能和靈活性。
    發(fā)表于 03-20 14:12 ?5007次閱讀
    什么是<b class='flag-5'>HBM</b>3E<b class='flag-5'>內存</b>?Rambus <b class='flag-5'>HBM</b>3E/3<b class='flag-5'>內存</b>控制器內核

    英偉達CEO贊譽三星HBM內存,計劃采購

     提及此前有人預測英偉達可能向三星購買HBM3或HBM3E等內存,黃仁勛在會上直接認可三星實力,稱其為“極具價值的公司”。他透露目前已對三星HBM
    的頭像 發(fā)表于 03-20 16:17 ?1542次閱讀

    SK海力士將采用臺積電7nm制程生產(chǎn)HBM4內存基片

    HBM內存基礎裸片即DRAM堆疊基座,兼具與處理器通信的控制功能。SK海力士近期與臺積電簽訂HBM內存合作協(xié)議,首要任務便是提升HBM基礎邏
    的頭像 發(fā)表于 04-23 16:41 ?1560次閱讀

    SK海力士加速HBM4E內存研發(fā),預計2026年面市

    HBM 制造商 Kim Gwi-wook 宣布,由于市場需求,SK海力士將提速研發(fā)進程,預計最快在 2026 年推出 HBM4E 內存在內存帶寬上比 HBM4 提升 1.4 倍。
    的頭像 發(fā)表于 05-14 10:23 ?1079次閱讀

    HBM與GDDR內存技術解析

    在高性能圖形處理領域,內存技術起著至關重要的作用。本文介紹兩種主要的圖形內存技術:高帶寬內存HBM
    的頭像 發(fā)表于 11-15 10:47 ?6767次閱讀
    <b class='flag-5'>HBM</b>與GDDR<b class='flag-5'>內存</b><b class='flag-5'>技術</b>全<b class='flag-5'>解析</b>

    美光新加坡HBM內存封裝工廠破土動工

    光在亞洲地區(qū)的進一步布局和擴張。 據(jù)美光方面介紹,該工廠將采用最先進的封裝技術,致力于提升HBM內存的產(chǎn)能和質量。隨著AI芯片行業(yè)的迅猛發(fā)展,HBM
    的頭像 發(fā)表于 01-09 16:02 ?1288次閱讀

    HBM技術,橫空出世:引領內存芯片創(chuàng)新的新篇章

    在這樣的背景下,高帶寬存儲器(HBM技術應運而生,以其獨特的3D堆疊架構和TSV(硅通孔)技術,為內存芯片行業(yè)帶來了前所未有的創(chuàng)新。
    的頭像 發(fā)表于 03-22 10:14 ?4951次閱讀
    <b class='flag-5'>HBM</b>新<b class='flag-5'>技術</b>,橫空出世:引領<b class='flag-5'>內存</b>芯片創(chuàng)新的新篇章

    Cadence推出HBM4 12.8Gbps IP內存系統(tǒng)解決方案

    近日,Cadence(NASDAQ:CDNS)近日宣布推出業(yè)界速度最快的 HBM4 12.8Gbps 內存 IP 解決方案,以滿足新一代 AI 訓練和 HPC 硬件系統(tǒng)對 SoC 日益增長的內存帶寬
    的頭像 發(fā)表于 05-26 10:45 ?1533次閱讀