91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

GPGPU市場增長強勁 創(chuàng)新性架構大幅提升AI計算效率!

Carol Li ? 來源:電子發(fā)燒友網 ? 作者:李彎彎 ? 2022-01-19 11:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網報道(文/李彎彎)GPU中文叫圖形處理單元,是一種并行處理的硬件,早起只用來渲染復雜的計算機圖形環(huán)境。隨著技術進步,GPU不再局限于圖形領域,擴展應用到其他計算密集的領域,被稱為GPGPU,成為AI 芯片領域的代表。

GPU具有很好的通用性,同時傳統(tǒng)的架構也存在一定局限,比如計算密度低、效率低,如何在保證通用性的情況下,又提高它的計算效率成為業(yè)界關注的重點。

創(chuàng)新架構提高AI計算效率

那么應該如何做呢?為了提高GPU的計算效率,GPU知名企業(yè)英偉達也進行的相應的嘗試,即對原來的GPU架構進行修改,比如增加專門的張量計算單元、增加片上內存器等,這一定程度可以提高AI的計算效率,不過受限于GPU整體架構,問題并沒有得到很好的解決。

圖:傳統(tǒng)GPU對AI加速的局限體現在哪些方面(圖片來自登臨科技分享)


成立于2017年的登臨科技,從2018年自主研發(fā)創(chuàng)新性的GPU+架構,一款由軟件定義的、片內異構的支持并行化計算的架構。GPU+架構針對AI應用,具備和GPU一樣的可編程能力和通用性。同時通過架構創(chuàng)新,提供更高的計算密度,更快的計算速度,同時大幅降低對外部帶寬的需求。而這些是傳統(tǒng)GPU芯片無法兼顧的。


由于GPU良好的通用性,在服務器及云端等使用場景中,會大規(guī)模應用 GPU。運行各類神經網絡。大量開源生態(tài)的應用、大量客戶定制化的軟件,都是在主流的GPU軟件生態(tài)上完成。如何保持客戶已有的投入,即如何減少客戶的使用成本,也是AI技術產業(yè)化的重要課題。

怎么做呢?登臨科技在接受電子發(fā)燒友采訪的時候表示,登臨自主創(chuàng)新的GPU+架構,通過對高效的Tensor引擎和可編程的GPGPU引擎的有機配合,硬件直接兼容CUDA/OpenCL,可無縫接入現有軟件生態(tài),大大降低了客戶的遷移成本。

通過片內異構,GPU+解決了傳統(tǒng)的系統(tǒng)級異構計算調度,數據交換的開銷大,以及數據的連貫相干性的難題。在整個系統(tǒng)的計算密度極高的基礎上,通過軟件定義,使針對不同神經網絡的應用場景,都能達到硬件性能和能效最大化。

登臨科技表示,通過大規(guī)??蛻魧崪y,在同等功耗下,GPU+的性能可以達到國際主流產品3倍以上的能效。

打造真正符合市場需求的產品

登臨科技成立以后,一直思考如何制定真正符合市場需求的技術路線,即上文所談的如何保持客戶已有的投入,減少客戶的使用成本,這是登臨科技制定產品的價值導向。

2018年登臨確定了產品的方向:基于GPGPU的高能效計算,并自主研發(fā)創(chuàng)新的GPU+架構。經過團隊一年多的工作,于2019年6月,公司完成了首款基于GPU+架構的Goldwasser設計,并mpw流片成功。

2020年6月Goldwasser成功回片通過測試,開始客戶送樣,Goldwasser目前已在成熟的12nm/14nm工藝上實現量產。登臨Goldwasser已于2021年在智慧城市、互聯網等領域順利實現了商業(yè)化落地,并同時與數十家客戶在邊緣至云端的不同應用場景中進行產品開發(fā)、測試。


登臨科技的Goldwasser 系列產品包括:邊緣計算產品 Goldwasser UL,功率 25-35W,INT8 算力 32-64TOPS;半高半長的服務器計算卡 Goldwasser L,功耗 40-70W,提供 128-256TOPS 算力;另有一種全高全長的 Goldwasser XL,輸出 512TOPS 算力。多種規(guī)格的產品,使得客戶可以根據自身需求分別部署在邊緣側、云端的各種計算設備中。

登臨科技方案架構總監(jiān)鄭韜此前在某論壇上也介紹過,Goldwasser覆蓋主流系統(tǒng)生態(tài),登臨Hamming軟件開發(fā)包支持主流GPU編程語言,包括CUDA、OpenCL等;適配國內外主流服務器廠家;支持主流國內外AI計算框架,包括PyTorch、百度飛漿、TensorFlow等;適配國內外主流CPU廠家,包括飛騰、龍芯、英特爾、AMD等。

在不同的應用場景下,Goldwasser可以支持多種不同的算法實現和落地,如智慧城市、智能交通、語音識別、虛擬客服、智慧工地、智慧車站、機器翻譯、工業(yè)視覺等,場景覆蓋CV、NLP、知識圖譜、信號處理和計算等多個領域。Goldwasser可以同時支持訓練和推理。

登臨科技表示,目前Goldwasser正與30多家不同行業(yè)的頭部企業(yè)進行量產導入。同時,登臨科技打通供應鏈上下游相關企業(yè)和合作伙伴,確保產品正常交付。

小結

當前AI技術正快速發(fā)展,GPGPU呈現出強勁的增長勢頭,根據有關數據預測,到2025年,我國GPGPU芯片板卡的市場規(guī)模將達458億元,年復合增長率高達32%,未來市場可觀。

目前國際巨頭占據大部分市場,與之相比國內廠商還存在差距,不過近幾年不少國內GPU廠商通過自主創(chuàng)新,在技術上逐漸取得進展,產品也逐步走向落地商用,比如登臨科技。

另外,對于政府目前重點關注的降碳增效,登臨科技表示,對計算芯片而言關鍵指標是能效比,而這也是公司產品的最重要的優(yōu)勢之一,登臨將繼續(xù)通過對傳統(tǒng)GPU的架構創(chuàng)新,不斷提升異構硬件的算力,達到非常顯著的能效比優(yōu)勢,為降碳和增效做貢獻。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Altair CFD 以技術賦能工程創(chuàng)新?

    的端到端無縫銜接。具備自動網格劃分、GPU加速、穩(wěn)態(tài)時間行進等功能,其中幾何模型準備效率較傳統(tǒng)工具提升80%,穩(wěn)態(tài)仿真可在少于100次迭代中快速收斂,大幅縮短仿真周期。4. AI賦能+
    發(fā)表于 02-28 14:47

    Imagination:邊緣AI是半導體市場重要增長引擎,E-Series 架構恰逢其時

    2025年半導體市場AI需求爆發(fā)與全產業(yè)鏈復蘇的雙重推動下,呈現出強勁增長態(tài)勢。以EDA/IP先進方法學、先進工藝、算力芯片、端側AI、
    的頭像 發(fā)表于 01-08 10:21 ?453次閱讀
    Imagination:邊緣<b class='flag-5'>AI</b>是半導體<b class='flag-5'>市場</b>重要<b class='flag-5'>增長</b>引擎,E-Series <b class='flag-5'>架構</b>恰逢其時

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片

    優(yōu)化計算資源并有效地適應任務的復雜。 顯著特征: MoE 模型的一個顯著特征是在管理大型數據集方面的靈活性較高,它能夠在計算效率小幅降低的情況下,將模型容量擴大上千倍。稀疏門控混合專
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現深度學習AI芯片的創(chuàng)新方法與架構

    的時間縮短、效率提升的硬件架構非常重要。因此存內加速方案,X-Former應運而生。它是一種混合存內計算架構,結合了NVM和基于互補金屬氧化
    發(fā)表于 09-12 17:30

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+內容總覽

    是展望未來的AGI芯片,并探討相關的發(fā)展和倫理話題。 各章的目錄名稱如下: 第1章 大模型浪潮下,AI芯片的需求與挑戰(zhàn)免費 第2章 實現深度學習AI芯片的創(chuàng)新方法與架構 第3章
    發(fā)表于 09-05 15:10

    AI 芯片浪潮下,職場晉升新契機?

    、新架構不斷涌現。能夠在工作中提出創(chuàng)新的解決方案,推動 AI 芯片性能、功耗、成本等關鍵指標的優(yōu)化,將極大提升在職稱評審中的競爭力。例如,
    發(fā)表于 08-19 08:58

    【書籍評測活動NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》

    創(chuàng)新、應用創(chuàng)新、系統(tǒng)創(chuàng)新五個部分,接下來一一解讀。 算法創(chuàng)新 在深度學習AI芯片的創(chuàng)新上,書中圍
    發(fā)表于 07-28 13:54

    AI芯片:加速人工智能計算的專用硬件引擎

    處理等應用落地的關鍵硬件基礎。 ? AI芯片的核心技術特點 ? ? AI芯片的設計重點在于提升計算效率,主要技術特點包括: ? 1. ? 并
    的頭像 發(fā)表于 07-09 15:59 ?1558次閱讀

    全球各大品牌利用NVIDIA AI技術提升運營效率

    歐萊雅、LVMH 集團和雀巢利用 NVIDIA 加速的智能體 AI 和物理 AI,大幅提升產品設計、營銷及物流等方面的運營效率。
    的頭像 發(fā)表于 06-19 14:36 ?1200次閱讀

    芯原可擴展的高性能GPGPU-AI計算IP賦能汽車與邊緣服務器AI解決方案

    芯原股份 (芯原,股票代碼:688521.SH) 日前宣布其 高性能、可擴展的GPGPU-AI計算IP的最新進展,這些IP現已為新一代汽車電子和邊緣服務器應用提供強勁賦能 。通過將可編程并行
    的頭像 發(fā)表于 06-16 10:44 ?1358次閱讀

    Intel-Altera FPGA:通信行業(yè)的加速引擎,開啟高速互聯新時代

    ,強化與AI、5G等技術的融合,同時通過獨立運營提升戰(zhàn)略專注度。市場機遇:AI、邊緣計算等領域的爆發(fā)式
    發(fā)表于 04-25 10:19

    DevEco Studio AI輔助開發(fā)工具兩大升級功能 鴻蒙應用開發(fā)效率提升

    HarmonyOS應用的AI智能輔助開發(fā)助手——CodeGenie,該AI助手深度集成在DevEco Studio中,提供鴻蒙知識智能問答、鴻蒙ArkTS代碼補全/生成和萬能卡片生成等功能,提升了開發(fā)
    發(fā)表于 04-18 14:43

    首創(chuàng)開源架構,天璣AI開發(fā)套件讓端側AI模型接入得心應手

    的端側部署,Token產生速度提升了40%,讓端側大模型擁有更高的計算效率和推理性能,使端側AI交互響應更及時,用戶體驗更貼心。 聯發(fā)科還與vivo和全民K歌攜手,借助天璣
    發(fā)表于 04-13 19:52

    適用于數據中心和AI時代的800G網絡

    隨著人工智能(AI)技術的迅猛發(fā)展,數據中心面臨著前所未有的計算和網絡壓力。從大語言模型(LLM)訓練到生成式AI應用,海量數據處理需求推動了網絡帶寬的快速增長。在此背景下,800G網
    發(fā)表于 03-25 17:35

    DeepSeek推動AI算力需求:800G光模塊的關鍵作用

    數據傳輸速率,減少帶寬瓶頸,成為數據中心和AI集群架構優(yōu)化的重點。光模塊速率的躍升不僅提升了傳輸效率,也為大規(guī)模并行計算任務提供了必要的帶寬
    發(fā)表于 03-25 12:00