91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

今天發(fā)布!詳解賽靈思加速卡Alveo U50的輕與重

堅白 ? 來源:電子發(fā)燒友網 ? 作者:陸楠,電子發(fā)燒友 ? 2019-08-07 09:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

目前,數據中心在異構計算和算法標準上不斷變化,越來越多的應用領域需要專用的架構,使得硬件能夠和算法去進行匹配以達到最佳運行效果或者是提高它的運行速度。網絡上有很多不同的數據,這些數據在運行過程當中有不同的要求,而且網絡自身也在不斷迭代,計算、網絡和存儲對加速的要求都在水漲船高。對于硬件而言,理想的方式是能在不改變硬件的情況下,加速任何工作負載,并能降低總體擁有成本。
針對這一需求趨勢,去年10月份的時候,賽靈思推出了Alveo系列加速卡。賽靈思數據中心業(yè)務部產品規(guī)劃和市場營銷總監(jiān)Jamon Bowen將這一系列產品的規(guī)劃目的總結為三個:快速、靈活應變和方便易用。即高吞吐量同時具有超低時延,能夠為多種工作負載進行加速,并且可以運用于云和本地各種場景。Alveo系列包括U200、U250和U280,區(qū)別主要是FPGA中的LUT規(guī)模和總線資源。今天,該公司宣布推出了Alveo系列最新的一款加速卡Alveo U50。

輕——輕量級加速

和該系列之前的產品不同,Alveo U50是業(yè)界首款輕量級PCIe Gen4自適應計算加速卡,并且面向所有服務器、各種云和邊緣的數據中心應用,包括網絡和存儲加速?!斑@是之前的產品做不到的?!盉owen說。
圖:從賽靈思提供的資料看,U50似乎是U280的迷你版。
Alveo U50支持PCIe Gen4這一最新的服務器總線和CCIX互聯標準,不同于GPU加速器的尺寸,U50要小的多,“GPU加速器的尺寸適合電腦,但不適用于網絡和存儲,”Bowen說,“采用賽靈思UltraScale+架構以及集成超高帶寬的HBM2存儲器技術大大減少了U50的尺寸。”
采用HBM2這種片上存儲不僅僅是出于體積的考慮,還在于這能提升性能——HBM性能是DDR的10倍。U50內置8GB HBM2,可實現超過400Gbps的數據傳輸速度。PCIe Gen4也是目前最快的總線技術,這些都是存儲加速的要素。在網絡端口方面,U50的QSFP28端口可以實現100Gbps的網絡連接,并支持多種前沿應用,如VMe-oF(NVM Express over Fabrics)、解耦計算存儲和專業(yè)金融服務應用。滿足所有這些性能只需要不到75W的功耗,這可以讓很多應用不再為功耗預算而擔心。
在一組針對語音翻譯(深度學習推斷加速)、數據庫分析(數據分析加速)、數據壓縮(計算存儲加速)、電子交易(網絡加速)和金融建模(網格計算)的加速測試中,與GPU和CPU加速相比,U50的表現優(yōu)異。其中,語音翻譯的時延降低25倍,吞吐量擴大10倍,在翻譯性能方面,和英偉達T4 相比,U50 性能提升高達10倍;在運行TPC-H Query基準測試(數據庫分析)時,相比CPU,U50每小時吞吐量提升4倍,運營成本降低3倍;在數據壓縮上,U50將壓縮/解壓縮吞吐量提高了20倍,實現了更快的Hadoop和大數據分析,同時相比僅CPU節(jié)點將每節(jié)點成本降低了40%;在電子交易中,U50相比僅CPU的10us延時,能將時延降低20%,交易時間不到500ns;在金融建模時,運行蒙特卡洛模擬,U50的功效相比GPU提升了7倍。
圖:U50在吞吐量,延遲和功效方面實現了10-20倍的改善
總的來說,U50在吞吐量,延遲和功效方面實現了10-20倍的改善?!拔覀兊膽?zhàn)略是致力于讓賽靈思靈活應變的加速技術應用于數據中心的所有領域,具體來說就是計算、網絡和存儲,”Bowen說,“所有的計算工作負載都是這三個領域的一部分,這也是我們看到Alveo可以大展宏圖的地方?!?/div>

重——兩個重要堆棧

計算、網絡和存儲為什么需要加速?因為諸如AlexNet、GoogleNet、DenseNet這些網絡結構都需要不同的硬件架構來實現高吞吐量、低時延和高效率。對于應用而言,加速可以靈活適應不同的需求。而數據中心要優(yōu)化性能,需要定制數據路徑、定制精度和定制存儲器層級,沒有比可編程的硬件更適合來進行定制化的加速了。不過,對于數據中心開發(fā)者而言,FPGA編程是個令人頭痛的事情。
“我們從數據中心的客戶那里聽到的一個最大的抱怨就是FPGA的編程非常困難,”Bowen說,“Alveo提供開放的平臺和開發(fā)環(huán)境,讓開發(fā)者能夠更加便捷地使用,隨著越來越多的開發(fā)者到這個平臺上來開發(fā),會有更多的云和相關產品加入,并且能夠實現原來只有在軟件部分才有可能實現的硬件IP的靈活應變能力?!?/div>
對于賽靈思而言,這個開放平臺正在形成一個解決方案的堆棧,好消息是,自去年10月份推出Alveo以來,目前已發(fā)布的應用已經是當初的2倍,而其培訓的開發(fā)者已經是當初的4倍。
圖:解決方案堆棧
開發(fā)堆棧解決了FPGA加速卡的開發(fā)難題,接下來就是大規(guī)模部署落地的難題。Alveo系列的應用領域包括數據分析、視頻與圖象處理、機器學習、生命科學和金融計算——不僅是云的覆蓋,還要部署落地。在諸多調動IT業(yè)者積極性的因素中,“充分商業(yè)化的標準化產品”是重要的一個,這使得賽靈思的標準產品的開源框架很容易被Kubernetes和docker這類免費的微服務內容平臺連接。
“因為我們是一個非常標準化的產品,所以Kubernetes可以在系統(tǒng)內反映出Alveo插件,開發(fā)者也可以把它和docker配合起來,通過對Alveo進行編程而在系統(tǒng)中體現出加速應用?!盉owen解釋道,“所有編排、云管理和應用都和這些免費的生態(tài)系統(tǒng)結合,如果沒有這樣一個標準化的產品配置,客戶可能需要花費大量的投資才能夠實現這樣一個功能,這對于一些超大規(guī)模數據中心的應用來說是非常有必要的,既可以在云端,也可以用Alveo在本地進行加速,而且是一個非常開放式的框架,可以進行全面的加速?!?/strong>
這個生態(tài)就是一個大規(guī)模部署堆棧,賽靈思在其中開發(fā)了一個標準框架,然后提供Alveo產品,讓開發(fā)者像加速軟件那樣給服務器加速——重要的是,通過開發(fā)這個標準框架,賽靈思決定了應用場景的加速方式。
圖:大規(guī)模部署堆棧
據悉,賽靈思選擇在今天(8月7日)發(fā)布Alveo U50,是因為這兩天(8月6-8日),閃存峰會(Flash Memory Summit (FMS) 2019)正在美國加州圣克拉拉會議中心舉辦,賽靈思執(zhí)行副總裁兼數據中心部總經理Salil Raje將發(fā)表有關高速存儲系統(tǒng)加速的的主題演講,該公司同時也會在現場演示這款最新的產品。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 賽靈思
    +關注

    關注

    33

    文章

    1798

    瀏覽量

    133446
  • 加速卡
    +關注

    關注

    1

    文章

    73

    瀏覽量

    11350
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    FPGA硬件加速卡設計原理圖:1-基于Xilinx XCKU115的半高PCIe x8 硬件加速卡 PCIe半高 XCKU115-3-FLVF1924-E芯片

    FPGA硬件加速, PCIe半高, XCKU115, 光纖采集, 信號計算板, 硬件加速卡
    的頭像 發(fā)表于 02-12 09:52 ?397次閱讀
    FPGA硬件<b class='flag-5'>加速卡</b>設計原理圖:1-基于Xilinx XCKU115的半高PCIe x8 硬件<b class='flag-5'>加速卡</b> PCIe半高 XCKU115-3-FLVF1924-E芯片

    新品 | LLM-8850 Kit,高性能AI加速卡套件 DinMeter v1.1,1/32DIN標準嵌入式開發(fā)板

    LLM-8850KitLLM-8850Kit是一款面向邊緣AI與嵌入式計算場景的高性能AI加速卡套件,由LLM-8850CardAI加速卡與LLM-8850PiHat轉接板組成。核心加速卡
    的頭像 發(fā)表于 01-30 16:11 ?1057次閱讀
    新品 | LLM-8850 Kit,高性能AI<b class='flag-5'>加速卡</b>套件 DinMeter v1.1,1/32DIN標準嵌入式開發(fā)板

    高速信號處理設計方案:413-基于雙XCVU9P+C6678的100G光纖加速卡

    C6678, XCVU9P, ZU19EG開發(fā)板,, 高速信號處理, 光纖加速卡, XCVU9P光纖加速卡
    的頭像 發(fā)表于 01-08 16:06 ?304次閱讀
    高速信號處理設計方案:413-基于雙XCVU9P+C6678的100G光纖<b class='flag-5'>加速卡</b>

    福田汽車新能源助力東南亞物流行業(yè)綠色轉型

    近日,福田汽車在東南亞區(qū)域實現重要突破,旗下新能源正式交付某全球領先物流企業(yè)。此次合作標志著福田汽車在東南亞新能源商用車市場的布局邁出堅實一步,也為當地物流行業(yè)的綠色轉型注入
    的頭像 發(fā)表于 12-31 15:16 ?530次閱讀

    福田BEACON正式發(fā)布量產版

    2025年12月18日,福田BEACON正式發(fā)布量產版,攜純電、氣氫、液氫三款量產產品與公眾見面,其中,液氫產品是行業(yè)首個將只應用于航空航天領域的液氫能源突破性地應用于量產化的
    的頭像 發(fā)表于 12-25 16:18 ?820次閱讀

    3U VPX板卡設計原理圖:821-基于RFSOC的8路5G ADC和8路9G的DAC 3U VPX

    3uvpx板卡, DA輸出核心板, RFSOC, XCVU9P芯片, 信號輸出播放, 硬件加速卡, 3U VPX板卡
    的頭像 發(fā)表于 12-18 14:18 ?463次閱讀
    3<b class='flag-5'>U</b> VPX板卡設計原理圖:821-基于RFSOC的8路5G ADC和8路9G的DAC 3<b class='flag-5'>U</b> VPX<b class='flag-5'>卡</b>

    工程師必入!288 元解鎖開發(fā)板

    做項目、練技術、備賽事卻找不到高性價比開發(fā)板?合眾恒躍重磅福利——ZYNQ系列開發(fā)板限時特惠,HZ-XC-7Z010-SP_EVM寵粉價僅需288元!
    的頭像 發(fā)表于 12-17 17:48 ?780次閱讀
    工程師必入!288 元解鎖<b class='flag-5'>賽</b><b class='flag-5'>靈</b><b class='flag-5'>思</b>開發(fā)板

    深圳光量子工廠啟示:PCI 加速卡為何偏向 25MHz 2016 有源晶振?

    在 PCI?加速卡項目中,工程師使用SJK 2016?系列有源晶振?25MHZ。原因不僅僅是規(guī)格匹配,更在于系統(tǒng)復雜度。
    的頭像 發(fā)表于 12-12 16:43 ?1211次閱讀
    深圳光量子工廠啟示:PCI <b class='flag-5'>加速卡</b>為何偏向 25MHz 2016 有源晶振?

    算力密度翻倍!江原D20加速卡發(fā)布,一雙芯重構AI推理標桿

    的關鍵技術瓶頸。 ? 在此背景下,江原科技推出采用自研AI芯片的AI加速卡江原D10,并在今年5月實現量產交付。在大算力AI芯片全流程國產化產業(yè)鏈實現首次突破后,11月11日,江原科技再次發(fā)布新一代全國產AI加速卡——江原D20
    的頭像 發(fā)表于 11-14 08:21 ?1w次閱讀
    算力密度翻倍!江原D20<b class='flag-5'>加速卡</b><b class='flag-5'>發(fā)布</b>,一<b class='flag-5'>卡</b>雙芯重構AI推理標桿

    虛擬電廠加速卡不是噱頭!萬點規(guī)模VPP的性能分水嶺

    。 ? 此時僅靠邊緣MPU/CPU的通用算力,可能無法及時處理數據清洗、異常檢測、指令下發(fā)校驗等任務,而加速卡(如 GPU、FPGA 加速卡)的并行計算能力可快速消化數據洪流,避免“小包風暴”導致的系統(tǒng)頓。 ? 虛擬電廠對AG
    的頭像 發(fā)表于 10-10 08:59 ?2492次閱讀

    新品 | LLM-8850 Card, AX8850邊緣設備AI加速卡

    LLM?8850?Card是一款面向邊緣設備的M.2M-KEY2242?AI加速卡,把42?mm的袖珍體積與AxeraAX8850?SoC的24?TOPS?@?INT8算力結合起來,為
    的頭像 發(fā)表于 09-26 18:18 ?1121次閱讀
    新品 | LLM-8850 Card, AX8850邊緣設備AI<b class='flag-5'>加速卡</b>

    智算加速卡是什么東西?它真能在AI戰(zhàn)場上干掉GPU和TPU!

    隨著AI技術火得一塌糊涂,大家都在談"大模型"、"AI加速"、"智能計算",可真到了落地環(huán)節(jié),算力才是硬通貨。你有沒有發(fā)現,現在越來越多的AI企業(yè)不光用GPU,也不怎么迷信TPU了?他們嘴里多了一個新詞兒——智算加速卡。
    的頭像 發(fā)表于 06-05 13:39 ?1662次閱讀
    智算<b class='flag-5'>加速卡</b>是什么東西?它真能在AI戰(zhàn)場上干掉GPU和TPU!

    410?基于?XCVU9P+?C6678?的?100G?光纖的加速卡

    基于 XCVU9P+ C6678 的 100G 光纖的加速卡
    的頭像 發(fā)表于 05-08 08:32 ?752次閱讀
    410?基于?XCVU9P+?C6678?的?100G?光纖的<b class='flag-5'>加速卡</b>

    邊緣AI運算革新 DeepX DX-M1 AI加速卡結合Rockchip RK3588多路物體檢測解決方案

    DeepX 推出了一款革命性的產品 DeepX DX-M1 AI 推理加速卡 采用 PCIe Gen3 M.2 M-Key 接口,具備高達 25 TOPS 的卓越運算性能,以及高準確度、低功耗、低溫
    的頭像 發(fā)表于 05-06 14:15 ?1249次閱讀
    邊緣AI運算革新 DeepX DX-M1 AI<b class='flag-5'>加速卡</b>結合Rockchip RK3588多路物體檢測解決方案

    寒武紀基于思元370芯片的MLU370-X8 智能加速卡產品手冊詳解

    MLU370-X8智能加速卡是全面升級的數據中心訓推一體AI加速卡,基于寒武紀全新一代元370芯片,接口為PCIe 4.0 X16,是全高全長雙寬(FHFL-Dual-Slot)的標準PCIe
    的頭像 發(fā)表于 04-24 17:57 ?5422次閱讀
    寒武紀基于思元370芯片的MLU370-X8 智能<b class='flag-5'>加速卡</b>產品手冊<b class='flag-5'>詳解</b>