91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人工智能需求促進FPGA市場 這一革新解決了應(yīng)用瓶頸

堅白 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:陸楠 ? 2019-05-23 14:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

過去幾年,FPGA的CAGR大約一直保持在8-10%左右,隨著該類器件在AI應(yīng)用中的擴張,未來5年其CAGR增長將高達38.4%!根據(jù)市場調(diào)研公司Semico Research的預(yù)測,人工智能應(yīng)用中FPGA的市場規(guī)模將在未來4年內(nèi)增長3倍,達到52億美元。為了保持競爭力,目前全球有25%的企業(yè)實施了人工智能/機器學(xué)習(xí)(AI/ML),而兩年內(nèi),這一比例將增長到72%,以更好地獲得核心職能方面的商業(yè)洞察力。
企業(yè)AI/ML部署需求增長趨勢
圖:企業(yè)AI/ML部署需求增長趨勢
伴隨這一趨勢,AI的算法在不斷演進,對數(shù)值精度的選擇要求也更加多元,高效算力、高效豐富的存儲緩存能力以及高效大帶寬的數(shù)據(jù)運送能力,是AI/ML硬件解決方案所面臨的主要挑戰(zhàn)。系統(tǒng)開發(fā)者會利用FPGA架構(gòu)去優(yōu)化功耗、性能和靈活性,并突破處理單元在效率上的瓶頸,包括計算引擎、內(nèi)存層次結(jié)構(gòu)和數(shù)據(jù)移動。
算法和精度要求不同給處理帶來挑戰(zhàn)
圖:算法和精度要求不同給處理帶來挑戰(zhàn)
就AI的應(yīng)用而言,不同場景應(yīng)用對FPGA的需求不同。通常云計算中的應(yīng)用主要是需要FPGA在AI/ML和高帶寬數(shù)據(jù)加速上的能力,而在端側(cè)則需要在高靈活性的同時還要具有ASIC的性能。雖然,F(xiàn)PGA已經(jīng)大量應(yīng)用于泛AI領(lǐng)域,但它是否很好的滿足這兩個方面的需求,還是一個值得探討的話題。

重構(gòu)FPGA架構(gòu)

縱觀FPGA產(chǎn)品的演進歷史(包括器件的產(chǎn)生),每一次大的迭代都是一種設(shè)計方法論的革新,從這個角度看,Achronix公司最近發(fā)布的Speedster7t針對上述兩個應(yīng)用場景上進行的優(yōu)化都可以看做方法論上的革新。在開發(fā)Speedster7t的過程中,Achronix的工程團隊完全重新構(gòu)想了整個FPGA架構(gòu),以平衡片上處理、互連和外部輸入輸出接口,實現(xiàn)數(shù)據(jù)密集型應(yīng)用吞吐量的最大化,這些應(yīng)用場景可見于那些基于邊緣和基于服務(wù)器的AI/ML應(yīng)用、網(wǎng)絡(luò)處理和存儲。
“Speedster7t是我們歷史上最令人激動的發(fā)布,代表了建立在四個架構(gòu)代系的硬件和軟件開發(fā)基礎(chǔ)上的創(chuàng)新和積淀?!盇chronix公司董事長兼首席執(zhí)行官Robert Blake介紹,“該器件采用TSMC的7nm FinFET工藝制造,專為ML和高帶寬網(wǎng)絡(luò)應(yīng)用進行了優(yōu)化?!?/div>
具體而言,相較于目前的FPGA,Speedster7t革新之處在于設(shè)計了針對ML的處理器(MLP),以及一個可橫跨和垂直跨越FPGA邏輯陣列的高帶寬的二維片上網(wǎng)絡(luò)(NOC),二者結(jié)合既保留了FPGA的靈活性,又實現(xiàn)了ASIC的性能。

不占用FPGA布線的MLP單元

這個片內(nèi)的MLP是高度可配置的、計算密集型的單元模塊,可支持4到24位的整點格式和高效的浮點模式,包括對TensorFlow的16位格式的支持,以及可使每個MLP的計算引擎加倍的增壓塊浮點格式的直接支持。該MLP可以通過運算和緩存級鏈實現(xiàn)更復(fù)雜的算法,而不需要使用FPGA布線資源。
“目前FPGA會使用DSP來進行ML的處理,但其對數(shù)值精度的支持并不高效,并且需要消耗額外邏輯和存儲資源,其性能也受限于FPGA布線?!盉lake說,“DSP常用于無線數(shù)字濾波的處理,而Speedster7t中的MLP則在計算架構(gòu)、緩存(內(nèi)嵌)、可配置算法以及對整點和浮點的支持上提供了更好的AI/ML的計算性能和能效比?!?/div>
在FPGA中采用MLP比DSP更適用于AI/ML處理
圖:在FPGA中采用MLP(右)比DSP(左)更適用于AI/ML處理

二維片上網(wǎng)絡(luò)——NOC

NOC是在FPGA路由結(jié)構(gòu)上的另一個重要革新。這一設(shè)計主要針對FPGA的片上處理引擎之間所需的高帶寬通信。Speedster7t片上資源包括8個GDDR6控制器、72個業(yè)界SerDes(1到112 Gbps)、帶有前向糾錯(FEC)的硬件400G以太網(wǎng)MAC(4x100G或8x50G的配置),以及硬件PCI Express Gen5控制器(每個控制器有8個或16個通道)。
這些高速I/O和存儲器端口的數(shù)萬兆比特數(shù)據(jù)很容易淹沒傳統(tǒng)FPGA面向比特位的可編程互連邏輯陣列的路由容量,而Speedster7t通過NOC把它們連接到所有FPGA的高速數(shù)據(jù)和存儲器接口。NOC和FPGA功能之間通過網(wǎng)絡(luò)接入點NAP連接,每個水平行和垂直列的交叉點都有NAP(主NAP和從NAP)。NoC中的每行/列都可同時為每個方向提供512Gbps的數(shù)據(jù)流量,其鏈路雙向運行,最大的設(shè)備帶寬可以達到20Tbps。
“最重要的是,NOC消除了傳統(tǒng)FPGA使用可編程路由和邏輯查找表資源在整個FPGA中移動數(shù)據(jù)流中出現(xiàn)的擁塞和性能瓶頸。”Blake說,“這種高性能網(wǎng)絡(luò)不僅可以提高Speedster7t FPGA的總帶寬容量,還可以在降低功耗的同時提高有效LUT容量?!?/div>
圖:NOC是在FPGA路由結(jié)構(gòu)上的另一個重要革新
的確,NOC這一方法解決了GDDR6、400G以太網(wǎng)MAC這些片上資源海量數(shù)據(jù)傳輸?shù)膯栴}。Speedster7t是目前市面唯一支持GDDR6存儲器的FPGA,可以支持4 Tbps的GDDR6累加帶寬,可以很小的成本提供與基于HBM的FPGA等效存儲帶寬。相較于HBM,GDDR6只需要一半的成本就可以滿足高存儲層次和帶寬的需求,并且,HBM是固化的塊,GDDR6則更靈活,用戶可以選擇不同容量和帶寬。
NOC也解決了傳統(tǒng)FPGA的運行速度無法滿足任何400G以太網(wǎng)總線寬度要求的問題,400G以太網(wǎng)的總線大小達1024bit,所需的最高頻率達到724 MHz,這在傳統(tǒng)FPGA中無法實現(xiàn),NOC由于消除了傳統(tǒng)設(shè)計中與FPGA布線相關(guān)的延遲,所以可以最高支持750 MHz的頻率,這滿足了MLP和嵌入式存儲器模、400G以太網(wǎng)MAC及高速SerDes之間的數(shù)據(jù)傳輸。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1660

    文章

    22415

    瀏覽量

    636547
  • NoC
    NoC
    +關(guān)注

    關(guān)注

    0

    文章

    43

    瀏覽量

    12169
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    SMT工藝革新:高精度貼裝與微型化組裝的未來趨勢

    。 SMT 工藝的革新不僅體現(xiàn)在硬件設(shè)備上,更體現(xiàn)在智能化和數(shù)據(jù)化的管理系統(tǒng)中。四川英特麗SMT 生產(chǎn)線配備 MES(制造執(zhí)行系統(tǒng))和 AI 質(zhì)量檢測系統(tǒng),通過實時監(jiān)控每片 PCB
    發(fā)表于 03-06 14:55

    淺談人工智能(2)

    接前文《淺談人工智能(1)》。 (5)什么是弱人工智能、強人工智能以及超人工智能? 弱人工智能(Weak AI),也稱限制領(lǐng)域
    的頭像 發(fā)表于 02-22 08:24 ?139次閱讀
    淺談<b class='flag-5'>人工智能</b>(2)

    人工智能應(yīng)用開發(fā)-中級(大模型)》認證證書含金量如何?怎么考?

    在國家《新一代人工智能發(fā)展規(guī)劃》及“人工智能+”行動的雙重推動下,人工智能與大模型技術(shù)已成為驅(qū)動產(chǎn)業(yè)智能化升級的核心力量。目前,大模型應(yīng)用開發(fā)相關(guān)崗位
    的頭像 發(fā)表于 01-28 15:11 ?733次閱讀
    《<b class='flag-5'>人工智能</b>應(yīng)用開發(fā)-中級(大模型)》認證證書含金量如何?怎么考?

    微軟與新思科技分享智能人工智能技術(shù)的行業(yè)影響

    (Agentic AI)技術(shù)的行業(yè)影響,以及未來跨界合作的前景。此次圓桌討論不僅展現(xiàn)雙方的戰(zhàn)略協(xié)同,以及他們在開發(fā)市場領(lǐng)先解決方案方面的共同努力,也勾勒出人工智能是如何驅(qū)動工程、電信、制藥等行業(yè)變革的新藍圖。
    的頭像 發(fā)表于 11-30 09:48 ?413次閱讀

    革新科研智造,引領(lǐng)材料未來——高通量智能科研制備工作站

    技術(shù)、智能硬件、測試儀器及自動化實驗平臺,致力于為能源科學(xué)與材料科學(xué)提供領(lǐng)先的解決方案。 攜手共創(chuàng),以人工智能引領(lǐng)研發(fā)新紀元 善思創(chuàng)興始終致力于與行業(yè)伙伴緊密合作,通過推廣高通量智能實驗平臺及AI模型
    發(fā)表于 09-27 14:17

    傲琪人工合成石墨片: 破解智能手機散熱困境的創(chuàng)新解決方案

    用戶提供更持久的產(chǎn)品使用周期。 傲琪人工合成石墨片代表智能手機散熱技術(shù)的次重要進化。它不僅僅是
    發(fā)表于 09-13 14:06

    賦能人工智能未來:ADI宣布支持800 VDC數(shù)據(jù)中心架構(gòu)

    北京2025年8月28日 /美通社/ -- 人工智能(AI)的迅速發(fā)展開啟高密度計算需求的新時代,而傳統(tǒng)電源架構(gòu)逐漸難以適應(yīng)這一需求發(fā)展。
    的頭像 發(fā)表于 08-28 21:18 ?1079次閱讀
    賦能<b class='flag-5'>人工智能</b>未來:ADI宣布支持800 VDC數(shù)據(jù)中心架構(gòu)

    人工智能+”,走老路難賺到新錢

    昨天的“人工智能+”刷屏,這算是官方第次對“人工智能+”這個名稱定性吧?今年年初到現(xiàn)在,涌現(xiàn)出了大批基于
    的頭像 發(fā)表于 08-27 13:21 ?736次閱讀
    “<b class='flag-5'>人工智能</b>+”,走老路難賺到新錢

    挖到寶!人工智能綜合實驗箱,高校新工科的寶藏神器

    ,技術(shù)自主可控 在如今這個科技競爭激烈的時代,國產(chǎn)化硬件的重要性不言而喻。比鄰星人工智能綜合實驗箱就做到了這一點,采用國產(chǎn)化硬件,積極推進全行業(yè)產(chǎn)業(yè)鏈上下游環(huán)節(jié)的國產(chǎn)化進程,把國產(chǎn)自主可控的軟硬件平臺
    發(fā)表于 08-07 14:30

    挖到寶!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!

    ,技術(shù)自主可控 在如今這個科技競爭激烈的時代,國產(chǎn)化硬件的重要性不言而喻。比鄰星人工智能綜合實驗箱就做到了這一點,采用國產(chǎn)化硬件,積極推進全行業(yè)產(chǎn)業(yè)鏈上下游環(huán)節(jié)的國產(chǎn)化進程,把國產(chǎn)自主可控的軟硬件平臺
    發(fā)表于 08-07 14:23

    中汽中心出席車用人工智能標準化促進中心成立會議

    近日,我國汽車領(lǐng)域首個以車用人工智能標準化為研究目標的技術(shù)組織——車用人工智能標準化促進中心成立會議在天津召開,中汽中心副總經(jīng)理龔進峰出席會議并致辭。來自整車企業(yè)、零部件企業(yè)、高校、科研機構(gòu)等70多家單位的180余位代表參會。
    的頭像 發(fā)表于 07-21 16:48 ?881次閱讀

    最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會發(fā)展的當(dāng)下,無論是探索未來職業(yè)方向,還是更新技術(shù)儲備,掌握大模型知識都已成為新時代的必修課。從職場上輔助工作的智能助手,到課堂用于學(xué)術(shù)研究的智能工具,大模型正在工作生活
    發(fā)表于 07-04 11:10

    英飛凌科技加大AI人工智能與機器人領(lǐng)域的市場投入

    近日,英飛凌科技全球高級副總裁潘大偉在次行業(yè)會議上透露,公司對人工智能(AI)和機器人市場的發(fā)展前景充滿信心,并計劃在這兩個領(lǐng)域加大投入。這一戰(zhàn)略決策反映
    的頭像 發(fā)表于 06-24 09:57 ?1026次閱讀
    英飛凌科技加大AI<b class='flag-5'>人工智能</b>與機器人領(lǐng)域的<b class='flag-5'>市場</b>投入

    瑞蘇盈科FPGA賦能Lynx SAI50 MLSoC:邊緣人工智能FPGA性能的完美結(jié)合

    前言在科技飛速發(fā)展的當(dāng)下,邊緣人工智能FPGA性能的結(jié)合正引領(lǐng)著技術(shù)革新的新浪潮。這一融合不僅為眾多行業(yè)帶來了前所未有的機遇,更在諸多領(lǐng)域?qū)崿F(xiàn)
    的頭像 發(fā)表于 05-16 08:48 ?966次閱讀
    瑞蘇盈科<b class='flag-5'>FPGA</b>賦能Lynx SAI50 MLSoC:邊緣<b class='flag-5'>人工智能</b>與<b class='flag-5'>FPGA</b>性能的完美結(jié)合

    Arm發(fā)布人工智能就緒指數(shù)報告

    人工智能 (AI) 已經(jīng)迅速從未來的概念蛻變?yōu)檠巯碌年P(guān)鍵商業(yè)工具。然而,面對 AI 的無限可能,企業(yè)是否已經(jīng)做好充分準備?為探索這一關(guān)鍵問題,Arm 調(diào)研并發(fā)布人工智能就緒指數(shù)報告
    的頭像 發(fā)表于 04-09 09:19 ?798次閱讀