91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

美國(guó)正在開(kāi)發(fā)用于圖處理的下一代ASIC

我快閉嘴 ? 來(lái)源:半導(dǎo)體行業(yè)觀察 ? 作者:David Schor ? 2020-09-28 15:52 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

現(xiàn)代微處理器通常能夠通過(guò)分層緩存來(lái)隱藏計(jì)算與內(nèi)存之間的大部分差距。這是因?yàn)樵S多負(fù)載表現(xiàn)出相對(duì)可預(yù)測(cè)的一般內(nèi)存模式,可以通過(guò)空間局部性和時(shí)間局部性加以利用。有些負(fù)載還尷尬地并行。例如,人工智能負(fù)載往往表現(xiàn)出這種行為。只要你持續(xù)為機(jī)器提供數(shù)據(jù),更多計(jì)算就相當(dāng)于更高性能。人工智能負(fù)載往往具有非??深A(yù)測(cè)的內(nèi)存模式以及較高的數(shù)據(jù)重新利用能力,這有助于實(shí)現(xiàn)上述所有目標(biāo)。

不幸的是,并非所有算法都具有這些理想的特性。圖就是這樣一個(gè)例子。企業(yè)廣泛地使用圖來(lái)處理大數(shù)據(jù)。這些數(shù)據(jù)結(jié)構(gòu)往往有上萬(wàn)億個(gè)邊緣,并采用特殊的圖算法對(duì)數(shù)據(jù)進(jìn)行操作。圖算法采用非常隨機(jī)的內(nèi)存訪問(wèn)模式,導(dǎo)致負(fù)載受到內(nèi)存延遲的高度限制,迫使計(jì)算元素在很多時(shí)候陷入停滯。它本質(zhì)上是一個(gè)非常大的指針追逐問(wèn)題,表現(xiàn)出與運(yùn)行在GPUCPU上的大多數(shù)負(fù)載相矛盾的行為。

更糟的是,圖算法往往具有非常差的次線性縮放特性。你根本無(wú)法通過(guò)投入更多處理器來(lái)解決這個(gè)問(wèn)題。由于數(shù)據(jù)的稀疏性和不規(guī)則性,下一個(gè)數(shù)據(jù)訪問(wèn)通常是在一個(gè)完全不同的節(jié)點(diǎn)上,傳輸數(shù)據(jù)最終會(huì)導(dǎo)致整個(gè)系統(tǒng)出現(xiàn)瓶頸。

美國(guó)國(guó)防部分層識(shí)別驗(yàn)證及利用計(jì)劃(DARPA HIVE)

分層識(shí)別驗(yàn)證及利用(HIVE)計(jì)劃是美國(guó)國(guó)防部正在開(kāi)展的一項(xiàng)計(jì)劃,目標(biāo)是解決這些缺點(diǎn)。HIVE采用軟硬件雙管齊下的方式。針對(duì)該計(jì)劃的硬件部分,正在開(kāi)發(fā)用于圖處理的下一代ASIC。針對(duì)軟件部分,正在開(kāi)發(fā)一個(gè)新的全棧圖框架。美國(guó)國(guó)防部希望通過(guò)專(zhuān)門(mén)的圖處理器和優(yōu)化的軟件棧,實(shí)現(xiàn)比當(dāng)前同類(lèi)最佳的GPU高1000倍的性能效率。

在上個(gè)月底舉行的DARPA ERI峰會(huì)上,Peter Wang介紹了該項(xiàng)目的最新進(jìn)展。Wang是Anaconda公司的聯(lián)合創(chuàng)始人兼首席技術(shù)官。他也是HIVE軟件架構(gòu)的首席研究員。

介紹英特爾PUMA團(tuán)隊(duì)

英特爾負(fù)責(zé)HIVE的硬件架構(gòu)部分,他們正在開(kāi)發(fā)一個(gè)新的架構(gòu)來(lái)解決這些問(wèn)題。在英特爾的數(shù)據(jù)中心事業(yè)部?jī)?nèi)部有一個(gè)名為PUMA的秘密團(tuán)隊(duì)。他們負(fù)責(zé)圖分析(GA)處理器的開(kāi)發(fā)。這是他們正在秘密開(kāi)發(fā)的一個(gè)完整產(chǎn)品,英特爾打算最終將其商業(yè)化。

新的圖處理器基于一種新開(kāi)發(fā)的架構(gòu),被稱(chēng)為可編程統(tǒng)一內(nèi)存架構(gòu)或PUMA。這是一種新的架構(gòu),用于整個(gè)全局統(tǒng)一內(nèi)存空間的小型不規(guī)則內(nèi)存訪問(wèn)。在這種架構(gòu)下,芯片放棄了現(xiàn)代CPU和GPU所使用的許多基本假設(shè)——它并不假設(shè)自己擁有附近所有內(nèi)存,它并不假設(shè)內(nèi)存訪問(wèn)會(huì)在不久的將來(lái)重復(fù)執(zhí)行,它也不假設(shè)對(duì)特定地址的內(nèi)存訪問(wèn)意味著附近的內(nèi)存地址也將被訪問(wèn)。Wong說(shuō):“通過(guò)拋棄這些基本假設(shè),你可以圍繞對(duì)全局統(tǒng)一數(shù)據(jù)的小訪問(wèn)而構(gòu)建一個(gè)完全不同的硬件架構(gòu)。然后,在每個(gè)階段,每當(dāng)有一個(gè)有線互聯(lián)或者任何把一個(gè)計(jì)算單元連接到其它一些數(shù)據(jù)單元或其它計(jì)算單元的東西,每一個(gè)點(diǎn)都針對(duì)延遲進(jìn)了優(yōu)化。” PUMA從根本上改變了與內(nèi)存訪問(wèn)相關(guān)的行為,使內(nèi)存訪問(wèn)更小、更有效,并使訪問(wèn)這些內(nèi)存的延遲更長(zhǎng),但在整個(gè)系統(tǒng)中實(shí)現(xiàn)扁平化。

PUMA實(shí)現(xiàn)機(jī)箱級(jí)完全集成,可以跨處理元件和內(nèi)存進(jìn)行良好的通信。它旨在擴(kuò)展到大型系統(tǒng),在多個(gè)機(jī)架和多個(gè)集群上使用。

Wang根據(jù)英特爾的內(nèi)部模擬結(jié)果給出了一些初步性能數(shù)據(jù)。他說(shuō):“節(jié)點(diǎn)縮放確實(shí)是一個(gè)關(guān)鍵問(wèn)題。當(dāng)我們討論上萬(wàn)億個(gè)邊緣的時(shí)候,我們知道這些數(shù)字會(huì)變得更大。”為此,Wang報(bào)告了超過(guò)80%的縮放效率。他補(bǔ)充道:“這實(shí)際上讓我們能夠并行化解決圖問(wèn)題的方法?!?/p>

軟件基礎(chǔ)設(shè)施

HIVE的第二階段是構(gòu)建軟件基礎(chǔ)設(shè)施。新軟件不僅必須與新硬件兼容,而且必須與現(xiàn)有CPU和GPU兼容。此外,新軟件必須支持?jǐn)?shù)據(jù)科學(xué)屆使用的大量現(xiàn)有軟件。現(xiàn)有的大量軟件都是為了以某種方式解決特定的圖問(wèn)題而開(kāi)發(fā)的。該計(jì)劃的部分目標(biāo)是能夠?qū)F(xiàn)有的軟件和庫(kù)連接到HIVE軟件框架中,以便使其更易于投入使用。

當(dāng)前的軟件包括通過(guò)API公開(kāi)的算法、數(shù)據(jù)的內(nèi)部圖表示以及硬件后端(GPU、CPU、FPGA或ASIC)。Wang解釋說(shuō),在當(dāng)前平臺(tái)下,必須做出重大取舍,無(wú)論是針對(duì)某種類(lèi)型的硬件進(jìn)行優(yōu)化還是針對(duì)某些算法進(jìn)行優(yōu)化。Wang說(shuō): “如果你專(zhuān)門(mén)從事圖表示,那么你就會(huì)與數(shù)據(jù)科學(xué)生態(tài)系統(tǒng)脫節(jié),因?yàn)槟惚磺袛嗔伺c一些重要庫(kù)的聯(lián)系?!?/p>

作為HIVE第二階段一部分,他們正在開(kāi)發(fā)模塊化架構(gòu)框架?,F(xiàn)有軟件正在重新納入它們的組成部分,以便可以根據(jù)該軟件最佳功能將其插入到框架中。該結(jié)構(gòu)包括Workflow Scheduler和Dispatch Engine,用于把User API負(fù)載任務(wù)路由到后端。他們利用DASK任務(wù)調(diào)度程序來(lái)執(zhí)行此操作。這也是他們進(jìn)行后端切換和調(diào)度的方式。順便說(shuō)一句,值得注意的是,雖然他們正在與英特爾密切合作,共同開(kāi)發(fā)這個(gè)框架,以便能夠通過(guò)PUMA架構(gòu)實(shí)現(xiàn)其性能目標(biāo),但是軟件框架并不是專(zhuān)門(mén)為PUMA設(shè)計(jì)的。事實(shí)上,它們完全針對(duì)廣泛的硬件,以便數(shù)據(jù)科學(xué)家立即能夠跨越CPU、GPU和FPGA,充分利用相同的軟件基礎(chǔ)設(shè)施。并最終使用相同的基礎(chǔ)架構(gòu),利用PUMA圖處理器來(lái)加速相同的負(fù)載。

值得一提的是,如果有必要,在后端,框架可包含一組能夠轉(zhuǎn)換不同格式數(shù)據(jù)的轉(zhuǎn)換器

這種設(shè)計(jì)有兩大好處——集成新硬件意味著設(shè)計(jì)了一個(gè)新的硬件后端,如果數(shù)據(jù)模型與現(xiàn)有模型不同,則添加對(duì)數(shù)據(jù)模型的支持,并添加一個(gè)可以從現(xiàn)有數(shù)據(jù)模型轉(zhuǎn)換到新數(shù)據(jù)模型的轉(zhuǎn)換器。同樣,集成一個(gè)新的User API只需要在其中一個(gè)硬件上添加一個(gè)接口并至少采用一種算法。

最終,HIVE的總體目標(biāo)就是統(tǒng)一和簡(jiǎn)化“讓圖軟件與硬件進(jìn)行優(yōu)化通信的”流程,只需讓硬件廠商提供其硬件并為其集成一個(gè)良好的后端,同時(shí)讓數(shù)據(jù)科學(xué)家能夠通過(guò)自己的API和算法來(lái)充分利用該硬件。

Wang透露,從明年開(kāi)始,用戶(hù)有望看到開(kāi)源的初始源代碼。
責(zé)任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1661

    文章

    22434

    瀏覽量

    637144
  • asic
    +關(guān)注

    關(guān)注

    34

    文章

    1275

    瀏覽量

    124726
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11293

    瀏覽量

    225324
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5213

    瀏覽量

    135616
  • 微處理器
    +關(guān)注

    關(guān)注

    11

    文章

    2431

    瀏覽量

    85945
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    理想汽車(chē)發(fā)布下一代自動(dòng)駕駛基礎(chǔ)模型MindVLA-o1

    2026年3月17日,理想汽車(chē)基座模型負(fù)責(zé)人詹錕出席NVIDIA GTC 2026,發(fā)表主題演講《MindVLA-o1:開(kāi)啟全能范式——下一代統(tǒng)視覺(jué)-語(yǔ)言-動(dòng)作自動(dòng)駕駛大模型探索》,發(fā)布下一代
    的頭像 發(fā)表于 03-18 11:51 ?360次閱讀
    理想汽車(chē)發(fā)布<b class='flag-5'>下一代</b>自動(dòng)駕駛基礎(chǔ)模型MindVLA-o1

    SK海力士在CES 2026展示面向AI的下一代存儲(chǔ)器解決方案

    SK海力士(或‘公司’)6日宣布,公司將于當(dāng)?shù)貢r(shí)間1月6日至9日,在美國(guó)拉斯維加斯舉辦的“CES 2026”威尼斯人會(huì)展中心設(shè)立專(zhuān)屬客戶(hù)展館,并集中展示面向AI的下一代存儲(chǔ)器解決方案。
    的頭像 發(fā)表于 01-08 12:57 ?1849次閱讀

    英飛凌下一代電磁閥驅(qū)動(dòng)器評(píng)估套件使用指南

    英飛凌下一代電磁閥驅(qū)動(dòng)器評(píng)估套件使用指南 引言 作為電子工程師,我們?cè)?b class='flag-5'>開(kāi)發(fā)電磁閥驅(qū)動(dòng)相關(guān)項(xiàng)目時(shí),款好用的評(píng)估套件能大大提高我們的開(kāi)發(fā)效率。英飛凌的
    的頭像 發(fā)表于 12-21 15:50 ?628次閱讀

    英飛凌下一代電磁閥驅(qū)動(dòng)器評(píng)估套件使用指南

    英飛凌下一代電磁閥驅(qū)動(dòng)器評(píng)估套件使用指南 、前言 在電子工程師的日常工作中,電磁閥驅(qū)動(dòng)器的評(píng)估和開(kāi)發(fā)項(xiàng)重要任務(wù)。英飛凌推出的下一代電磁
    的頭像 發(fā)表于 12-21 11:30 ?907次閱讀

    Amphenol 4 端口千兆以太網(wǎng)交換機(jī):適用于下一代無(wú)人機(jī)、機(jī)器人和嵌入式應(yīng)用

    Amphenol 4 端口千兆以太網(wǎng)交換機(jī):適用于下一代無(wú)人機(jī)、機(jī)器人和嵌入式應(yīng)用 在電子工程領(lǐng)域,為下一代無(wú)人機(jī)、機(jī)器人和嵌入式應(yīng)用開(kāi)發(fā)先進(jìn)的網(wǎng)絡(luò)解決方案至關(guān)重要。Amphenol
    的頭像 發(fā)表于 12-10 15:25 ?457次閱讀

    安森美SiC器件賦能下一代AI數(shù)據(jù)中心變革

    安森美(onsemi)憑借其業(yè)界領(lǐng)先的Si和SiC技術(shù),從變電站的高壓交流/直流轉(zhuǎn)換,到處理器級(jí)的精準(zhǔn)電壓調(diào)節(jié),為下一代AI數(shù)據(jù)中心提供了從3kW到25-30kW HVDC的供電全環(huán)節(jié)高能效、高密度
    的頭像 發(fā)表于 10-31 13:47 ?786次閱讀

    Telechips與Arm合作開(kāi)發(fā)下一代IVI芯片Dolphin7

    Telechips宣布,將在與 Arm的戰(zhàn)略合作框架下,正式開(kāi)發(fā)下一代車(chē)載信息娛樂(lè)系統(tǒng)(IVI)系統(tǒng)級(jí)芯片(SoC)“Dolphin7”。
    的頭像 發(fā)表于 10-13 16:11 ?1207次閱讀

    用于下一代 GGE 和 HSPA 手機(jī)的多模式/多頻段功率放大器模塊 skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()用于下一代 GGE 和 HSPA 手機(jī)的多模式/多頻段功率放大器模塊相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊(cè),更有用于下一代 GGE 和 HSPA 手機(jī)的多模式/多頻段功率放大器
    發(fā)表于 09-08 18:33
    <b class='flag-5'>用于</b><b class='flag-5'>下一代</b> GGE 和 HSPA 手機(jī)的多模式/多頻段功率放大器模塊 skyworksinc

    用于下一代 GGE 和 HSPA 手機(jī)的多模/多頻段 PAM skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()適用于下一代 GGE 和 HSPA 手機(jī)的多模/多頻段 PAM相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊(cè),更有適用于下一代 GGE 和 HSPA 手機(jī)的多模/多頻段 PAM的引腳
    發(fā)表于 09-05 18:34
    適<b class='flag-5'>用于</b><b class='flag-5'>下一代</b> GGE 和 HSPA 手機(jī)的多模/多頻段 PAM skyworksinc

    四維新加速打造基于地平線征程6B的下一代輔助駕駛系統(tǒng)

    近日,四維新基于地平線征程6B芯片研發(fā)的下一代輔助駕駛系統(tǒng)方案,已順利完成底層平臺(tái)開(kāi)發(fā),伴隨工程化落地進(jìn)程加速,該方案已正式進(jìn)入到客戶(hù)行泊體量產(chǎn)項(xiàng)目的聯(lián)合研發(fā)階段,并預(yù)計(jì)在2026
    的頭像 發(fā)表于 08-25 17:35 ?1944次閱讀

    安森美攜手英偉達(dá)推動(dòng)下一代AI數(shù)據(jù)中心發(fā)展

    安森美(onsemi,美國(guó)納斯達(dá)克股票代號(hào):ON)宣布與英偉達(dá)(NVIDIA)合作,共同推動(dòng)向800V直流(VDC)供電架構(gòu)轉(zhuǎn)型。這變革性解決方案將推動(dòng)下一代人工智能(AI)數(shù)據(jù)中心在能效、密度及可持續(xù)性方面實(shí)現(xiàn)顯著提升。
    的頭像 發(fā)表于 08-06 17:27 ?1527次閱讀

    主流廠商揭秘下一代無(wú)線SoC:AI加速、內(nèi)存加量、新電源架構(gòu)等

    標(biāo)準(zhǔn)等方面進(jìn)行升級(jí)。 ? 下一代物聯(lián)網(wǎng)產(chǎn)品的新需求 ? 芯科科技無(wú)線產(chǎn)品營(yíng)銷(xiāo)高級(jí)總監(jiān)Dhiraj Sogani在接受采訪時(shí)表示,我們的第一代、第二和第三無(wú)線
    的頭像 發(fā)表于 07-23 09:23 ?6355次閱讀

    下一代高速芯片晶體管解制造問(wèn)題解決了!

    ,10埃)開(kāi)始直使用到A7。 從這些外壁叉片晶體管的量產(chǎn)中獲得的知識(shí)可能有助于下一代互補(bǔ)場(chǎng)效應(yīng)晶體管(CFET)的生產(chǎn)。 目前,領(lǐng)先的芯片制造商——英特爾、臺(tái)積電和三星——正在利用
    發(fā)表于 06-20 10:40

    下一代PX5 RTOS具有哪些優(yōu)勢(shì)

    許多古老的RTOS設(shè)計(jì)至今仍在使用,包括Zephyr(1980年)、Nucleus(1990年)和FreeRTOS(2003年)。所有這些舊設(shè)計(jì)都有專(zhuān)有的API,通常更大、更慢,并且缺乏下一代RTOS的必要安全認(rèn)證和功能。
    的頭像 發(fā)表于 06-19 15:06 ?1138次閱讀

    光庭信息推出下一代整車(chē)操作系統(tǒng)A2OS

    ,正式推出面向中央計(jì)算架構(gòu)、支持人機(jī)協(xié)同開(kāi)發(fā)下一代整車(chē)操作系統(tǒng)A2OS(AI × Automotive OS),賦能下一代域控軟件解決方案的快速研發(fā),顯著提升整車(chē)智能化水平。 A2OS 核心架構(gòu) A2OS采用"軟硬解耦、軟軟解
    的頭像 發(fā)表于 04-29 17:37 ?1425次閱讀
    光庭信息推出<b class='flag-5'>下一代</b>整車(chē)操作系統(tǒng)A2OS