91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

芯片架構(gòu)師需要思考的一些問題

sakobpqhz ? 來源:半導(dǎo)體行業(yè)觀察 ? 作者:半導(dǎo)體行業(yè)觀察 ? 2022-11-04 11:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

我們認為半導(dǎo)體世界中的許多事情是理所當然的,但如果幾十年前做出的某些決定不再可行或最優(yōu)了,我們應(yīng)該怎么辦?我們看到了一個使用 finFET 的小例子,平面晶體管將不再擴展。今天,我們面臨著幾個更大的破壞,這些破壞將產(chǎn)生更大的連鎖反應(yīng)。

技術(shù)通常以線性方式發(fā)展。每一步都提供了對以前存在的增量改進,或者克服了一些新的挑戰(zhàn)。這些挑戰(zhàn)來自新節(jié)點、新物理效果或限制等。雖然這非常有效,而且許多單獨的步驟都很出色,但它建立在紙牌屋的基礎(chǔ)上,如果基礎(chǔ)上的某些東西從根本上來說變化,整個設(shè)計、實現(xiàn)和驗證的連鎖反應(yīng)可能非常顯著。

01單個連續(xù)內(nèi)存

這些更改之一已經(jīng)進行了一段時間。1945 年首次描述的馮諾依曼處理器架構(gòu),具有單一的連續(xù)內(nèi)存空間,是絕對的突破。它提供了一個圖靈完備的解決方案,可以解決任何有限問題。這成為幾乎所有計算機的實際架構(gòu)。

內(nèi)存很快成為了大小和性能方面的限制。為了克服這個問題,引入了緩存以使廉價的大容量內(nèi)存看起來像更昂貴、更快的內(nèi)存。隨著時間的推移,這些緩存變得多級,跨多個主機連貫,并在越來越大的地址空間上工作。

但這不再是許多現(xiàn)代計算功能的要求。在基于對象的軟件功能和特定領(lǐng)域計算的時代,對內(nèi)存組織的需求可能是有害的。它基于這樣一個前提,即程序可以隨機訪問它想要的任何東西——安全專家希望這不是真的。

必須充分考慮緩存和一致性的全部成本?!霸谛酒袑崿F(xiàn)一致性是復(fù)雜且昂貴的,” Imperas Software的創(chuàng)始人兼首席執(zhí)行官 Simon Davidmann 說?!爱斈M行多級緩存時,內(nèi)存層次結(jié)構(gòu)變得越來越復(fù)雜,并且越來越充滿錯誤,并且消耗越來越多的功率。”

當任務(wù)很好理解時,可以避免這種開銷?!霸跀?shù)據(jù)流引擎中,一致性不那么重要,因為您將在邊緣移動的數(shù)據(jù)直接從一個加速器傳送到另一個加速器,” Arteris IP的研究員兼系統(tǒng)架構(gòu)師 Michael Frank 說?!叭绻銓?shù)據(jù)集進行分區(qū),一致性就會成為障礙,因為它會花費你額外的周期。您必須使用查找表。您必須提供更新信息。”

面向?qū)ο笙到y(tǒng)的采用,以及限制類型轉(zhuǎn)換的強類型語言和對程序員的一些限制,可以使執(zhí)行流程可預(yù)測并避免對單個連續(xù)內(nèi)存空間的需求。諸如在圖形和機器學(xué)習中發(fā)現(xiàn)的任務(wù)在有限的內(nèi)存塊上運行,并且不會從復(fù)雜的內(nèi)存管理或?qū)?nèi)存的硬件控制中受益。

特定領(lǐng)域的計算正在導(dǎo)致人們重新考慮這方面的許多方面?!袄?,DSP 傾向于提供分布式內(nèi)存池,通常直接在軟件中管理,” Arm研發(fā)團隊的高級首席研究工程師 Matt Horsnell 說?!芭c傳統(tǒng)的共享內(nèi)存系統(tǒng)相比,這可能更適合專門應(yīng)用程序的帶寬要求和訪問模式。這些處理器通常通過提供對特定訪問模式(例如,N 緩沖、FIFO、行緩沖區(qū)、壓縮等)的直接支持來提供某種形式的內(nèi)存專業(yè)化?!?/p>

02新的內(nèi)存類型

改變內(nèi)存架構(gòu)有很大的影響?!疤魬?zhàn)在于,在過去,人們有一個很好的抽象模型來思考計算系統(tǒng),” Rambus的研究員和杰出發(fā)明家 Steven Woo 說?!八麄儚膩頉]有真正考慮過存儲。它最初是免費出現(xiàn)的,而編程模型只是讓你在引用內(nèi)存時,它就發(fā)生了。你永遠不必明確說明你在做什么。隨著摩爾定律的放緩和功率縮放的停止,人們開始意識到有很多新的存儲可以進入方程式。但要讓它們真正有用,你必須擺脫我們過去擁有的非常抽象的觀點。”

第二個相關(guān)的變化是通過新的內(nèi)存技術(shù)實現(xiàn)的。長期以來,SRAM 和 DRAM 都針對速度、密度和性能進行了優(yōu)化。但是 DRAM 的擴展已經(jīng)停滯不前,而且 SRAM 受到最新節(jié)點的可變性的影響,因此難以保持密度?;诓煌锢硖匦缘男聝?nèi)存類型最終可能會更好,但這可能不是主要好處。

例如,如果采用ReRAM,存儲單元本質(zhì)上就會變成模擬的,這就開辟了許多可能性。Mythic 負責產(chǎn)品和業(yè)務(wù)開發(fā)的高級副總裁 Tim Vehling 說:“模擬的一個基本理念是,您實際上可以在存儲單元本身中進行計算?!?“你實際上消除了整個內(nèi)存移動問題,因此功率大幅下降。當模擬發(fā)揮作用時,您可以進行高效的計算和很少的數(shù)據(jù)移動。借助模擬內(nèi)存計算技術(shù),它的能效實際上比數(shù)字等效技術(shù)高出幾個數(shù)量級?!?/p>

這與機器學(xué)習所需的乘法/累加函數(shù)完全一致?!皥?zhí)行這些 MAC 操作所消耗的能量是巨大的,”西門子 EDA產(chǎn)品經(jīng)理 Sumit Vishwakarma 說?!?a href="http://www.makelele.cn/tags/神經(jīng)網(wǎng)絡(luò)/" target="_blank">神經(jīng)網(wǎng)絡(luò)有權(quán)重,這些權(quán)重存在于內(nèi)存中。他們必須不斷地訪問內(nèi)存,這是一項非常耗能的任務(wù)。計算能力是傳輸數(shù)據(jù)所需能力的十分之一。為了解決這個問題,公司和大學(xué)正在研究模擬計算,它將權(quán)重存儲在內(nèi)存中?,F(xiàn)在我只需要輸入一些輸入并得到一個輸出,這基本上是這些權(quán)重與我的輸入的乘積。”

當模擬和數(shù)字解耦時,模擬電路不再受阻。Semtech 信號完整性解決方案集團營銷和應(yīng)用副總裁 Tim Vang 說:“我們可以設(shè)計模擬電路,在某些情況下提供與數(shù)字等效甚至更好的功能,而且我們可以在較舊的節(jié)點上做到這一點?!?“成本可以更低,因為我們不需要所有的數(shù)字功能,因此芯片尺寸可以更小。我們可以降低功耗,因為我們沒有那么多功能?!?/p>

當內(nèi)存發(fā)生變化時,軟件堆棧中的所有內(nèi)容都會受到影響。Synopsys產(chǎn)品營銷總監(jiān) Prasad Saggurti 說:“通常會發(fā)生一種算法,我們看到了一種優(yōu)化它的方法,優(yōu)化內(nèi)存,以便更好地實現(xiàn)算法?!?“另一方面,我們擁有這些不同類型的內(nèi)存。你能改變你的算法來利用這些新的記憶嗎?過去,使用 TCAM 主要是一種網(wǎng)絡(luò)域結(jié)構(gòu)來查找 IP 地址。最近,ML 訓(xùn)練引擎開始使用 TCAM。這需要根據(jù)可用存儲器的類型來改變軟件或固件。”

03CMOS 的終結(jié)

但到目前為止,最大的潛在變化是 CMOS 的終結(jié)。隨著器件變得更小,摻雜的控制變得具有挑戰(zhàn)性,這會導(dǎo)致器件閾值電壓的顯著變化。摻雜定義了器件的極性,例如器件是 PMOS 還是 NMOS,正是這些器件的配對創(chuàng)建了 CMOS 結(jié)構(gòu),這是創(chuàng)建的所有數(shù)字功能的基礎(chǔ)。隨著行業(yè)向全柵 finFET 結(jié)構(gòu)遷移,出現(xiàn)了一種新的可能性。

“使用水平堆疊的納米線,您實際上可以構(gòu)建具有兩個柵極的晶體管,”洛桑聯(lián)邦理工學(xué)院電氣工程和計算機科學(xué)教授 Giovanni De Micheli 在 DAC 2022 主題演講中說?!澳闶褂玫诙€柵極來極化晶體管并使晶體管成為 P 或 N 晶體管(見圖 1)。你會得到一個更強大的晶體管,因為它創(chuàng)建了一個比較器而不是一個開關(guān)?,F(xiàn)在,有了這些類型的設(shè)備,您就可以擁有全新的拓撲結(jié)構(gòu)。”

0e2df980-5bf0-11ed-a3b6-dac502259ad0.jpg

圖 1. GAA 極性門的 3-D 概念圖。資料來源:Michele De Marchi 論文,EPFL,2015

理論上,這可以通過將極性門一分為二來進一步實現(xiàn)。除了是 p 型或 n 型之外,這將增加每個晶體管也成為高或低閾值電壓器件的能力。因此,每個晶體管在運行期間都可以具有不同的功率/性能特性。

讓我們回到邏輯抽象?!皫资陙?,我們一直在用 NAND 和 NOR 設(shè)計數(shù)字電路,”De Micheli 說?!盀槭裁??因為我們一開始就被洗腦了,因為在CMOS中那是最方便的實現(xiàn)。但是,如果您從多數(shù)邏輯的角度思考(見圖 2),您就會意識到這是進行加法和乘法運算的關(guān)鍵運算符。今天,我們?yōu)闄C器學(xué)習實現(xiàn)的所有電路,其中的主要部分就是進行加法或乘法運算。這就是為什么多數(shù)是極其重要的。此外,多數(shù)邏輯是超導(dǎo)體、光學(xué)技術(shù)、內(nèi)存中的非易失性邏輯等許多技術(shù)的自然模型?!?/p>

0e4d07b2-5bf0-11ed-a3b6-dac502259ad0.jpg

圖 2. 基于極性門器件的新邏輯元件。資料來源:De Micheli/EPFL

De Micheli 的研究表明,采用多數(shù)邏輯設(shè)計的電路可以使用今天略微修改的 EDA 工具將延遲減少 15% 到 20%。

但這些類型的變化確實需要對綜合和其他步驟進行重大重新思考。Synopsys 的技術(shù)策略師 Rob Aitken 說:“如果這被證明是一個很有前途的載體,你真的需要徹底重新考慮合成引擎?!?“許多新設(shè)備不會有效地采用 NAND/NOR 電路并從中構(gòu)建東西,而是將本機調(diào)整為 XOR、多數(shù)門或其他一些邏輯功能。會發(fā)生什么?綜合關(guān)注您正在構(gòu)建的基本事物,雖然它過于簡單化,但邏輯綜合需要一個 PLA,然后將其折疊成一個多層次的對象。以不同的邏輯風格重新思考很重要?!?/p>

改變基本的晶體管功能對流程的許多方面都有重大影響。例如,設(shè)備現(xiàn)在有四個或五個終端,而不是三個,這會對布局和布線產(chǎn)生什么影響?它將如何影響扇入扇出和擁塞?

04結(jié)論

改變是困難的。一項有前途的技術(shù)必須克服現(xiàn)有技術(shù)數(shù)十年的優(yōu)化,這會帶來巨大的慣性挑戰(zhàn)。它還可能需要同時更改解決方案的許多部分,例如硬件和軟件,或整個實現(xiàn)鏈中的工具。但隨著該行業(yè)接近半導(dǎo)體的一些基本物理極限,它需要變得更加靈活并愿意改變。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    463

    文章

    54083

    瀏覽量

    467198
  • 半導(dǎo)體
    +關(guān)注

    關(guān)注

    339

    文章

    30871

    瀏覽量

    265096
  • 內(nèi)存
    +關(guān)注

    關(guān)注

    9

    文章

    3215

    瀏覽量

    76409

原文標題:芯片架構(gòu)師需要思考的一些問題

文章出處:【微信號:算力基建,微信公眾號:算力基建】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    高通Oryon架構(gòu)之父宣布離職:曾手定義移動芯片黃金時代

    披露具體離職原因。作為高通自研 CPU 架構(gòu) Oryon 的靈魂人物,他的離職不僅標志著高通個技術(shù)周期的完成,也引發(fā)了業(yè)界對后 Oryon 時代移動芯片格局的深度討論。 ? 作為擁有30余年行業(yè)經(jīng)驗的頂尖
    的頭像 發(fā)表于 02-05 13:44 ?3146次閱讀

    在并聯(lián)使用MOS存在一些問題,要怎樣做才能避免這些問題?

    在并聯(lián)使用MOS存在一些問題,那我們要怎樣做才能避免這些問題? 首先,器件的致性定要好。 在功率MOSFET多管并聯(lián)時,器件內(nèi)部參數(shù)的微小差異就會引起并聯(lián)各支路電流的不平衡而導(dǎo)致單管過流損壞。 其次是功率。如果功率高于25%
    發(fā)表于 12-10 08:19

    關(guān)于六類網(wǎng)線一些問題的解答

    今天我們就圍繞網(wǎng)友一些常見的關(guān)于六類網(wǎng)線的問題進行下匯總式解答: 問 六類網(wǎng)線可以當電源用嗎? 答 六類網(wǎng)線并不是設(shè)計用于傳輸電力的電纜,因此般不建議將其用于電源傳輸。 盡管六類網(wǎng)線的線芯可以
    的頭像 發(fā)表于 12-09 11:13 ?641次閱讀

    對浮點指令擴展中一些問題的解決與分享

    出現(xiàn)無法寫的情況。 結(jié)論 以上就是我們組在擴展浮點指令中出現(xiàn)的一些問題,這些問題總體上歸結(jié)于對蜂鳥的代碼沒有整體性的把握,對內(nèi)容的掌握程度還不夠。在后續(xù)的工作中應(yīng)注意理清功能的整體架構(gòu)而對所有的相關(guān)部分進行修改。
    發(fā)表于 10-24 11:47

    蜂鳥E203的浮點指令集F的一些實現(xiàn)細節(jié)

    降低功耗,因此如果多個IP核運算周期設(shè)計的不致,如乘法兩個周期,加法個周期時,注意需要讓乘法模塊的clken多延時個周期。而為了節(jié)省片上面積且改善時序,我們參考了
    發(fā)表于 10-24 08:57

    極海MCU的ISP和IAP中程序跳轉(zhuǎn)運行問題分析

    最近在調(diào)試程序的程序升級方式,遇到了不少的問題,本篇筆記記錄下遇到的一些問題及在這個過程中的一些問題思考。
    的頭像 發(fā)表于 10-10 14:31 ?3566次閱讀
    極海MCU的ISP和IAP中程序跳轉(zhuǎn)運行問題分析

    在TR組件優(yōu)化與存算架構(gòu)中構(gòu)建技術(shù)話語權(quán)

    需要掌握HBM2e接口協(xié)議 類腦計算要求理解脈沖神經(jīng)網(wǎng)絡(luò)(SNN) 光子計算涉及硅基光電子集成技術(shù) 參與某國家級AI芯片項目的團隊透露,核心研發(fā)人員均具備\"處理器架構(gòu)師\"
    發(fā)表于 08-26 10:40

    求助,關(guān)于TC387使能以及配置SOTA 中一些問題求解

    你好, 之前我拿到貴司給個demo,里面有一些使能以及配置SWAP的代碼, 這里有些疑問 問題1. 判斷SOTA功能是否生效,demo中使用的是 SCU_STMEM1中的bit位, 代碼如下
    發(fā)表于 08-08 07:31

    射頻工程需要知道的一些常見轉(zhuǎn)接頭

    ,是由于轉(zhuǎn)接頭的損壞造成的,而且有些接頭的連接固定的方式不對,每次修好的儀器,過去后客戶又按照他們原來的方式去擰緊了。特別是在一些生產(chǎn)型的企業(yè),由于操作人員流動性比較
    的頭像 發(fā)表于 08-06 17:39 ?1284次閱讀
    射頻工程<b class='flag-5'>師</b><b class='flag-5'>需要</b>知道的<b class='flag-5'>一些</b>常見轉(zhuǎn)接頭

    Tenstorrent 首席架構(gòu)師:未來 RISC-V 會是計算機的主流

    強,適合定制化需求等。在 7 月 17 日第五屆(2025)RISC-V 中國峰會的主論壇上,Tenstorrent 首席架構(gòu)師 Wei-Han Lien 表示,Tenstorrent 投入了大量人力
    發(fā)表于 07-17 11:26 ?1508次閱讀

    關(guān)于芯片設(shè)計的一些基本知識

    芯片的設(shè)計理念眾所周知,芯片擁有極為復(fù)雜的結(jié)構(gòu)。以英偉達的B200芯片為例,在巴掌大的面積上,塞入了2080億個晶體管。里面的布局,堪稱個異次元空間級的迷宮。英偉達B200
    的頭像 發(fā)表于 06-11 12:16 ?1306次閱讀
    關(guān)于<b class='flag-5'>芯片</b>設(shè)計的<b class='flag-5'>一些</b>基本知識

    有償請教容性負載的放大電路的一些問題

    兩端的二極管反向偏置的作用是幫助釋放掉由于buffer跟隨器的輸入偏置電流導(dǎo)致的電荷累積(論文中提到的),但是我的二極管起不到釋放電荷的作用,就導(dǎo)致Cp兩端剛開始就會有一些直流電,目前我是需要用萬用表
    發(fā)表于 05-29 20:06

    在FX2LP USB上配置GPIF中斷時遇到一些問題,求解決

    你好,我在 FX2LP USB 上配置 GPIF 中斷時遇到一些問題。 我啟用了 INT4 中斷并從 GPIF 中選擇了源 INT4,然后啟用了 GPIF 完成中斷,但我看不到中斷 4 工作。 我該如何做呢?
    發(fā)表于 05-06 08:00

    調(diào)試ADPD188芯片的過程中用I2C調(diào)試過程出現(xiàn)一些問題,求解決

    我在調(diào)試ADPD188芯片的過程中用I2C調(diào)試過程出現(xiàn)一些問題,參考官方提供的代碼調(diào)試中發(fā)現(xiàn),初始化過不去,抓取波形發(fā)現(xiàn)芯片型號對不上了,從芯片外觀看ADPD188bi這個
    發(fā)表于 04-16 06:57

    使用RTD5.0.0的s32k312,C40_Ip擦除pflash存在一些問題求解決

    我正在使用 RTD5.0.0 的 s32k312,C40_Ip擦除 pflash 存在一些問題: Erase block0(0x420000-0x500000) failed
    發(fā)表于 04-11 06:53