91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使具有AI功能的開關(guān)芯片產(chǎn)品多樣化需要多長時間?

我快閉嘴 ? 來源:半導(dǎo)體行業(yè)觀察 ? 作者:半導(dǎo)體行業(yè)觀察 ? 2020-10-28 14:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

長期以來人們一直對晶圓級架構(gòu)持懷疑態(tài)度,這種懷疑可以追溯到幾十年前。出于商業(yè)或技術(shù)原因,僅有少數(shù)人做過相關(guān)嘗試,但他們都毫不例外地失敗了,當(dāng)中包括著名的Gene Amdah)。但是,除了適當(dāng)建立的半導(dǎo)體技術(shù)基礎(chǔ)之外,也許還缺少合適的時機(jī)。

如果您問Andrew Feldman,為什么晶圓級方法不那么普遍,他的回答很簡單:他在Cerebras Systems的團(tuán)隊是唯一弄清楚如何真正做到這一點(diǎn)的人。在他看來,沒有人能夠或?qū)⒁獓L試這個,至少短期內(nèi)不會。

“我認(rèn)為沒有人能做到。我們花了五年的時間,我們還擁有龐大的專利產(chǎn)品組合。AI這一工作量將占總計算量的約三分之一。如果您看一下Google,他們已經(jīng)完成了大部分工作,看起來像是AI工作負(fù)載。此外,用于解決AI問題的計算量正以驚人的速度增長。在接下來的三到五年中,數(shù)據(jù)中心中的更多工作將是AI或類似AI的工作,更多的難題將圍繞如何在數(shù)據(jù)中尋找見解。”

如果我們巧妙地越過專利組合的那薄弱的威脅,以及它對 Cerebras 的可能性證明所鼓舞的潛在初創(chuàng)公司意味著什么,那么還會出現(xiàn)其他一些問題。首先,為什么以前沒有這項工作,其次,如果現(xiàn)在可能的話,為什么專業(yè)人士不這樣做呢?

“我們觀察了1984年Amdahl所做的晶圓級芯片,事實是,人們對此記憶猶新的的是芯片是如此之大,但他們其實從未真正看過它。當(dāng)時我們的行業(yè)還不那么成熟,所以肯定圍繞芯片制造工藝。但自那時以來,我們已經(jīng)制造了成千上萬的芯片。流程和體系結(jié)構(gòu)要好得多。我們?yōu)榫A規(guī)模選擇了一種架構(gòu),但Gene Amdahl沒有。我們試圖采用他喜歡的架構(gòu)并將其推廣到晶圓級。

他繼續(xù)說道:“我們能夠利用我們的架構(gòu)設(shè)計芯片并物理現(xiàn)實。我們要做的一件事是用超過40萬個相同的塊構(gòu)建重復(fù)的圖塊設(shè)計。如果發(fā)生故障,我們可以解決。這是一個新發(fā)現(xiàn),它是如何結(jié)合已知的事實,即存在缺陷的已知事實。這不是新事物;DRAM將位單元的行和列放在一邊,這就是他們獲得高良率的方式。但是直到我們這樣做之前,沒有人使用計算機(jī)來做到這一點(diǎn)?!?/p>

訣竅可能是做到這一點(diǎn)并擁有一個功能齊全、高效的系統(tǒng),但是,您不能只出售獨(dú)立的設(shè)備,并不是每個芯片制造商都希望負(fù)擔(dān)(盡管Nvidia的DGX機(jī)器可能反映出不同的東西)。從編譯器到冷卻的完整堆棧是唯一有意義的方法。這正是Feldman的公司Cerebras Systems正在推廣其CS-1系統(tǒng)的原因。回想一下,Cerebras今年通過其Wafer Scale Engine方法應(yīng)用于AI獲得了一些動力,特別是在以研究為中心的站點(diǎn)上進(jìn)行了安裝,包括Lawrence Livermore國家實驗室,Argonne國家實驗室和匹茲堡超級計算中心。很難說出它們可能在企業(yè)或超大規(guī)模系統(tǒng)中的位置,但就目前而言,即使在純AI訓(xùn)練和推理之外。

我們必須假設(shè)英特爾和Nvidia的大量研究預(yù)算至少使該主題有了一些想法,尤其是在看到Cerebras證明了這一概念之后。也許他們確實找到了使所有片上電路都變得更重要的方法,更重要的是,編譯器成功地解決了這一問題,并發(fā)現(xiàn)盡管實用,但從經(jīng)濟(jì)上講不合算。也許那是因為您不能僅僅構(gòu)建要在2020-2025年的晶圓級游戲中使用的設(shè)備:整個系統(tǒng)必須以人類已知的最復(fù)雜的代碼簽名練習(xí)之一來構(gòu)建。大多數(shù)芯片制造商和加速器初創(chuàng)公司都不希望(或?qū)嶋H上不能)從事系統(tǒng)業(yè)務(wù),并且該設(shè)備的集成也不是典型的集成過程。

具有大量內(nèi)核且可以超快速度通信的芯片有很多機(jī)會,而這些都不是新鮮事物。除了AI,HPC領(lǐng)域(包括計算流體動力學(xué))具有廣泛的商業(yè)價值,適合大規(guī)模使用信號處理等工作。開關(guān)芯片的想法更加萌芽,如果該行業(yè)已經(jīng)在使用一些最大的硅片,那么在更廣泛的可行范圍內(nèi),它可以輕松地改變晶片規(guī)模。那只是近期。我們甚至可以更進(jìn)一步,提出一個系統(tǒng)的概念,該系統(tǒng)將晶圓級引擎與裸露在機(jī)架上的硅光子相連,能夠保持涼爽并真正處理大量工作負(fù)載,而無需離開設(shè)備或橫向擴(kuò)展而無需全部多余的熱量和性能損失。但這是另一個長遠(yuǎn)的故事。

對于石油和天然氣以及超級計算級科學(xué)法規(guī)中HPC等高價值應(yīng)用領(lǐng)域,新架構(gòu)的挑戰(zhàn)始終是相同的。這些代碼基本上是一成不變的,只有最近才可以從GPU加速中受益。但是,對于那些愿意大力投資的人來說,人工智能的故事顯而易見。我們從未能夠了解晶圓級方法的成本,以及與使用相同晶圓進(jìn)行切片和切塊以單獨(dú)出售的方式有何不同。使所有部件連接起來的所有額外網(wǎng)絡(luò)可能會帶來可觀的成本開銷。

對于那些定義狹窄的應(yīng)用程序集,是否有足夠的市場需要解決,以使所有這些都值得呢?以及其中一家開關(guān)芯片制造商和集成商得到暗示并為其工程購買Cerebras以及使具有AI功能的開關(guān)芯片產(chǎn)品多樣化需要多長時間?

“如果您看一下Nvidia和Intel的研究,他們正在發(fā)表論文說無法做到。我們解決了70年來一直未解決的問題。這些擁有數(shù)萬名工程師的巨型公司一直說這是不可能的,而我們位于洛斯阿爾托斯(Los Altos)房地產(chǎn)市場的小團(tuán)隊做到了。他的斷言是,由于天生缺乏技術(shù),大公司沒有追求晶圓規(guī)模。“ Nvidia和其他公司知道更大的芯片更適合這種工作負(fù)載。如果您從2013年開始繪制GPU的圖表,它的大小將增加一倍以上。為什么?因為他們知道更大的籌碼會更好。但是他們不知道怎么做,仍然不知道,是如何變得大50到60倍,這就是我們所做的?!彼a(bǔ)充道。

即使可以甚至確實存在硅片規(guī)模,也無論如何都無法解決所有問題。但是對于需要小型,密集計算和低功耗,低延遲和超高帶寬的大規(guī)模通信的AI工作負(fù)載,這種方法很有意義。盡管其他加速器和基于加速器的系統(tǒng)提供了此功能,但仍然存在外部網(wǎng)絡(luò)無法解決的問題。

但是,如果晶圓級的概念被證明是有效的,我們是否可以看到其他初創(chuàng)公司采用類似的方法?對自己的工廠進(jìn)行嚴(yán)格控制的公司可以輕松實現(xiàn)這一飛躍。Feldman說,他們之所以沒有這樣做,是因為他們不知道如何做,但他們這樣做的原因可能更加復(fù)雜,并且與關(guān)注點(diǎn),半導(dǎo)體經(jīng)濟(jì)和需求有關(guān)。如果是這樣,他們將不得不用一種價格便宜的產(chǎn)品來應(yīng)對潛在的市場嗎?例如,考慮到像英特爾這樣的擁有全部網(wǎng)絡(luò),晶圓廠和市場專業(yè)知識的公司并沒有走這條路,那么,肯定有些事情要么不值得努力,要么根本無法完成。

那么,要回答標(biāo)題中的問題,是否有至少一個或兩個以上的初創(chuàng)公司,也許還有一個專業(yè)進(jìn)入該行業(yè)的晶圓級芯片行業(yè) ?也許。這就是為什么我們保持密切關(guān)注Cerebras機(jī)器的原因。不僅是為了查看它是否有效,還在于編程模型如何運(yùn)行以及它是否真的可以承擔(dān)起不僅僅限于AI的任務(wù)。

如上所述,基于大型晶圓的 機(jī)架和硅光子技術(shù)相結(jié)合的系統(tǒng)的未來發(fā)展并非無道理,這種技術(shù)可以解決熱量問題,并具有可分割,可擴(kuò)展且在合理的功率預(yù)算內(nèi)的真實通信。然后事情就變得有趣了,特別是如果魔術(shù)編譯器可以真正地在HPC和大規(guī)模分析中使用并行代碼以及AI工作負(fù)載演變成的任何東西。
責(zé)任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    463

    文章

    54054

    瀏覽量

    466832
  • 晶圓
    +關(guān)注

    關(guān)注

    53

    文章

    5418

    瀏覽量

    132378
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5206

    瀏覽量

    135595
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40041

    瀏覽量

    301695
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    芯源低功耗的MCU最高頻率是多少?待機(jī)功耗最少多少?長待機(jī)一般多長時間?

    芯源低功耗的MCU最高頻率是多少?待機(jī)功耗最少多少?長待機(jī)一般多長時間?
    發(fā)表于 11-14 07:29

    電能質(zhì)量在線監(jiān)測裝置的抗干擾能力驗證需要多長時間

    電能質(zhì)量在線監(jiān)測裝置的抗干擾能力驗證時間需結(jié)合實驗室精準(zhǔn)測試、現(xiàn)場工況驗證和長期穩(wěn)定性觀察綜合確定,通常需3.5 個月至 6 個月,具體時間取決于驗證深度、測試資源和是否需整改。以下是分階段的時間
    的頭像 發(fā)表于 11-09 17:13 ?1200次閱讀

    廣州唯創(chuàng)電子WT588F02B-16S-C008功能拓展語音芯片:高品質(zhì)播放、多樣化顯示與存儲功能一應(yīng)俱全

    、多樣化顯示功能和靈活存儲于一體,為各行業(yè)產(chǎn)品升級提供了理想解決方案。一、高品質(zhì)語音播放,還原真實音質(zhì)WT588F02B-16S-C008采用先進(jìn)的語音編解碼技術(shù),能夠
    的頭像 發(fā)表于 10-24 08:42 ?493次閱讀
    廣州唯創(chuàng)電子WT588F02B-16S-C008<b class='flag-5'>功能</b>拓展語音<b class='flag-5'>芯片</b>:高品質(zhì)播放、<b class='flag-5'>多樣化</b>顯示與存儲<b class='flag-5'>功能</b>一應(yīng)俱全

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)

    AI的應(yīng)用多種多樣。比如:DALL-E2、Midjourney、Stable Diffusion等,不僅包括對話功能,還包括生成圖像、視頻、語音和程序代碼等功能。 竟然連代碼都可以生成
    發(fā)表于 09-12 16:07

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+可期之變:從AI硬件到AI濕件

    保持停滯的情況下,依照目前計算機(jī)的能耗效率,至少還需要30年的努力才接近其水準(zhǔn),見圖1所示。 圖1 大腦與計算機(jī)的能量效率對比 圖2 類腦芯片的前瞻性研究領(lǐng)域AI濕件 為此,一些想法超前的科學(xué)家
    發(fā)表于 09-06 19:12

    iTOF技術(shù),多樣化的3D視覺應(yīng)用

    and 應(yīng)用場景, 飛行時間 (TOF) 傳感器三大三大三維傳感技術(shù)中,在不同領(lǐng)域的功能和商業(yè)場景的實現(xiàn)越來越多。它們用于各種專業(yè)應(yīng)用,為最終用戶提供高效、安全的環(huán)境并節(jié)省勞動力
    發(fā)表于 09-05 07:24

    復(fù)位引腳保持低電平邏輯以觸發(fā)MCU復(fù)位需要多長時間?

    復(fù)位引腳保持低電平邏輯以觸發(fā)MCU復(fù)位需要多長時間?
    發(fā)表于 08-25 06:16

    請問復(fù)位引腳保持低電平邏輯以觸發(fā)MCU復(fù)位需要多長時間

    復(fù)位引腳保持低電平邏輯以觸發(fā)MCU復(fù)位需要多長時間?
    發(fā)表于 08-21 06:01

    中國EDA產(chǎn)業(yè)自主:道阻且長,行則將至

    的Mentor Graphics(現(xiàn)為Siemens EDA)這三大巨頭壟斷。中國芯片產(chǎn)業(yè)的崛起,使得EDA工具的自主可控成為國家戰(zhàn)略層面的重要議題。那么,中國通過自己培養(yǎng)人才、發(fā)展本土產(chǎn)品來取代國際EDA巨頭的產(chǎn)品與服務(wù),究竟
    發(fā)表于 06-04 14:04 ?4864次閱讀
    中國EDA產(chǎn)業(yè)自主<b class='flag-5'>化</b>:道阻且長,行則將至

    9160 gps 定位需要多長時間呢?

    nRF9160 在 GNSS(GPS)聯(lián)網(wǎng)獲取定位時,所需時間主要取決于“首次定位時間”(Time To First Fix, TTFF)。在典型的冷啟動(無輔助數(shù)據(jù)、無歷史信息)下,nRF9160
    發(fā)表于 05-27 23:02

    適配多種系統(tǒng),米爾瑞芯微RK3576核心板解鎖多樣化應(yīng)用

    米爾電子發(fā)布的基于瑞芯微 RK3576 核心板和開發(fā)板,具備高性能數(shù)據(jù)處理能力、領(lǐng)先的AI智能分析功能、多樣化的顯示與操作體驗以及強(qiáng)大的擴(kuò)展性與兼容性,適用于多種應(yīng)用場景。目前米爾電子為
    發(fā)表于 05-23 16:07

    米爾RK3576核心板適配多種系統(tǒng),解鎖多樣化應(yīng)用

    米爾電子發(fā)布的基于瑞芯微RK3576核心板和開發(fā)板,具備高性能數(shù)據(jù)處理能力、領(lǐng)先的AI智能分析功能多樣化的顯示與操作體驗以及強(qiáng)大的擴(kuò)展性與兼容性,適用于多種應(yīng)用場景。目前米爾電子為RK3576
    的頭像 發(fā)表于 05-23 08:03 ?1617次閱讀
    米爾RK3576核心板適配多種系統(tǒng),解鎖<b class='flag-5'>多樣化</b>應(yīng)用

    寒武紀(jì)思元370芯片參數(shù)特性詳解

    寒武紀(jì)首次采用chiplet技術(shù)將2顆AI計算芯粒封裝為一顆AI芯片,通過不同芯粒組合規(guī)格多樣化產(chǎn)品,為用戶提供適用不同場景的高性價比
    的頭像 發(fā)表于 04-24 17:49 ?5496次閱讀
    寒武紀(jì)思元370<b class='flag-5'>芯片</b>參數(shù)特性詳解

    滿足多樣化需求的 MCX 連接器解決方案

    面對多樣化的市場需求,MCX 連接器充分發(fā)揮自身優(yōu)勢,為不同行業(yè)量身定制適配的解決方案。展望未來,隨著科技的持續(xù)創(chuàng)新與進(jìn)步,MCX 連接器必將繼續(xù)在各個領(lǐng)域發(fā)揮重要作用,以其可靠的性能為科技發(fā)展注入強(qiáng)勁動力,推動各行業(yè)邁向新的高度。
    的頭像 發(fā)表于 04-02 13:54 ?733次閱讀
    滿足<b class='flag-5'>多樣化</b>需求的 MCX 連接器解決方案

    S32K322 MCU上的BIST通常需要多長時間?

    BIST 通常需要多長時間?它會增加啟動時間嗎?另外,此 MCU 的啟動時間通常是多少?
    發(fā)表于 04-02 06:05