91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

風(fēng)靡全球的AI,到底還缺少了拿些部分

454398 ? 來源:ST社區(qū) ? 作者:ST社區(qū) ? 2022-12-26 09:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來源:ST社區(qū)

關(guān)于人工智能(AI)的報導(dǎo)一直不絕于耳。過去幾年來,幾乎每個月(有時甚至是每周)都會有一款現(xiàn)有或新創(chuàng)公司的全新AI處理器推出市場。

然而,懸而未決的問題是:為什么有這么多的AI處理器?每一款A(yù)I芯片的設(shè)計是為了解決哪些問題?更重要的是,當(dāng)今的AI版圖中還缺少哪些部份?

Tirias Research首席分析師Kevin Krewell直截了當(dāng)?shù)卣f,“AI帶來了一種新典范,并改變了整個計算機(jī)系統(tǒng)?!爆F(xiàn)有企業(yè)和新創(chuàng)公司都在爭奪仍處于混亂中的“AI就緒”(AI-ready)計算領(lǐng)域。

以色列Hailo是一家為“邊緣設(shè)備深度學(xué)習(xí)”打造專用芯片的新創(chuàng)公司,今年6月宣布完成1,250萬美元的A輪融資。Hailo的目標(biāo)在于“為任何產(chǎn)品帶來智能”(to bring intelligence to any product)。因此,Hailo首席執(zhí)行官Orr Danon最近呼吁“徹底重新設(shè)計計算機(jī)架構(gòu)的支柱——內(nèi)存、控制和計算以及其間的關(guān)系?!?/p>

這是一個值得稱道的目標(biāo)。然而,Hailo既不打算透露其架構(gòu)細(xì)節(jié)——Danon僅表示“可能就在今年底”,其首款A(yù)I處理器最快也要到2019年上半年后才會正式推出。

Danon認(rèn)為,目前還沒有一家自動駕駛車(AV)供應(yīng)商能在無數(shù)的新一代AI處理器中找到適用于其自動駕駛車的芯片。

汽車領(lǐng)域正是Hailo看好其新款A(yù)I處理器得以發(fā)揮的直接目標(biāo)市場。Danon指出,當(dāng)今的測試自動駕駛車實際上都在公共道路上行駛,車后行李箱中還配置了一個數(shù)據(jù)中心。他說,為了填補(bǔ)這些測試車和自動駕駛車(必須為大量部署而打造)之間的巨大鴻溝,一線(tier one)和汽車OEM需要一種全新的AI處理器,協(xié)助其更有效率地執(zhí)行相同的深度學(xué)習(xí)任務(wù)。

Hailo為此整理了目前每一款A(yù)I處理器的每瓦(W)深度學(xué)習(xí)TMACS。該公司與《EE Times》的讀者分享的重點在于深入探討:自動駕駛車產(chǎn)業(yè)在多大程度上仍無法獲得推動高度自動駕駛車所需的高效能AI處理器。

業(yè)界分析師和其他AI新創(chuàng)公司高層也針對目前在AI發(fā)展道路上的重大障礙發(fā)表看法。

現(xiàn)代CPU架構(gòu)并不適用于AI

大多數(shù)業(yè)界觀察家一致認(rèn)為,目前基于馮·諾依曼(von Neumann)架構(gòu)的CPU處理器無法有效因應(yīng)當(dāng)今的AI處理任務(wù)。

The Linley Group首席分析師Linley Gwennap指出,“Von Neumann不適用于AI?!彼忉屨f,每一次的計算都必須擷取并譯碼指令,以及收集并儲存數(shù)據(jù)于緩存器檔案中。 “為了提高每瓦計算效能,你必須執(zhí)行更多的計算和更少的擷取任務(wù)?!?/p>

Krewell同意這一看法。他說:“Von Neumann架構(gòu)極其適于控制和循序計算:‘If-Then-Else’操作。相形之下,神經(jīng)網(wǎng)絡(luò)就像圖形一樣,是高度平行的,而且依賴于內(nèi)存帶寬的處理。試圖用CPU擴(kuò)展神經(jīng)網(wǎng)絡(luò)是相當(dāng)昂貴的(包括功耗和成本)?!?/p>

Danon說:“盡管Von Neumann架構(gòu)和現(xiàn)代CPU一般都非常靈活,但在很多情況下,這種靈活性并不是必要的?!彼m用于神經(jīng)網(wǎng)絡(luò)和其他操作,例如,為未來的許多周期預(yù)先確定行為。在這種情況下,他指出,設(shè)計系統(tǒng)的更有效方法是“避免以讀取指令來指導(dǎo)每個周期的系統(tǒng)行為。保持每個周期改變元素行為的靈活度非常重要?!?/p>

在Danon看來,“神經(jīng)網(wǎng)絡(luò)將這一概念推向了極致?!Y(jié)構(gòu)’——決定操作數(shù)素之間連接性——確定整個會話的行為(又稱‘計算圖形’)?!焙喲灾?,AI社群需要的不是基于Von Neumann架構(gòu)的處理器,而是“善于描述神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的特定處理器”。

重新關(guān)注數(shù)據(jù)流架構(gòu)

由于CPU和GPU的深度學(xué)習(xí)性能無法滿足需求,引發(fā)業(yè)界積極尋找基于數(shù)據(jù)流(dataflow)架構(gòu)的新解決方案。但為什么是數(shù)據(jù)流?

根據(jù)Gwenapp的說法,業(yè)界希望進(jìn)行更多的計算和更少的擷取,首先嘗試開發(fā)寬的單指令/多數(shù)據(jù)(SIMD)架構(gòu)?!暗悄阒荒軐⒕彺嫫鳈n案做得很寬?!睒I(yè)界很快地發(fā)現(xiàn),該解決方案是“直接自動地將數(shù)據(jù)從計算單元移動到計算單元”。他說,“這是一種稱為數(shù)據(jù)流的通用方法,可以大幅降低von Neumann的開銷?!?/p>

不久前才收購MIPS的Wave Computing,是一家利用數(shù)據(jù)流技術(shù)的AI新創(chuàng)公司。根據(jù)該公司首席執(zhí)行官Derek Meyer表示,Wave Computing設(shè)計了一款新的處理單元,“可以原生支持Google TensorFlow和微軟(Microsoft)的CNTK”。

Danon坦承Hailo的新款A(yù)I處理器也屬于架構(gòu)的“數(shù)據(jù)流系列”。他解釋說,數(shù)據(jù)流“通常更適合深度學(xué)習(xí)”,因為“用于計算的大多數(shù)參數(shù)都不需要移動。相反地,它們用于描述數(shù)據(jù)流動時的圖形?!?/p>

Krewell指出,數(shù)據(jù)流的概念并不是什么新鮮事兒,也已經(jīng)成功地在通用計算機(jī)硬件實現(xiàn)商用化了。

但是,隨著AI改變計算領(lǐng)域,數(shù)據(jù)流正在尋找機(jī)器學(xué)習(xí)的“新機(jī)遇”。Krewell補(bǔ)充說:“透過使用數(shù)據(jù)流和脈動數(shù)組架構(gòu),您可以將神經(jīng)網(wǎng)絡(luò)處理設(shè)計為從一分層到另一分層,而無需太多控制邏輯?!?/p>

這種新轉(zhuǎn)折可說是Wave Computing的天賜良機(jī)。該新創(chuàng)公司自2010年以來一直在利用其于數(shù)據(jù)流技術(shù)方面的專業(yè)知識以及建立專利組合,積極地專注于機(jī)器和深度學(xué)習(xí)。

內(nèi)存帶寬面臨瓶頸

AI——特別是卷積神經(jīng)網(wǎng)絡(luò)(CNN),似乎非常適合數(shù)據(jù)流設(shè)計。但是,Gwenapp強(qiáng)調(diào),這并不表示所有的數(shù)據(jù)流設(shè)計都對AI有利,“系統(tǒng)中還存在著其他瓶頸,如內(nèi)存帶寬。”

業(yè)界開始看到這樣的暗示:內(nèi)存導(dǎo)向的裝置是客制深度學(xué)習(xí)硬件的未來。例如,新創(chuàng)公司Mythic瞄準(zhǔn)了將神經(jīng)網(wǎng)絡(luò)映像到NOR內(nèi)存數(shù)組。該公司將“內(nèi)存處理器”(processor-in-memory;PIM)架構(gòu)用于AI,使其芯片得以在閃存中儲存并處理神經(jīng)網(wǎng)絡(luò)權(quán)重,而其結(jié)果(最終和中間)則儲存在SRAM中。因為這樣的內(nèi)存數(shù)組無需將數(shù)據(jù)移入和移出外部內(nèi)存,所以,Mythic承諾將在其芯片中實現(xiàn)性能/功耗的巨大進(jìn)展。

Mythic的設(shè)計概念當(dāng)然具有吸引力,特別是當(dāng)大多數(shù)芯片設(shè)計者試圖提高內(nèi)存帶寬時,一般都采用可能造成破壞的方法。然而,Danon抱持謹(jǐn)慎看法,他表示還不確定Mythic的內(nèi)存處理器芯片能否正常運作,但很可能“將技術(shù)推得太遠(yuǎn)了”。

Danon說,目前更實際和更現(xiàn)實的方法是“共同定位內(nèi)存和計算”?!拔覀冃枰層嬎憬Y(jié)構(gòu)能以高利用率存取所需的內(nèi)存,從而產(chǎn)生非常高的帶寬?!彼a(bǔ)充說,這對于實現(xiàn)操作數(shù)素的高利用率至關(guān)重要。

Krewell則解釋,“一些挑戰(zhàn)是在訓(xùn)練期間保持權(quán)重。這就是像GraphCore在芯片上打造大型內(nèi)存的原因。”他并補(bǔ)充說:“這也就是為什么GPU和英特爾(Intel)的Nervana使用高帶寬內(nèi)存(HBM)、Wave Computing使用美光(Micron) Hypercube內(nèi)存的原因?!?/p>

除了TPU,如何調(diào)整軟件和硬件?

Danon表示,Google經(jīng)由其Tensor處理器,“展示了一種樣板”,用于從頭開始設(shè)計高效率的架構(gòu),并針對推論任務(wù)進(jìn)行了優(yōu)化。這是個大好消息。然而,壞消息是,如果客戶想要使用除了TensorFlow之外的深度學(xué)習(xí)架構(gòu)呢?

在這種情況下,他們就需要翻譯。雖然許多新興工具,包括ONNX,都用于翻譯幾個AI架構(gòu),但Danon解釋說,在此過程中,即使內(nèi)容不會在翻譯中完全遺失,計算也可能變得“非常低效”。他指出,產(chǎn)生這種困境的原因在于,以簡潔方式描述問題的神經(jīng)網(wǎng)絡(luò)“結(jié)構(gòu)”必須轉(zhuǎn)換為von Neumann架構(gòu)的通用處理器所使用的一系列規(guī)則操作。

Danon指出,當(dāng)今的AI處理器在軟件和硬件之間缺乏一致性。他說,在理想情況下,軟件和硬件二者都使用基于結(jié)構(gòu)的描述方法。Hailo計劃將本機(jī)描述為“神經(jīng)網(wǎng)絡(luò)分層”,從而使其處理器有別于其他處理器。

Danon解釋說,Hailo的目標(biāo)“有點類似于匯編語言本身能夠在基于規(guī)則的系統(tǒng)中描述規(guī)則一樣——條件敘述和分支的形式。”

實現(xiàn)更高每瓦性能的競賽

深度學(xué)習(xí)性能效率是AI處理器競爭對手之間經(jīng)常引爆的一場大辯論。在英偉達(dá)(Nvidia)和英特爾/Mobileye之間,兩家競爭對手的高層還公開爭辯其于Xavier SoC和EyeQ5的主張。

Hailo根據(jù)每家供應(yīng)商發(fā)布的數(shù)據(jù),編制了一份AI處理器比較表——從Nvidia的Volta V100、Pascal P4和Google TPU,到GraphCore IPU和Wave Computing DPU,詳細(xì)列出每家供應(yīng)商的深度學(xué)習(xí)tera級每秒乘積累加(TMAC)計算和功耗資料。Hailo的目標(biāo)是為每個AI處理器計算深度學(xué)習(xí)的每瓦TMACS。Hailo并觀察到當(dāng)前的AI處理器可達(dá)到每瓦低于0.1TMACS的效能,而在使用批處理方法時可能略高于此。

Danon以處理高清(HD)視頻為例指出,如果車輛以每秒30格(30f/s)的速度接收全高清(FHD)視訊,并使用ResNet50網(wǎng)絡(luò)進(jìn)行深度學(xué)習(xí)。處理FHD視頻串流通常需要每個傳感器約5TMACS。根據(jù)自動駕駛的等級,一般汽車預(yù)計將配備4到12個攝像頭傳感器。

這意味著部署在自動駕駛車的任何現(xiàn)有AI處理器已經(jīng)讓每個傳感器消耗約幾十瓦功耗,或每輛汽車幾百瓦了。Danon認(rèn)為這已經(jīng)超出太多了?;蛘撸麘岩?,如果OEM無力應(yīng)付這么多的電力浪費,他們別無選擇,最終將只能在性能上大幅妥協(xié)。

理論上,“相較于傳統(tǒng)的von Neumann處理器,精心設(shè)計的CNN加速器應(yīng)該能達(dá)到更高數(shù)十倍的每瓦性能”。但是,Gwenapp說:“即便采用這種方法也不足以滿足4/5級自動駕駛車的挑戰(zhàn)性要求。”

換句話說,盡管市場上充斥過多的AI處理器,但沒有一款能夠達(dá)到讓全自動駕駛車實現(xiàn)商用化可行的性能標(biāo)準(zhǔn)。

但Gwennap仍抱持樂觀看法。“幸運的是,我們還處于AI競賽的早期階段。預(yù)計在未來十年內(nèi)將能在硬件和軟件方面看到大幅的進(jìn)展?!?/p>

審核編輯黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40065

    瀏覽量

    301708
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    論馬斯克的預(yù)言:AI使人類邊緣化

    ,人類的情感、創(chuàng)造力和復(fù)雜決策能力等仍是AI難以企及的。 社會治理與倫理約束方面:隨著AI的發(fā)展,全球各地也在加強(qiáng)對AI的監(jiān)管,如歐盟AI
    發(fā)表于 03-14 05:27

    使用NORDIC AI的好處

    Nordic 的 Edge AI 主要有以下幾個好處(基于官方資料總結(jié)): 極低功耗、延長電池壽命 在本地運行 AI,減少無線傳輸次數(shù),而無線收發(fā)是最耗電的部分。設(shè)備只需上傳“結(jié)果/事件”,而不是
    發(fā)表于 01-31 23:16

    SeaVerse發(fā)布全球首個AI Native平臺,“All in AI Native”引領(lǐng)AI創(chuàng)作前瞻革命

    2026年1月10日,SeaVerse宣布全球發(fā)布SeaVerse AI平臺。這是全球首個AI原生的創(chuàng)建和部署平臺,集合大語言模型、圖像生成、視頻生成、Agent等多方面的能力,通過全
    的頭像 發(fā)表于 01-14 17:41 ?1295次閱讀

    何同學(xué)“AI尋牛”硬件激發(fā)創(chuàng)意,2025 SparkS全球AI硬件創(chuàng)新大賽啟動

    11月18日杭州,“2025 SparkS全球AI硬件創(chuàng)新大賽”正式啟動。大賽是由屬地政府和杭州市人才集團(tuán)、杭創(chuàng)(人工智能)營、涂鴉智能等聯(lián)合打造的高能級賽事,依托杭州市AI產(chǎn)業(yè)高地、杭創(chuàng)(人工智能
    的頭像 發(fā)表于 11-19 18:01 ?1220次閱讀
    何同學(xué)“<b class='flag-5'>AI</b>尋?!庇布ぐl(fā)創(chuàng)意,2025 SparkS<b class='flag-5'>全球</b><b class='flag-5'>AI</b>硬件創(chuàng)新大賽啟動

    都在說“AI+”,可AI+到底加的是什么?

    最近幾年,“AI+”這個詞幾乎無處不在。AI+制造、AI+教育、AI+醫(yī)療、AI+交通、AI+能
    的頭像 發(fā)表于 10-10 14:50 ?1097次閱讀

    除了算法,算力和數(shù)據(jù),AI生長離不開它?

    AI
    腦極體
    發(fā)布于 :2025年09月26日 15:23:54

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學(xué)應(yīng)用

    靈感的過程中發(fā)揮關(guān)鍵作用。五、用AI實現(xiàn)諾貝爾獎級別的科學(xué)發(fā)現(xiàn) 這想法這能夠大膽的。 1、AI科學(xué)家的構(gòu)建 全自主科學(xué)實驗室需要哪些部分: ①自動實驗設(shè)備 ②流程管理系統(tǒng) ③數(shù)據(jù)處理和分析系統(tǒng) ④微
    發(fā)表于 09-17 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)

    AI的應(yīng)用多種多樣。比如:DALL-E2、Midjourney、Stable Diffusion等,不僅包括對話功能,包括生成圖像、視頻、語音和程序代碼等功能。 竟然連代碼都可以生成,會取代程序員
    發(fā)表于 09-12 16:07

    IEC 到底是什么?為什么它能影響全球?

    IEC 到底是什么?為什么它能影響全球
    的頭像 發(fā)表于 09-04 17:07 ?3653次閱讀

    睿海光電800G光模塊助力全球AI基建升級

    全球數(shù)字化轉(zhuǎn)型加速的背景下,超高速光模塊作為數(shù)據(jù)中心與AI算力網(wǎng)絡(luò)的核心部件,正經(jīng)歷從400G向800G、1.6T的迭代浪潮。在這一賽道中,深圳市睿海光電科技有限公司(以下簡稱“睿海光電”)憑借
    發(fā)表于 08-13 19:05

    睿海光電領(lǐng)航AI光模塊:超快交付與全場景兼容賦能智算時代——以創(chuàng)新實力助力全球客戶構(gòu)建高效算力底座

    一、AI算力革命催生光模塊新需求,睿海光電以技術(shù)優(yōu)勢搶占制高點 人工智能、超大規(guī)模數(shù)據(jù)中心和云計算的高速發(fā)展,對光模塊的傳輸效率、兼容性及交付周期提出更高要求。作為全球AI光模塊領(lǐng)域的領(lǐng)軍企業(yè)
    發(fā)表于 08-13 19:03

    Arm如何應(yīng)對復(fù)雜的全球AI監(jiān)管

    發(fā)布的《人工智能就緒指數(shù)報告》中《人工智能法規(guī)、監(jiān)管和全球趨勢》一章,由 Arm 全球政府事務(wù)主管 Vince Jesaitis 執(zhí)筆,從安全性與合規(guī)性視角出發(fā),剖析如何應(yīng)對復(fù)雜的全球 AI
    的頭像 發(fā)表于 06-26 09:42 ?895次閱讀

    RTsmart源碼編譯錯誤,提醒我缺少文件導(dǎo)致make失敗,為什么?

    出現(xiàn) 不理解,之前都是不會出現(xiàn)這種錯誤的,懷疑是源碼拉取缺少了部分文件 不僅如此,編譯了YOLO的可執(zhí)行文件也無法實現(xiàn),提醒VICAP初始化失敗超時,打不開標(biāo)簽文件,模型無效,我沒有改過YOLO部分代碼
    發(fā)表于 06-20 06:25

    2.0.0版本的ST Edge AI Core在linux平臺上可以把量化后的onnx模型轉(zhuǎn)換為.nb,但是運行報錯,缺少文件,為什么?

    2.0.0版本的ST Edge AI Core工具在linux平臺上應(yīng)該是可以把量化后的onnx模型轉(zhuǎn)換為.nb,但是運行報錯,缺少文件。
    發(fā)表于 06-17 06:29

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    AI的演進(jìn)正在逼近“終端智能涌現(xiàn)”的拐點,從通用模型向場景落地遷移成為關(guān)鍵議題。聯(lián)發(fā)科以“AI隨芯,應(yīng)用無界”為主題召開天璣開發(fā)者大會2025(MDDC 2025),不僅聚合了全球生態(tài)資源,
    發(fā)表于 04-13 19:52