91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何透過(guò)數(shù)字直剖本質(zhì)評(píng)估AI芯片的真實(shí)性能?

地平線HorizonRobotics ? 來(lái)源:地平線HorizonRobotics ? 作者:地平線HorizonRobot ? 2021-05-03 18:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

特斯拉 Hardware 3.0 的效率之謎

特斯拉在其推出的 Hardware 3.0 自動(dòng)駕駛平臺(tái)中,采用自研芯片替代了Nvidia Drive PX2,其理論算力直線提升了 3 倍,而以 MAPS 方式來(lái)評(píng)估,其真實(shí) AI 性能更是驚人的提升了 21 倍。具體而言,Hardware 2.0 時(shí)每秒只能處理 110 幀圖像,而現(xiàn)在則高達(dá) 2300 幀。

那么,Hardware 的效率提升應(yīng)該如何認(rèn)識(shí)呢?在“算力至上”的今天,如何透過(guò)數(shù)字直剖本質(zhì)評(píng)估 AI 芯片的真實(shí)性能?

算力攀升,為什么卻看不到實(shí)用性?

隨著芯片制程技術(shù)的演進(jìn),摩爾定律的發(fā)展卻逐漸進(jìn)入瓶頸期,這與當(dāng)下計(jì)算 AI 計(jì)算需求量爆發(fā)式的增長(zhǎng)顯得格格不入。追求純算力突破并不可持續(xù),同時(shí)算力也并不代表汽車智能芯片“真實(shí)性能”,芯片計(jì)算效率也同樣需要關(guān)注。于是,軟硬結(jié)合、算法加持的 AI 芯片接過(guò)了跑贏新場(chǎng)景的接力棒。

當(dāng)前,行業(yè)普遍以“TOPS”為單位來(lái)評(píng)估AI的理論峰值算力。盡管在目前主流的AI芯片性能基準(zhǔn)測(cè)試( MLPerf )下很多頂級(jí)廠商頻繁刷新榜單記錄,但在實(shí)際場(chǎng)景下的算力有效利用率卻差強(qiáng)人意。

2b80db88-9572-11eb-8b86-12bb97331649.png

人們逐漸認(rèn)識(shí)到,AI 芯片理論峰值算力并不一定能在實(shí)際運(yùn)行中完全釋放。例如,一款擁有理論峰值算力為 16 TOPS 的芯片,在計(jì)算不同模型時(shí)甚至?xí)薪咏?80% 的差異。此外,在卷積神經(jīng)網(wǎng)絡(luò)任務(wù)實(shí)測(cè)中,從 2014 年到 2019 年,最好的神經(jīng)網(wǎng)絡(luò)計(jì)算效率相差了 100 倍,相當(dāng)于計(jì)算效率每 9 個(gè)月翻一倍,遠(yuǎn)快于每 18 個(gè)月翻倍的摩爾定律。因此在模型算法演進(jìn)速度遠(yuǎn)快于芯片性能提升的速度的現(xiàn)在,不僅需要算力更高的芯片,也需要更合理的性能評(píng)估方法幫助用戶選擇適合的 AI 芯片。

對(duì)這些 AI 時(shí)代出現(xiàn)的新變化,以地平線為代表的 AI 芯片企業(yè)認(rèn)為,單純依賴于 PPA 芯片設(shè)計(jì)指標(biāo),很容易陷入算力至上的“誤區(qū)”,但算力并不是完全反應(yīng)芯片性能唯一評(píng)估標(biāo)準(zhǔn)。因此,地平線提出了 MAPS(Mean Accuracy-guaranteed Processing Speed)概念和評(píng)估方法,以此作為檢驗(yàn) AI 性能的真正標(biāo)準(zhǔn)。通俗來(lái)說(shuō),就是在特定的 AI 應(yīng)用領(lǐng)域,看芯片處理 AI 任務(wù)的速度和精度,即“多快”和“多準(zhǔn)”。

MAPS 動(dòng)態(tài)評(píng)估芯片真實(shí) AI 性能

隨著 AI 算法的不斷演進(jìn),幾乎每 10-14 個(gè)月,相同的計(jì)算精度計(jì)算量可以下降一半。這種提升與算法設(shè)計(jì)的精妙程度息息相關(guān),但算法的快速演進(jìn)也對(duì)計(jì)算架構(gòu)提出巨大的挑戰(zhàn),尤其是對(duì)傳統(tǒng)通用的并行架構(gòu)而言,例如亟需高效AI專用處理器的自動(dòng)駕駛場(chǎng)景。

MAPS 其實(shí)是在物理算力的基礎(chǔ)上,通過(guò)對(duì)大量模型的測(cè)試,綜合各個(gè)模型的速度(正比與物理算力*實(shí)際利用率)和準(zhǔn)確率得到的最佳方案的量化結(jié)果。它更聚焦于使用戶能夠通過(guò)可視化的圖表直觀的感知 AI 芯片真實(shí)算力。正如對(duì)于汽車來(lái)說(shuō),馬力(單位: HP)不如百公里加速時(shí)間(單位:秒)更真實(shí)反映整車動(dòng)力性能;算力(單位: TOPS)并不反映汽車智能芯片實(shí)際性能,而每秒準(zhǔn)確識(shí)別幀率 MAPS(單位: FPS)才是更真實(shí)的性能指標(biāo)。

2bb9df64-9572-11eb-8b86-12bb97331649.png

MAPS=最佳模型多邊形面積/(精度上界—精度下界),其中橫軸反應(yīng)幀率,縱軸反應(yīng)精度

此外,在自動(dòng)駕駛中應(yīng)該如何對(duì)速度和精度做取舍呢?現(xiàn)實(shí)生活中我們經(jīng)常遇到一些極端的案例,例如當(dāng)汽車遭遇小孩子橫穿馬路的突發(fā)狀況時(shí),如果自動(dòng)駕駛識(shí)別延時(shí)過(guò)高,會(huì)剎車不及時(shí);如果精度不夠,則會(huì)造成無(wú)法識(shí)別。在很多類似的場(chǎng)景中,我們往往面臨既要“快”,又要兼顧“準(zhǔn)”的境況。而在 MAPS 評(píng)估方法下,我們可以清晰看到幀率和精度之間的動(dòng)態(tài)關(guān)系,這也是其對(duì)實(shí)際場(chǎng)景的重要價(jià)值之一。

更高級(jí)別自動(dòng)駕駛需要多少“FPS”?

軟件定義的汽車的趨勢(shì)下,未來(lái)汽車正逐步成為四個(gè)輪子上的超級(jí)計(jì)算機(jī)??梢郧逦A(yù)見(jiàn)的是,電動(dòng)車賣點(diǎn)不是車,而是「智能」,這是一個(gè)堪比計(jì)算機(jī)誕生級(jí)別的創(chuàng)新。

特斯拉在 Hardware 3.0 中,采用其自研 AI 芯片 FSD Chip 替代了 Hardware 2.5 中的 Nvidia Drive PX2,算力從 24 TOPS 提升到了 72 TOPS,但運(yùn)行同樣模型的精度卻驚人的提升了 21 倍。具體而言,Hardware 2.0 時(shí)每秒只能處理 110 幀圖像,而現(xiàn)在則高達(dá) 2300 幀。除了絕對(duì)算力的提升,額外提升則來(lái)自于利用率的提升。同時(shí)特斯拉也宣布針對(duì) Hardware 3.0 重寫(xiě)自動(dòng)駕駛軟件,從而在 2020 年 10 月推出了 FSD beta,這是唯一不受場(chǎng)地限制、大規(guī)模測(cè)試的自動(dòng)駕駛方案。

特斯拉革命性技術(shù)的重構(gòu)與 MAPS背后體現(xiàn)的理念有相通之處:提升物理算力(HW 3.0 提升 3 倍)、提升利用率(提升近 2 倍),找到最佳的速度和準(zhǔn)確率提升(重寫(xiě)自動(dòng)駕駛軟件),使得特斯拉從簡(jiǎn)單場(chǎng)景的 NOA 一步步突破到不受限的自動(dòng)駕駛。而地平線在芯片設(shè)計(jì)之中一直貫徹 MAPS 背后的技術(shù)理念,關(guān)注提升物理算力的同時(shí)關(guān)注利用率的提升,并且不斷把算法發(fā)展趨勢(shì),使得軟硬件可以協(xié)同共振,發(fā)揮最高效能。

為了助力汽車廠商突破“特斯拉困境”,實(shí)現(xiàn)高級(jí)別自動(dòng)駕駛的落地。地平線即將推出的征程 5 MAPS 整體跑分高達(dá) 3020 FPS,其中 MAPS@COCO (檢測(cè)任務(wù)COCO MAPS) 跑分可高達(dá) 116,而 Nvidia Xavier MAPS@COCO 為 41 FPS (GPU&DLA@32W mode ),如此高的性能將助力車廠加速實(shí)現(xiàn)自動(dòng)駕駛方案的落地。

驅(qū)動(dòng)新基建數(shù)字底座,需要有算力也要有效率。自成立以來(lái),地平線便致力于兼?zhèn)渌懔εc效率的高性能芯片。未來(lái),地平線將推出性能更強(qiáng)大的征程6,其不僅在功耗、面積優(yōu)化的基礎(chǔ)上,同時(shí)在MAPS上繼續(xù)提升一個(gè)數(shù)量級(jí),助力全行業(yè)共同努力進(jìn)一步大幅提升自動(dòng)駕駛的安全性。

原文標(biāo)題:不看算力看效率,更高級(jí)別的自動(dòng)駕駛需要多少 “FPS”?

文章出處:【微信公眾號(hào):地平線HorizonRobotics】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 特斯拉
    +關(guān)注

    關(guān)注

    66

    文章

    6413

    瀏覽量

    131391
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39911

    瀏覽量

    301550
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    794

    文章

    14892

    瀏覽量

    180079

原文標(biāo)題:不看算力看效率,更高級(jí)別的自動(dòng)駕駛需要多少 “FPS”?

文章出處:【微信號(hào):horizonrobotics,微信公眾號(hào):地平線HorizonRobotics】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    如何評(píng)估憶聯(lián)Gen5 eSSD UH812a在AI場(chǎng)景中的性能表現(xiàn)

    隨著AI大模型進(jìn)入萬(wàn)億參數(shù)時(shí)代,傳統(tǒng)存儲(chǔ)性能測(cè)試已難以真實(shí)反映存儲(chǔ)系統(tǒng)在實(shí)際訓(xùn)練場(chǎng)景中對(duì)成本與效率的核心影響。為此,全球權(quán)威AI基準(zhǔn)測(cè)評(píng)組織MLCommons正式推出MLPerf St
    的頭像 發(fā)表于 02-05 09:56 ?1078次閱讀
    如何<b class='flag-5'>評(píng)估</b>憶聯(lián)Gen5 eSSD UH812a在<b class='flag-5'>AI</b>場(chǎng)景中的<b class='flag-5'>性能</b>表現(xiàn)

    RK3576 能否替代 RK3588?一文看懂 6TOPS 工業(yè) AI SoC 的真實(shí)性能差距與選型邏輯

    + 6TOPS NPU ,那 RK3576 是否可以替代 RK3588??jī)r(jià)格更低、功耗更低,是不是更合適批量落地?真實(shí)性能差距到底有多大? 如果你也有這些疑問(wèn),本篇文章一次性講清楚,不玩虛的——我們直接逐項(xiàng)拆解,并在每段加入性能差異百分比,讓你快速看懂差異有多大,選型不
    的頭像 發(fā)表于 01-23 16:22 ?514次閱讀
    RK3576 能否替代 RK3588?一文看懂 6TOPS 工業(yè) <b class='flag-5'>AI</b> SoC 的<b class='flag-5'>真實(shí)性能</b>差距與選型邏輯

    探索RTDTTP4200W066A:4.2kW數(shù)字無(wú)橋圖騰柱PFC評(píng)估板的卓越性能

    探索RTDTTP4200W066A:4.2kW數(shù)字無(wú)橋圖騰柱PFC評(píng)估板的卓越性能 在電力電子領(lǐng)域,高效的功率因數(shù)校正(PFC)技術(shù)一是研究和應(yīng)用的熱點(diǎn)。今天,我們將深入探討Rene
    的頭像 發(fā)表于 12-26 16:00 ?436次閱讀

    如何專業(yè)評(píng)估UPS電源的性能與架構(gòu):一份面向決策者的終極指南

    在關(guān)鍵業(yè)務(wù)運(yùn)營(yíng)中,選擇一臺(tái)合適的UPS電源(不間斷電源)是一項(xiàng)具有長(zhǎng)期影響的技術(shù)決策。面對(duì)紛繁的產(chǎn)品參數(shù)與營(yíng)銷話術(shù),技術(shù)決策者常感到困惑:究竟如何穿透表象,評(píng)估UPS電源的真實(shí)性能與架構(gòu)價(jià)值?本文
    的頭像 發(fā)表于 12-11 08:38 ?365次閱讀
    如何專業(yè)<b class='flag-5'>評(píng)估</b>UPS電源的<b class='flag-5'>性能</b>與架構(gòu):一份面向決策者的終極指南

    一文理解模數(shù)轉(zhuǎn)換器中的有效位數(shù)

    隨著測(cè)量精度要求提升,有效位數(shù)(ENOB)已成為評(píng)估ADC、數(shù)字示波器真實(shí)性能的核心指標(biāo)。ENOB由IEEE定義,綜合了噪聲、抖動(dòng)、非線性失真等誤差,反映設(shè)備在實(shí)際使用中的“有效分辨率”。
    的頭像 發(fā)表于 10-09 11:01 ?3141次閱讀
    一文理解模數(shù)轉(zhuǎn)換器中的有效位數(shù)

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

    和探索;人類級(jí)別的理解能力;常識(shí)推理;現(xiàn)實(shí)世界的知識(shí)整合。 3、測(cè)試時(shí)計(jì)算 測(cè)試時(shí)計(jì)算(TTC)是指在模型推理階段利用額外的計(jì)算資源來(lái)提升泛化性能。 4、具身智能與滲透式AI 1)具身智能對(duì)AGI的意義
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用

    主要步驟: ①溯因②假說(shuō)③實(shí)驗(yàn) 1、科學(xué)推理的類型 ①演繹②歸納 2、自動(dòng)化科學(xué)發(fā)現(xiàn)框架 AI-笛卡兒-----自動(dòng)化科學(xué)發(fā)現(xiàn)框架,利用數(shù)據(jù)和知識(shí)來(lái)生成和評(píng)估候選的科學(xué)假說(shuō)。 4項(xiàng)規(guī)則:三、直覺(jué)
    發(fā)表于 09-17 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+第二章 實(shí)現(xiàn)深度學(xué)習(xí)AI芯片的創(chuàng)新方法與架構(gòu)

    的同時(shí),能夠利用更小、更快的數(shù)字格式,提升模型的整體性能。 1.3Transformer 模型中的矩陣乘法計(jì)算 2、存內(nèi)計(jì)算AI芯片 存內(nèi)計(jì)算已經(jīng)成為應(yīng)對(duì)大模型不斷增加的計(jì)算量和能耗
    發(fā)表于 09-12 17:30

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片的需求和挑戰(zhàn)

    的工作嗎? 從書(shū)中也了解到了AI芯片都有哪些?像CPU、GPU、FPGA、ASIC都是AI芯片。 其他的還是知道的,F(xiàn)PGA屬于AI
    發(fā)表于 09-12 16:07

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+可期之變:從AI硬件到AI濕件

    的不同。隨著AI熱潮的興起,大腦的抽象模型已被提煉成各種的AI算法,并使用半導(dǎo)體芯片技術(shù)加以實(shí)現(xiàn)。 而大腦是一個(gè)由無(wú)數(shù)神經(jīng)元通過(guò)突觸連接而成的復(fù)雜網(wǎng)絡(luò),是極其復(fù)雜和精密的。大腦在本質(zhì)
    發(fā)表于 09-06 19:12

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+內(nèi)容總覽

    AI芯片:科技探索與AGI愿景》這本書(shū)是張臣雄所著,由人民郵電出版社出版,它與《AI芯片:前沿技術(shù)與創(chuàng)新未來(lái)》一書(shū)是姊妹篇,由此可見(jiàn)作者在AI
    發(fā)表于 09-05 15:10

    AI 芯片浪潮下,職場(chǎng)晉升新契機(jī)?

    芯片設(shè)計(jì)為例,從最初的架構(gòu)選型,到算法適配、性能優(yōu)化,每個(gè)環(huán)節(jié)都考驗(yàn)著工程師的專業(yè)素養(yǎng)。在設(shè)計(jì)一款面向智能安防領(lǐng)域的 AI 芯片時(shí),需要深入研究安防場(chǎng)景下圖像識(shí)別算法的特點(diǎn),針對(duì)性地
    發(fā)表于 08-19 08:58

    【書(shū)籍評(píng)測(cè)活動(dòng)NO.64】AI芯片,從過(guò)去走向未來(lái):《AI芯片:科技探索與AGI愿景》

    名單公布 @LiuDW、@jinglixixi、@bruceleesohu 請(qǐng)于9月3日前,前往【書(shū)籍評(píng)測(cè)活動(dòng)NO.64】《AI芯片:科技探索與AGI愿景》完成書(shū)籍兌換。 如有疑問(wèn)請(qǐng) 添加小助手微信
    發(fā)表于 07-28 13:54

    Splashtop 成功入選 TrustRadius Trusted Seller 榜單,以透明與真實(shí)引領(lǐng)遠(yuǎn)程連接

    近日,全球權(quán)威技術(shù)評(píng)測(cè)平臺(tái)TrustRadius基于企業(yè)產(chǎn)品信息真實(shí)性、用戶反饋?lái)憫?yīng)效率及商業(yè)道德實(shí)踐等維度,正式公布「TrustedSeller」榜單。Splashtop憑借其在產(chǎn)品信息透明度
    的頭像 發(fā)表于 05-14 17:36 ?854次閱讀
    Splashtop 成功入選 TrustRadius Trusted Seller 榜單,以透明與<b class='flag-5'>真實(shí)</b>引領(lǐng)遠(yuǎn)程連接

    是德科技推出AI數(shù)據(jù)中心構(gòu)建器以驗(yàn)證和優(yōu)化網(wǎng)絡(luò)架構(gòu)和主機(jī)設(shè)計(jì)

    ·?通過(guò)模擬真實(shí)工作負(fù)載驗(yàn)證AI基礎(chǔ)設(shè)施的性能 ·?通過(guò)評(píng)估新算法、組件或協(xié)議提高AI訓(xùn)練的性能
    的頭像 發(fā)表于 04-10 08:50 ?657次閱讀