91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

特斯拉的自動(dòng)駕駛標(biāo)注員正在被DOJO超算取代

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚(yáng) ? 2022-08-25 08:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))這年頭不少車企都開始自主研發(fā)自動(dòng)駕駛系統(tǒng),連帶部署數(shù)據(jù)中心和超算已經(jīng)不是什么新鮮事了。除了特斯拉的DOJO和GPU超算以外,小鵬也在本月宣布與阿里云合作搭建了全國最大的自動(dòng)駕駛智算中心“扶搖”,算力可達(dá)600PFLOPS,看來新一輪的軍備競賽很快就會(huì)拉開帷幕。

對于自動(dòng)駕駛的開發(fā)來說,模型訓(xùn)練至關(guān)重要,尋常的服務(wù)器CPU基本無法滿足這個(gè)負(fù)載需求,所以不少車企都在借助英偉達(dá)的GPU開展訓(xùn)練,特斯拉也不例外。正巧今年的Hot Chips大會(huì)上安排了三場特斯拉的分享,都與特斯拉的AI與DOJO平臺(tái)有關(guān),特斯拉的幾位自動(dòng)駕駛與AI部門負(fù)責(zé)人也都透露了他們在軟硬件上的一些進(jìn)展,就當(dāng)是作為下個(gè)月底特斯拉AI日的前瞻了。

DOJO超算

特斯拉的DOJO是他們自研自用的機(jī)器學(xué)習(xí)超級(jí)計(jì)算機(jī),采用了高度可擴(kuò)展而且完全分布式的系統(tǒng),對神經(jīng)網(wǎng)絡(luò)訓(xùn)練負(fù)載進(jìn)行了專門的優(yōu)化,支持靈活適應(yīng)新的算法和應(yīng)用。根據(jù)特斯拉Autopilot硬件工程師Emil Talpes的說法,DOJO從設(shè)計(jì)之初就是為了大型系統(tǒng)設(shè)計(jì)的,而不是基于目前已有的商用小系統(tǒng),再把規(guī)模做大。

DOJO的基礎(chǔ)組成部分,就是它的D1裸片。D1基于臺(tái)積電7nm工藝,單個(gè)裸片面積占645mm2。大家都知道蘋果M1 Ultra的die size相當(dāng)大,可哪怕是M1 Ultra的單個(gè)裸片大小也只有432mm2。D1采用了極度模塊化的設(shè)計(jì),每個(gè)D1上共有354個(gè)DOJO處理單元,而且以2D陣列的形式物理和邏輯排布,單個(gè)D1在2GHz下的算力可達(dá)362TFLOPS。
CleanShot 2022-08-24 at 03.30.16@2x
DOJO訓(xùn)練模塊 / 特斯拉

由5x5排布的25個(gè)合格D1芯片(KGD)組成了一個(gè)DOJO訓(xùn)練模塊,整個(gè)模塊從電、熱、機(jī)械結(jié)構(gòu)上都是完全集成在一起的,模塊水平層面負(fù)責(zé)不同模塊之間的通信,而垂直層面則解決15kW的供電和散熱問題。

整個(gè)DOJO系統(tǒng)就是由DOJO訓(xùn)練模塊按2D網(wǎng)格結(jié)構(gòu)排列而成,網(wǎng)格邊緣配置了DOJO接口處理器(DIP)來提供共享內(nèi)存支持。而本屆Hot Chips上,特斯拉終于放出了這一處理器的詳細(xì)情報(bào)。
CleanShot 2022-08-24 at 03.28.07@2x
DOJO接口處理器 / 特斯拉

表面看上去,DIP像是一張PCIe卡,而它實(shí)際上使用的也確實(shí)是32GB/s的PCIe 4.0接口,配有32GB的HBM內(nèi)核,提供800GB/s的總內(nèi)存帶寬。但這PCIe 4.0的接口只是用于連接主機(jī),真正發(fā)揮其性能的是特斯拉自研的TTP協(xié)議接口,提供900GB/s的超大帶寬給訓(xùn)練模塊。

訓(xùn)練模塊的邊緣配置了5個(gè)DIP卡,如此一來每邊都提供了160GB的共享DRAM,并通過這5張卡實(shí)現(xiàn)4.5TB/s的最大帶寬。要想擴(kuò)展網(wǎng)絡(luò)通信的話,比如SmartNIC或交換機(jī),DIP也原生硬件支持標(biāo)準(zhǔn)以太網(wǎng)上的TTP通信,當(dāng)然了選擇這種通信方式的話帶寬也會(huì)降低至50GB/s,延遲也會(huì)增加。

整個(gè)系統(tǒng)即一個(gè)ExaPOD,由10個(gè)機(jī)柜,超過100萬片D1 CPU組成,算力可達(dá)1.1EFLOPS。而這樣的算力為特斯拉帶來了前所未有的訓(xùn)練性能,尤其是在自動(dòng)標(biāo)注上。

被機(jī)器取代的人工標(biāo)注員

雖然是特斯拉本身的商用車走的純視覺方案,但特斯拉路測車隊(duì)并不局限于提供視頻片段,畢竟去年就有人發(fā)現(xiàn)特斯拉的路測車輛頂著激光雷達(dá)在收集數(shù)據(jù)。在特斯拉路測車隊(duì)提交的片段中,除了視頻數(shù)據(jù)以外,還有IMU、GPS和測距儀等傳感器給出的數(shù)據(jù)。

這些數(shù)據(jù)經(jīng)過離線神經(jīng)網(wǎng)絡(luò)后,根據(jù)汽車行駛軌跡進(jìn)行靜態(tài)世界重構(gòu),同時(shí)根據(jù)移動(dòng)物體和動(dòng)力學(xué)對物體進(jìn)行自動(dòng)標(biāo)注。特斯拉可以自行選擇需要進(jìn)行標(biāo)注的片段,比如查詢可視條件不佳下的最近車輛,系統(tǒng)會(huì)自動(dòng)返回這些片段然后進(jìn)行自動(dòng)標(biāo)注。再加上特斯拉的4D標(biāo)注,也就是在標(biāo)注一次后,同時(shí)標(biāo)注所有相機(jī)中的多幀畫面,極大地加快了標(biāo)注速度。根據(jù)特斯拉的說法,他們可以在一周之內(nèi)收集并自動(dòng)標(biāo)注1萬個(gè)片段。
CleanShot 2022-08-24 at 03.31.48@2x
人工標(biāo)注與自動(dòng)標(biāo)注的占比變化 / 特斯拉
這也就是特斯拉引入DOJO超算的原因,雖然標(biāo)注的工作量在不斷提升,但隨著機(jī)器學(xué)習(xí)硬件資源的增多,手動(dòng)標(biāo)注的占比越來越低,而自動(dòng)標(biāo)注開始占據(jù)主導(dǎo),這或許才是為何特斯拉標(biāo)注團(tuán)隊(duì)開始裁員的真相。

仍在繼續(xù)擴(kuò)大規(guī)模的GPU超算

DOJO作為一個(gè)純CPU的超算系統(tǒng),能做到以上已經(jīng)相當(dāng)厲害了,然而我們也不能忘記了特斯拉的另外兩臺(tái)GPU超算。早在2021年,特斯拉最新的一臺(tái)GPU超算規(guī)模就已經(jīng)達(dá)到了720個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)包含8塊英偉達(dá)A100 80GB GPU,整個(gè)系統(tǒng)的總GPU數(shù)達(dá)到了驚人的5760塊。

根據(jù)英偉達(dá)給出的數(shù)據(jù),每個(gè)A100的算力有312TFLOPS,這也就意味著這臺(tái)最新GPU超算的算力已經(jīng)超越了E級(jí),達(dá)到了可怕的1.8EFLOPS。不過這里的E級(jí)和我們平常說的E級(jí)超算還是有區(qū)別的,TOP500的那些超算跑分用的是LINPACK HPL,用到的是64位雙精度的格式,得出的實(shí)際應(yīng)用性能。而英偉達(dá)的A100的312TFLOPS是基于16位半精度來算的,而且是峰值性能。
IMG_256
特斯拉GPU超算 / 特斯拉

可即便如此,這臺(tái)超算的實(shí)力也能在TOP500上名列前茅,根據(jù)特斯拉前AI主管Andrej Karpathy的說法,單論算力(峰值)的話,特斯拉這臺(tái)GPU超算確實(shí)能在去年六月的超算榜上名列第五。

而近期,特斯拉負(fù)責(zé)AI基礎(chǔ)設(shè)施和AI平臺(tái)團(tuán)隊(duì)的工程經(jīng)理Tim Zaman宣布,特斯拉已經(jīng)將這臺(tái)超算的規(guī)模再度升級(jí),A100 80GB GPU的數(shù)量再度提升28%,達(dá)到了可怕的7360個(gè)。這價(jià)格十萬左右的GPU一下就添置近2000個(gè),不得不承認(rèn)特斯拉確實(shí)愿意下血本。Tim Zaman表示哪怕單論GPU數(shù)量,這臺(tái)超算也能排名世界第七了。

至于峰值算力,這臺(tái)超算目前大概還是在第五的位置,這是因?yàn)榻衲甑那拔逑喑隽藘晌恍聲x選手,第一名的Frontier和第三名的LUMI都比這臺(tái)超算要強(qiáng)。而且特斯拉也并沒有提交LINPACK HPL的跑分結(jié)果,畢竟這套系統(tǒng)已經(jīng)投入使用,特斯拉作為商業(yè)公司,也沒必要去停止手頭的訓(xùn)練負(fù)載而追求跑分。DOJO的話,特斯拉并沒有公開升級(jí)其規(guī)模,上文中的1.1EFLOPS的峰值算力也是基于BF16的,所以也不適合拿來直接對比。

寫在最后

電動(dòng)車時(shí)代的來臨給不少造車新勢力降低了門檻,然而自動(dòng)駕駛技術(shù)的存在又將整個(gè)門檻拉高了一大截。從目前頭部企業(yè)的動(dòng)向來看,搭建智算中心,拿高密度的計(jì)算資源去跑訓(xùn)練或許是唯一的自研路線,這樣法規(guī)完善后,才能讓自動(dòng)駕駛汽車在全國范圍內(nèi)鋪開,自動(dòng)駕駛也不會(huì)局限于試點(diǎn)技術(shù)。

但是否摸清楚了技術(shù)路線,是否愿意砸這個(gè)錢,以及回報(bào)率高低才是他們邁出這一步關(guān)鍵,畢竟要讓一個(gè)車企去組建團(tuán)隊(duì)搞芯片設(shè)計(jì),這個(gè)要求還是有些過分了,但僅僅是與云服務(wù)廠商合作打造這樣一個(gè)智算中心,同樣也得付出不小的成本。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 特斯拉
    +關(guān)注

    關(guān)注

    66

    文章

    6413

    瀏覽量

    131389
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    794

    文章

    14892

    瀏覽量

    180073
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    大模型時(shí)代自動(dòng)駕駛標(biāo)注有什么特殊要求?

    自動(dòng)駕駛的發(fā)展歷程中,數(shù)據(jù)標(biāo)注一直被視為算法進(jìn)化的基石。然而,隨著大模型時(shí)代的到來,這一領(lǐng)域正經(jīng)歷著重構(gòu)。 過去,標(biāo)注的任務(wù)是簡單地在二維照片上畫框,標(biāo)記出車輛和行人的位置。但現(xiàn)在
    的頭像 發(fā)表于 03-01 09:09 ?2786次閱讀
    大模型時(shí)代<b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>標(biāo)注</b>有什么特殊要求?

    無后視鏡!特斯拉無人出租車Cybercab原型曝光#特斯拉#無人駕駛#自動(dòng)駕駛#

    自動(dòng)駕駛
    jf_15747056
    發(fā)布于 :2026年01月23日 18:51:20

    力越高,自動(dòng)駕駛汽車就會(huì)越聰明?

    自動(dòng)駕駛行業(yè),說起算力,很多人第一反應(yīng)是“更強(qiáng)就是更好”,更快的芯片、更大的力池,感覺就可以讓汽車能看得更清楚、做決定更快、更安全。但事實(shí)并非如此。對于自動(dòng)駕駛汽車來說,力確實(shí)重
    的頭像 發(fā)表于 12-28 14:23 ?1311次閱讀

    自動(dòng)駕駛數(shù)據(jù)標(biāo)注是所有信息都要標(biāo)注嗎?

    [首發(fā)于智駕最前沿微信公眾號(hào)]數(shù)據(jù)標(biāo)注對于自動(dòng)駕駛來說,就像是老師教小朋友知識(shí),數(shù)據(jù)標(biāo)注可以讓車輛學(xué)習(xí)辨別道路交通信息的能力。攝像頭、雷達(dá)、激光雷達(dá)(LiDAR)拍下來的只是一堆原始信號(hào),這些信號(hào)
    的頭像 發(fā)表于 12-04 09:05 ?892次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b>數(shù)據(jù)<b class='flag-5'>標(biāo)注</b>是所有信息都要<b class='flag-5'>標(biāo)注</b>嗎?

    不同等級(jí)的自動(dòng)駕駛技術(shù)要求上有何不同?

    談到自動(dòng)駕駛,不可避免地會(huì)涉及到自動(dòng)駕駛分級(jí),美國汽車工程師學(xué)會(huì)(SAE)根據(jù)自動(dòng)駕駛系統(tǒng)與人類駕駛員參與駕駛行為程度的不同,將
    的頭像 發(fā)表于 10-18 10:17 ?2726次閱讀

    一文讀懂特斯拉自動(dòng)駕駛FSD從輔助到端到端的演進(jìn)

    [首發(fā)于智駕最前沿微信公眾號(hào)]自動(dòng)駕駛行業(yè)發(fā)展至今,特斯拉一直被很多企業(yè)對標(biāo),其FSD系統(tǒng)的每一次更新,都會(huì)獲得非常多人的關(guān)注。早期自動(dòng)駕駛是一個(gè)分層的、由多模塊組成的系統(tǒng),感知、定位、預(yù)測、規(guī)劃
    的頭像 發(fā)表于 10-11 09:13 ?817次閱讀
    一文讀懂<b class='flag-5'>特斯拉</b><b class='flag-5'>自動(dòng)駕駛</b>FSD從輔助到端到端的演進(jìn)

    自動(dòng)駕駛中Transformer大模型會(huì)取代深度學(xué)習(xí)嗎?

    持續(xù)討論。特別是在自動(dòng)駕駛領(lǐng)域,部分廠商開始嘗試將多模態(tài)大模型(MLLM)引入到感知、規(guī)劃與決策系統(tǒng),引發(fā)了“傳統(tǒng)深度學(xué)習(xí)是否已過時(shí)”的激烈爭論。然而,從技術(shù)原理、力成本、安全需求與實(shí)際落地路徑等維度來看,Transformer與深度學(xué)習(xí)并非你死我活的替代
    的頭像 發(fā)表于 08-13 09:15 ?4204次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b>中Transformer大模型會(huì)<b class='flag-5'>取代</b>深度學(xué)習(xí)嗎?

    特斯拉Dojo重塑供應(yīng)鏈,三星和英特爾分別贏得芯片和封裝合同

    電子發(fā)燒友綜合報(bào)道,外媒消息稱,特斯拉 (Tesla) 在發(fā)展其自動(dòng)駕駛 AI 訓(xùn)練的超級(jí)計(jì)算機(jī)“Dojo”的過程中,正對其供應(yīng)鏈進(jìn)行一次全面而重大的調(diào)整。 過去 Dojo 芯片的生產(chǎn)
    的頭像 發(fā)表于 08-10 06:14 ?1.2w次閱讀
    <b class='flag-5'>特斯拉</b><b class='flag-5'>Dojo</b>重塑供應(yīng)鏈,三星和英特爾分別贏得芯片和封裝合同

    自動(dòng)駕駛數(shù)據(jù)標(biāo)注主要是標(biāo)注什么?

    [首發(fā)于智駕最前沿微信公眾號(hào)]在自動(dòng)駕駛系統(tǒng)的研發(fā)過程中,數(shù)據(jù)標(biāo)注是實(shí)現(xiàn)高性能感知模型的基礎(chǔ)環(huán)節(jié),其核心目標(biāo)是將車輛從環(huán)境中采集到的原始感知數(shù)據(jù)(主要包括圖像、點(diǎn)云、視頻序列等)轉(zhuǎn)化為具有語義信息
    的頭像 發(fā)表于 07-30 11:54 ?1363次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b>數(shù)據(jù)<b class='flag-5'>標(biāo)注</b>主要是<b class='flag-5'>標(biāo)注</b>什么?

    什么是自動(dòng)駕駛數(shù)據(jù)標(biāo)注?如何好做數(shù)據(jù)標(biāo)注?

    [首發(fā)于智駕最前沿微信公眾號(hào)]在自動(dòng)駕駛系統(tǒng)的開發(fā)過程中,數(shù)據(jù)標(biāo)注是一項(xiàng)至關(guān)重要的工作。它不僅決定了模型訓(xùn)練的質(zhì)量,也直接影響了車輛感知、決策與控制的性能表現(xiàn)。隨著傳感器種類和數(shù)據(jù)量的劇增,有效
    的頭像 發(fā)表于 07-09 09:19 ?1399次閱讀
    什么是<b class='flag-5'>自動(dòng)駕駛</b>數(shù)據(jù)<b class='flag-5'>標(biāo)注</b>?如何好做數(shù)據(jù)<b class='flag-5'>標(biāo)注</b>?

    自動(dòng)駕駛汽車接管邏輯如何設(shè)置更為合理?

    交通環(huán)境并隨時(shí)接管的工作。但就是這一簡單需求,車企在自動(dòng)駕駛系統(tǒng)與人類駕駛員的接管邊界并未給出明確的界定。有很多實(shí)際案例表明,在系統(tǒng)無法處理復(fù)雜路況時(shí),會(huì)突然彈出“請立即接管”的提示,而駕駛員此時(shí)可能
    的頭像 發(fā)表于 06-26 08:56 ?854次閱讀

    端到端數(shù)據(jù)標(biāo)注方案在自動(dòng)駕駛領(lǐng)域的應(yīng)用優(yōu)勢

    10-20TB,其中需要標(biāo)注的數(shù)據(jù)占比超過60%。在這樣的背景下,端到端數(shù)據(jù)標(biāo)注方案應(yīng)運(yùn)而生,正在重塑自動(dòng)駕駛的數(shù)據(jù)生產(chǎn)范式。 端到端數(shù)據(jù)標(biāo)注
    的頭像 發(fā)表于 06-23 17:27 ?1033次閱讀

    淺析4D-bev標(biāo)注技術(shù)在自動(dòng)駕駛領(lǐng)域的重要性

    ?自動(dòng)駕駛技術(shù)的發(fā)展日新月異。從最初簡單的輔助駕駛功能,逐步邁向高度自動(dòng)化甚至完全自動(dòng)駕駛的階段。其中,海量且精準(zhǔn)的數(shù)據(jù)是訓(xùn)練高性能自動(dòng)駕駛
    的頭像 發(fā)表于 06-12 16:10 ?2414次閱讀

    自動(dòng)駕駛技術(shù)落地前為什么要先測試?

    大量的傳感器、復(fù)雜的算法和強(qiáng)大的計(jì)算平臺(tái)來取代人類駕駛員的感知、判斷和操作。在技術(shù)落地之前,“測試”便成了自動(dòng)駕駛從實(shí)驗(yàn)室走向真實(shí)道路的“安全閥”和“試金石”。如果沒有充分的測試,無論技術(shù)多么先進(jìn),都可能在現(xiàn)實(shí)環(huán)境中
    的頭像 發(fā)表于 06-09 09:42 ?748次閱讀

    NVIDIA Halos自動(dòng)駕駛汽車安全系統(tǒng)發(fā)布

    NVIDIA 整合了從云端到車端的安全自動(dòng)駕駛開發(fā)技術(shù)套件,涵蓋車輛架構(gòu)到 AI 模型,包括芯片、軟件、工具和服務(wù)。 物理 AI 正在自動(dòng)駕駛和機(jī)器人開發(fā)技術(shù)的交叉領(lǐng)域釋放新的可能性,尤其是加速了
    的頭像 發(fā)表于 03-25 14:51 ?1192次閱讀