91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Tesla自動駕駛芯片負(fù)責(zé)人Pete Bannon介紹芯片研發(fā)的過程

ml8z_IV_Technol ? 來源:ZF ? 2019-04-29 15:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在剛剛結(jié)束的Tesla Autonomy活動中,Tesla非?!按蠓健钡慕榻B了自己的Full Self-Driving (FSD) Computer從系統(tǒng)到芯片的很多細(xì)節(jié)。從芯片來看,其“透明度”超過了除Google第一代TPU之外所有的AI相關(guān)芯片。實際上,和Goolge TPU的情況類似,在這次發(fā)布之前,Tesla也做了一定的專利布局,這正好讓我們可以從不同角度更深入的了解Tesla的FSD芯片。

時間線

Tesla自動駕駛芯片負(fù)責(zé)人Pete Bannon首先介紹了芯片研發(fā)的過程:

Feb. 2016:第一個團(tuán)隊成員入職;

Aug. 2017:第一版流片(經(jīng)過18個月);

Dec. 2017:芯片返回,點(diǎn)亮;

Apr. 2018:BO Release to manufacturing;

Jul. 2018:Production start;

Dec. 2018:Employee retrofits start;

Mar. 2019:Model S & X production start;

Apr. 2019:Model 3 production start

用Pete的話說,從加入Tesla開始到芯片和系統(tǒng)在實際產(chǎn)品中部署,大約用了3年時間,這可能是他做過的項目中用時最短的了。他把這歸功于Tesla很強(qiáng)的垂直整合和并行工作的能力,還特別提到了Tesla有很強(qiáng)的Power supply design,Signal integrity design,Package design,System software,Board design,F(xiàn)irmware,System validation團(tuán)隊。這里Tesla給了我們一個參考,即設(shè)計,生產(chǎn)和成功部署一顆SoC芯片所需付出的努力和時間。

系統(tǒng)和芯片設(shè)計

在具體介紹系統(tǒng)和芯片設(shè)計之前,Pete Bannon首先說了項目的前提,“只有一個客戶Tesla”,這就很大程度上降低了芯片需求的復(fù)雜性??偨Y(jié)起來,F(xiàn)SD芯片的需求就落到了如下幾點(diǎn),依次是功耗,算力,Barch size(latency),安全性。在后面的Q&A中,Pete進(jìn)一步提到Model 3的功耗的目標(biāo)是每英里250W(Elon Musk對此作了補(bǔ)充,實際的功耗和道路環(huán)境有一定關(guān)系)。

前面幾個需求主要反映在芯片設(shè)計上,而安全性則在系統(tǒng)層面也有很多考慮,比如大量的冗余設(shè)計。同一塊板卡上的兩顆芯片的供電和數(shù)據(jù)通道都是獨(dú)立且互為備份的。而一個很有趣的想法是兩顆芯片同時都對同樣的數(shù)據(jù)進(jìn)行分析,然后對比分析結(jié)果(或者相互驗證),再得出最終結(jié)論。

在這個地方Elon Musk還親自插進(jìn)來講了一下這塊板卡上的任何部分如果出現(xiàn)故障都不會影響基本的汽車的行駛(他在之后的Q&A環(huán)節(jié)還補(bǔ)充說明了這一點(diǎn))。

之后Pete Bannon就開始對芯片進(jìn)行非常詳細(xì)的說明。首先是芯片的外觀,硅片和一些總體信息。后面的Q&A環(huán)節(jié)中透露了該芯片使用的是Samsung的14nm工藝。

然后是SoC芯片的基本組成部分,CPU(12核A72),GPU,各種接口,片上網(wǎng)絡(luò)。這些部分都是采用第三方標(biāo)準(zhǔn)IP。

此外還專門強(qiáng)調(diào)了一個SAFETY SYSTEM(如下圖所示),是一個獨(dú)立的CPU,有最終的控制權(quán)。

當(dāng)然,芯片中自研的最重要的部分是Neural Network Processor,也是發(fā)布中重點(diǎn)介紹的內(nèi)容。首先是整體信息,每顆芯片有兩個NNP,每個NNP有一個96x96個MAC的矩陣,32MB SRAM,工作在2GHz。所以一個NNP的處理能力是96x96x2(OPs)x2(GHz) = 36.864TOPS,單芯片72TOPS,板卡144TOPS。

這里比較值得注意的片上SRAM的數(shù)量。如果我們對比Google的初代TPU(256 x 256MAC,24MiB SRAM),這個片上存儲的數(shù)量是相當(dāng)高的。從下圖也可以看到NNP中存儲器大概占了總面積3/4以上。Pete Bannon的解釋是為了降低功耗,他們的設(shè)計目標(biāo)是將所有的模型都能存儲在片上。精度的選擇是乘法8bit,加法32bit。之后Pete Bannon介紹了芯片工作的方式,沒有太多新鮮的東西。

讀256B activation和128B weight,經(jīng)過變形和buffer,組合成96x96的乘加,然后在MAC矩陣中進(jìn)行運(yùn)算,最后結(jié)果shift out到專門的ReLU和Pool的硬件模塊,然后再以每周期128B的帶寬存回memory。由于MAC矩陣是96 x 96,所以在把數(shù)據(jù)輸入給MAC矩陣之前,需要做數(shù)據(jù)格式的變換。完成這一系列動作,總帶寬需求是1TB/Sec。考慮到所有數(shù)據(jù)都在片上SRAM中,這個帶寬比較容易滿足。

Pete Bannon還提了一下控制邏輯功耗的問題,認(rèn)為ICache,Register File和Control邏輯消耗的能量要遠(yuǎn)比運(yùn)算消耗的能量大,所以NNP的設(shè)計就盡量簡化了控制邏輯,只做運(yùn)算。相應(yīng)的,指令集比較簡單,只有8條指令:DMA Read,DMA Write,Convolution,Deconvolution,Inner-product,Scale,Eltwidth,Stop。編程模型(控制流)也非常簡單,完成一次運(yùn)算只需配置4個信息。另外也介紹了編譯工具,這個基本也是常見的功能。

最后,Pete Bannon給出了芯片的實際性能指標(biāo),2300 幀/秒,72W。當(dāng)然我們并不知道這是運(yùn)行什么網(wǎng)絡(luò)的結(jié)果。如果是講演中給出的如下示例網(wǎng)絡(luò),每幀需要35GOPS,每秒是35x2300=80TOPS,即能達(dá)到55%左右的利用率。

Tesla自動駕駛芯片負(fù)責(zé)人Pete Bannon介紹芯片研發(fā)的過程

到此我們看到了FSD芯片的一些細(xì)節(jié),但還不足以充分了解它的架構(gòu)設(shè)計。實際上,在這次公開之前,Tesla是給NNP申請了一系列專利的[2],我們可以從中看到一些更詳細(xì)的東西。

專利布局

Tesla目前公開的專利,大體的思路和Google之前給TPU申請專利也是差不多的(Google的神經(jīng)網(wǎng)絡(luò)處理器專利),先申請整體框架和方法的專利,然后是具體運(yùn)算,數(shù)據(jù)格式準(zhǔn)備,Vector處理,包括下面幾個。

Accelerated Mathematical Engine(Sep. 2017)

Computational Array Microprocessor system with variable latency memory access(Mar. 2018)

Computational array microprocessor system using non-consecutive data formating(Mar. 2018)

Vertor Computational Unit(Mar. 2018)

這里先要說明一下,專利和實際實現(xiàn)可能是有很大差別的。我們對專利的閱讀主要是作為對比和參考。下面我們主要看一下第一個專利,即整體架構(gòu)和方法的專利。雖然這里的名字叫“ACCELERATED MATHEMATICAL ENGINE”,但權(quán)力要求里的說法是,“A matrix processor for accelerating convolutions in a neural network”,基本就是一個CNN加速器。

它的基本硬件架構(gòu)主要是圍繞一個大的矩陣處理器(MATRIX PROCESSOR)做文章(如下圖)。

Tesla自動駕駛芯片負(fù)責(zé)人Pete Bannon介紹芯片研發(fā)的過程

Data和Weight分別經(jīng)過一個FORMATTER進(jìn)行格式的轉(zhuǎn)換,存入BUFFER,之后有一個硬件電路讀出提供給矩陣處理器。專利中提到FORMATTER可以用軟件或者硬件實現(xiàn),它們實際芯片中應(yīng)該是硬件實現(xiàn)的。由于要有效利用這種規(guī)模(96x96)的MAC矩陣,必須把輸入數(shù)據(jù)排好,這個FORMATTER起到了很大作用。因此他們也專門對它申請了專利(Google也是類似情況),有興趣的同學(xué)也可以看看。

在完成了矩陣乘加運(yùn)算后,結(jié)果會移出(shift)矩陣處理器(根據(jù)專利里的描述,應(yīng)該是從上向下逐級移動)進(jìn)行后續(xù)處理,包括累加,ReLU,和Pooling。由Vector Engine和Post-Processing Unit完成。這部分也有專門的專利(申請時間要晚一些),表述上和主架構(gòu)專利似乎有點(diǎn)不一致。此外就是控制邏輯部分,這部分是一個盡量簡單的設(shè)計。

下面我們進(jìn)入矩陣處理器(MAC Array)內(nèi)部看看運(yùn)算單元的設(shè)計。

Tesla自動駕駛芯片負(fù)責(zé)人Pete Bannon介紹芯片研發(fā)的過程

source:Tesla patent “ACCELERATED MATHEMATICAL ENGINE”

對比一下Google的專利中的計算單元,

Tesla自動駕駛芯片負(fù)責(zé)人Pete Bannon介紹芯片研發(fā)的過程

可以看出主要的區(qū)別在于Tesla多了一級累加器ShiftAcc,支持的數(shù)據(jù)流也能更靈活一些??偟脕碚f,Tesla描述的架構(gòu)和Google TPU專利描述的NNP("Neural network processor")是類似的,不過看起來在設(shè)計和表述上更為完整。在具體實現(xiàn)上,一個主要區(qū)別在于,F(xiàn)SD芯片主要使用片上SRAM工作,而不像是Google TPU還需要使用片外的DRAM。當(dāng)然,還是那句話,專利不代表具體實現(xiàn),而且Google的專利要早很多。這里只是單純參考一下。

這幾個專利中還有一些有意思的細(xì)節(jié),時間關(guān)系我每來及細(xì)讀。大家感興趣可以自己閱讀一下,有趣的信息也歡迎留言分享。我把這四個專利整理了一下,大家可以在后臺回復(fù)“teslapat”獲得下載的鏈接?;貜?fù)“googlepat”可以獲得Google專利的鏈接。

Q&A環(huán)節(jié)的花絮

回到Tesla的活動,在芯片發(fā)布之后還進(jìn)行了Q&A環(huán)節(jié),這部分其實也很有意思。首先,Elon Musk說了如下一段話(大意),“我們今天之所以要提供如此詳細(xì)的信息,就是因為,在一開始,對于Tesla這樣從沒做過芯片的公司來說,要研發(fā)一顆世界最先進(jìn)的芯片看起來是不可能的。我們的目標(biāo)就是這樣,而且我們的目標(biāo)不僅僅是領(lǐng)先一點(diǎn),而是大幅度的領(lǐng)先?!睆倪@段話可以看出,Tesla自研芯片應(yīng)該是有必要性和能力上的質(zhì)疑的。對于系統(tǒng)和應(yīng)用廠商來說,這種質(zhì)疑也是很正常的。必要性比較容易講,如問答環(huán)節(jié)所說,Telsa如果每年賣上百萬輛車,而自研芯片能讓整車成本降低,當(dāng)然就值得去做。而針對芯片研發(fā)的能力的質(zhì)疑,這次發(fā)布算是一個回答。所以,雖然這顆芯片目前還談不上世界領(lǐng)先(指標(biāo)上和Nvidia的對比是不太科學(xué)的,這個Nvidia已有回應(yīng)),Musk也要硬著頭皮去說。從另一個角度,這顆芯片至少可以證明自研的可行性。而且Musk也很認(rèn)真強(qiáng)調(diào)了這套系統(tǒng)的優(yōu)勢在于它的軟硬件都是專門為Tesla的自動駕駛定制的。對比Nvidia,他是這么說的,“Nvidia is great company, but they have many customers, as they apply their resources, they need to do a generalized solution. We care about one thing so private. It was designed to do that increadibly well and the software was also designed runing on that hardware increadibly well. The combination of hardware and software I think is unbeatable.” 看起來Tesla會在這條路上繼續(xù)走下去。在被問道工藝問題的時候,Elon Musk專門提到下一代芯片正在研發(fā)當(dāng)中(已經(jīng)halfway done)。

在被問道是否使用Lidar,Elon Musk說“l(fā)idar is fool's errand, anyone luck reliant on lidar is doomed.”在后面關(guān)于神經(jīng)網(wǎng)絡(luò)和軟件的talk里,AI網(wǎng)紅Andrej Karpathy也解釋了這個觀點(diǎn),"Lidar只是回避了關(guān)鍵的圖像識別問題,只是給我們一個技術(shù)進(jìn)步的假想,雖然可以做一些快速DEMO,最終肯定失敗"。

還有一個關(guān)于實際路測和仿真的問題,Elon Musk說,“Tesla也做很好的仿真,不過還是很難模擬真實環(huán)境發(fā)生的各種情況,如果仿真環(huán)境能夠模擬真實情況(這里他頓了一下)我們也不知道自己是不是生活在仿真環(huán)境中?!焙孟袼_實認(rèn)真的感知了一下。

總結(jié)

Tesla的自動駕駛芯片是FSD系統(tǒng)的最重要部分,其對標(biāo)的產(chǎn)品應(yīng)該是Nvidia的Nvidia Xavier SoC芯片(參考Hot Chips 30 - 巨頭們亮“肌肉”中相關(guān)部分)??陀^來看,Tesla的芯片和NvidiaXavier SoC芯片在各方面還是有差距的。Tesla的SoC設(shè)計中,除了自研的Neural Network Processor部分之外,其它都是用業(yè)界標(biāo)準(zhǔn)IP,并沒做太多定制工作,只能說中規(guī)中矩。而NNP也是一個比較簡單的架構(gòu),也很難說做了很多架構(gòu)和技術(shù)上的創(chuàng)新。從另一個角度來看,這款芯片如果真的大量使用了,那它至少也是合格的??梢钥吹?,Tesla的目標(biāo)和執(zhí)行策略是清晰和實際的,這是系統(tǒng)廠商自研芯片的最大優(yōu)勢。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 自動駕駛
    +關(guān)注

    關(guān)注

    794

    文章

    14894

    瀏覽量

    180126

原文標(biāo)題:多角度解析Tesla FSD自動駕駛芯片

文章出處:【微信號:IV_Technology,微信公眾號:智車科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    自動駕駛汽車如何實現(xiàn)自動駕駛

    人類駕駛員而言是非常直觀且有效的指令,但對于自動駕駛汽車來說,則意味著需要一套極其復(fù)雜的感知、理解與決策鏈路。 自動駕駛如何看清文字? 自動駕駛汽車感知漢字的第一步是場景文本識別技術(shù),
    的頭像 發(fā)表于 02-10 08:50 ?658次閱讀
    <b class='flag-5'>自動駕駛</b>汽車如何實現(xiàn)<b class='flag-5'>自動駕駛</b>

    如何設(shè)計好自動駕駛ODD?

    為確定自動駕駛的可使用范圍,會給自動駕駛設(shè)置一個運(yùn)行設(shè)計域(Operational Design Domain,ODD)。ODD的作用就是用來明確自動駕駛在什么情況下能工作,在什么情況下不能工作,給車設(shè)定“工作范圍”。
    的頭像 發(fā)表于 01-24 09:27 ?1555次閱讀

    三星電子相關(guān)業(yè)務(wù)負(fù)責(zé)人一行到訪谷東智能參觀交流

    12月23日,三星電子相關(guān)業(yè)務(wù)負(fù)責(zé)人一行到訪谷東智能,圍繞增強(qiáng)現(xiàn)實(AR)近眼顯示核心光學(xué)技術(shù)及整機(jī)解決方案展開深入交流。來訪團(tuán)隊包括三星電子CSS 部門長Richard Hwang、LEDoS中國負(fù)責(zé)人 Hang Wang等。
    的頭像 發(fā)表于 12-29 15:44 ?367次閱讀

    汽車自動駕駛的太陽光模擬應(yīng)用研究

    測試裝備,通過提供可控、可重復(fù)的測試環(huán)境,已成為汽車自動駕駛研發(fā)、驗證與標(biāo)定過程中不可或缺的核心工具。汽車自動駕駛的光挑戰(zhàn)與測試需求luminbox汽車的
    的頭像 發(fā)表于 12-10 18:04 ?418次閱讀
    汽車<b class='flag-5'>自動駕駛</b>的太陽光模擬應(yīng)用研究

    如祺出行被授予十五運(yùn)會和殘?zhí)貖W會自動駕駛服務(wù)商標(biāo)牌

    11月3日,十五運(yùn)會和殘?zhí)貖W會自動駕駛場景應(yīng)用啟動儀式在廣州市舉行,廣州市政府副秘書長陳鍵華,十五運(yùn)會和殘?zhí)貖W會廣州賽區(qū)執(zhí)委會綜合保障部、廣州市工業(yè)和信息化局、交通運(yùn)輸局等部門相關(guān)負(fù)責(zé)人,以及如祺出行等企業(yè)代表出席本次活動。
    的頭像 發(fā)表于 11-04 11:50 ?688次閱讀

    不同等級的自動駕駛技術(shù)要求上有何不同?

    談到自動駕駛,不可避免地會涉及到自動駕駛分級,美國汽車工程師學(xué)會(SAE)根據(jù)自動駕駛系統(tǒng)與人類駕駛員參與駕駛行為程度的不同,將
    的頭像 發(fā)表于 10-18 10:17 ?2728次閱讀

    自動駕駛SoC芯片到底有何優(yōu)勢?

    [首發(fā)于智駕最前沿微信公眾號]近年來,隨著智能網(wǎng)聯(lián)汽車技術(shù)的快速發(fā)展,車載計算芯片已成為智能駕駛系統(tǒng)的中樞。傳統(tǒng)的MCU(單片機(jī))芯片在處理速度和算力方面已難以滿足自動駕駛對于異構(gòu)數(shù)據(jù)
    的頭像 發(fā)表于 09-21 10:56 ?2715次閱讀
    <b class='flag-5'>自動駕駛</b>SoC<b class='flag-5'>芯片</b>到底有何優(yōu)勢?

    FF任命李雋擔(dān)任全球供應(yīng)鏈負(fù)責(zé)人

    “公司”)今日宣布, 任命李雋為FF與FX全球供應(yīng)鏈負(fù)責(zé)人。李雋將對供應(yīng)鏈業(yè)務(wù)全面負(fù)責(zé),并與各區(qū)域和各職能團(tuán)隊緊密合作,強(qiáng)化供應(yīng)商合作關(guān)系、提升運(yùn)營韌性、提升價值鏈效率。此次任命也體現(xiàn)了公司持續(xù)打造世界級供應(yīng)鏈組織、支持創(chuàng)新與增長的長期承諾。
    的頭像 發(fā)表于 09-03 14:47 ?1026次閱讀

    從阿布扎比到迪拜:文遠(yuǎn)知行與Uber中東自動駕駛版圖再擴(kuò)一城

    僅是文遠(yuǎn)知行與Uber在推動自動駕駛全球化發(fā)展進(jìn)程中的重要里程碑,也進(jìn)一步鞏固了文遠(yuǎn)知行在自動駕駛技術(shù)應(yīng)用領(lǐng)域的全球領(lǐng)先地位。 文遠(yuǎn)知行CFO兼國際業(yè)務(wù)負(fù)責(zé)人李璇表示:“迪拜是我們推進(jìn)自動駕駛
    的頭像 發(fā)表于 07-07 15:16 ?721次閱讀

    卡車、礦車的自動駕駛和乘用車的自動駕駛在技術(shù)要求上有何不同?

    [首發(fā)于智駕最前沿微信公眾號]自動駕駛技術(shù)的發(fā)展,讓組合輔助駕駛得到大量應(yīng)用,但現(xiàn)在對于自動駕駛技術(shù)的宣傳,普遍是在乘用車領(lǐng)域,而對于卡車、礦車的自動駕駛發(fā)展,卻鮮有提及。其實在卡車、
    的頭像 發(fā)表于 06-28 11:38 ?1455次閱讀
    卡車、礦車的<b class='flag-5'>自動駕駛</b>和乘用車的<b class='flag-5'>自動駕駛</b>在技術(shù)要求上有何不同?

    美國AI事務(wù)負(fù)責(zé)人警告:中國半導(dǎo)體設(shè)計能力最多只落后兩年!

    白宮掌管加密貨幣和AI事務(wù)的負(fù)責(zé)人薩克斯(David Sacks)接受媒體訪問時警告,中國半導(dǎo)體設(shè)計能力最多只落后美國兩年。 薩克斯受訪時指出,從DeepSeek年初推出突破性的AI模型,證明即使
    的頭像 發(fā)表于 06-20 16:37 ?796次閱讀

    自動駕駛安全基石:ODD

    電子發(fā)燒友網(wǎng)綜合報道 自動駕駛ODD(Operational Design Domain)即設(shè)計運(yùn)行域,是指自動駕駛系統(tǒng)被設(shè)計為安全、有效運(yùn)行的具體條件范圍。它定義了自動駕駛汽車在哪些環(huán)境、場景
    的頭像 發(fā)表于 05-19 03:52 ?6481次閱讀

    NVIDIA Halos自動駕駛汽車安全系統(tǒng)發(fā)布

    NVIDIA 整合了從云端到車端的安全自動駕駛開發(fā)技術(shù)套件,涵蓋車輛架構(gòu)到 AI 模型,包括芯片、軟件、工具和服務(wù)。 物理 AI 正在為自動駕駛和機(jī)器人開發(fā)技術(shù)的交叉領(lǐng)域釋放新的可能性,尤其是加速了
    的頭像 發(fā)表于 03-25 14:51 ?1193次閱讀

    理想汽車推出全新自動駕駛架構(gòu)

    2025年3月18日,理想汽車自動駕駛技術(shù)研發(fā)負(fù)責(zé)人賈鵬在NVIDIA GTC 2025發(fā)表主題演講《VLA:邁向自動駕駛物理智能體的關(guān)鍵一步》,分享了理想汽車對于下一代
    的頭像 發(fā)表于 03-19 14:12 ?1116次閱讀