因?yàn)閰捑肓藶?a target="_blank">半導(dǎo)體付出高昂的代價(jià),因此通用汽車(chē)公司的自動(dòng)駕駛汽車(chē)部門(mén)決定開(kāi)始自己設(shè)計(jì)芯片。這是一個(gè)大膽的舉動(dòng),但可能會(huì)讓汽車(chē)公司迷失方向。
就在 18 個(gè)月前,半導(dǎo)體巨頭 Nvidia展示了Cruise Origin Robotaxi,作為在 Cruise 汽車(chē)中使用圖形處理單元的案例研究,“以實(shí)時(shí)處理其車(chē)隊(duì)在舊金山混亂的街道上收集的大量數(shù)據(jù)。”
這家總部位于加利福尼亞的自動(dòng)駕駛汽車(chē)公司的硬件負(fù)責(zé)人Carl Jenkins最近告訴路透社,現(xiàn)在這種關(guān)系看起來(lái)已經(jīng)破裂,因?yàn)槭褂谩皝?lái)自著名供應(yīng)商的 GPU”的成本高且回旋余地小。Nvidia 沒(méi)有直接點(diǎn)名,但它是僅有的兩家 GPU 供應(yīng)商之一,另一家 Advanced Micro Devices Inc. 不是汽車(chē)行業(yè)的參與者。
Cruise 并不是第一家使用英偉達(dá)芯片,然后放棄的汽車(chē)公司。三年前,特斯拉公司宣布將獨(dú)自開(kāi)發(fā)用于其全自動(dòng)駕駛 (FSD) 計(jì)算機(jī)的芯片。當(dāng)時(shí),英偉達(dá)隨后發(fā)布了一篇詳細(xì)的博客文章,解釋了為什么特斯拉CEO Elon Musk 在評(píng)估性能差異時(shí)是錯(cuò)誤的。
實(shí)際上,Cruise、Tesla 和 Nvidia 都對(duì)他們的芯片為何優(yōu)越有充分的論據(jù)。當(dāng)汽車(chē)制造商幾乎沒(méi)有能力定制產(chǎn)品或談判價(jià)格時(shí),他們對(duì)支付高昂的芯片成本感到沮喪,這是可以理解的。但汽車(chē)行業(yè)的高管需要評(píng)估自己的核心競(jìng)爭(zhēng)力,并在走上獨(dú)立之路之前做出艱難的決定。
為此,他們可以從 Jeff Bezos 和盧森堡啤酒行業(yè)獲得指導(dǎo)。根據(jù) Amazon.com Inc. 創(chuàng)始人現(xiàn)在著名的演講,歐洲國(guó)家的釀酒商曾經(jīng)自己發(fā)電,因?yàn)檫@是啤酒制造過(guò)程中需要的輸入,他們無(wú)法從集中式電力中獲取電力網(wǎng)格。
但對(duì)這家釀酒商來(lái)說(shuō)不幸的是,正如他在2008 年的一次演講中指出的那樣,這種繁重的工作沒(méi)有區(qū)別——所有的電力都是一樣的——但需要在世界級(jí)的水平上完成。他們?cè)娇鞂l(fā)電外包,他們就能越快重新專(zhuān)注于釀造。
“他們自己發(fā)電的事實(shí)并沒(méi)有讓他們的啤酒味道更好,”貝佐斯說(shuō)。他的勸告今天繼續(xù)響亮:專(zhuān)注于讓您的啤酒味道更好的東西。
汽車(chē)制造商需要進(jìn)行同樣的計(jì)算,而且它的成本越來(lái)越高。過(guò)去十年,隨著半導(dǎo)體制造技術(shù)的進(jìn)步,開(kāi)發(fā)新芯片的價(jià)格上漲了 10 倍。在將其送去生產(chǎn)之前,每個(gè)組件都需要進(jìn)行設(shè)計(jì)、驗(yàn)證、測(cè)試和原型制作。根據(jù)麥肯錫公司的分析,目前最新的 5 納米制造節(jié)點(diǎn)的前期成本為 5.4 億美元,而11 年前首次推出的較舊的 28 納米技術(shù)的前期成本為 5000 萬(wàn)美元。

英偉達(dá)能夠承擔(dān)這些成本的一個(gè)主要原因是,它每年通過(guò)銷(xiāo)售用于計(jì)算機(jī)顯卡、人工智能服務(wù)器、數(shù)據(jù)處理中心和自動(dòng)駕駛汽車(chē)的芯片獲得 270 億美元的收入。設(shè)計(jì)芯片是英偉達(dá)的工作,因此半導(dǎo)體是英偉達(dá)的啤酒。
特斯拉和Cruise以及其他所有汽車(chē)制造商都需要詢(xún)問(wèn)他們的產(chǎn)品與競(jìng)爭(zhēng)對(duì)手的區(qū)別是什么。駕駛員做出選擇的因素有很多,包括發(fā)動(dòng)機(jī)功率和性能、外觀、內(nèi)部設(shè)計(jì)、安全性和配件。未來(lái),F(xiàn)SD 將只是買(mǎi)家考慮的另一個(gè)功能。
而且,設(shè)計(jì)自己的芯片并不能解決當(dāng)前的短期供應(yīng)短缺問(wèn)題,但它可以讓汽車(chē)制造商更好地根據(jù)自己的需求定制組件,而不是購(gòu)買(mǎi)現(xiàn)成的產(chǎn)品。性能很可能會(huì)優(yōu)于第三方供應(yīng)商可以提供的產(chǎn)品,但這并不意味著他們銷(xiāo)售的最終產(chǎn)品——汽車(chē)——會(huì)好得多。多年前, Alphabet Inc 的 Google走上了獨(dú)立之路,押注為其龐大的數(shù)據(jù)中心設(shè)計(jì)定制芯片的好處——并遠(yuǎn)離英特爾公司——這將使其投資獲得回報(bào)。大這里的不同之處在于,從谷歌服務(wù)器存儲(chǔ)和抽取的數(shù)據(jù)是世界上最大的搜索引擎購(gòu)買(mǎi)和銷(xiāo)售的數(shù)據(jù)。
汽車(chē)制造商要確保他們的半導(dǎo)體賭注是值得的,他們不僅需要相信自動(dòng)駕駛功能將成為客戶(hù)購(gòu)買(mǎi)決定的主要因素,而且他們自己內(nèi)部開(kāi)發(fā)的芯片是這種差異化的關(guān)鍵。這是一項(xiàng)艱巨的任務(wù)。
經(jīng)過(guò)多年的發(fā)展,并與越來(lái)越高的成本作斗爭(zhēng),汽車(chē)制造商很有可能最終會(huì)發(fā)現(xiàn),雖然他們自己的芯片更出色,但它們并沒(méi)有讓啤酒的味道更好。
英偉達(dá)超強(qiáng)汽車(chē)芯片來(lái)襲
作為其秋季 GTC 2022 活動(dòng)的一部分,NVIDIA 早前發(fā)布了大量公告,該公司正在對(duì)其 DRIVE 汽車(chē) SoC 計(jì)劃進(jìn)行令人驚訝的更行,且立即生效。NVIDIA表示將取消Atlan,這是他們計(jì)劃用于 2025 年汽車(chē)的后 Orin SoC。取而代之的是,NVIDIA 宣布推出 Thor,這是一款功能更強(qiáng)大的 SoC,將于 2025 年推出。
NVIDIA 的 Atlan SoC 于 2021 年春季 GTC 首次亮相,NVIDIA 宣布將其作為下一代汽車(chē) SoC,以接替(現(xiàn)在的)Orin SoC。在宣布時(shí),Atlan 計(jì)劃成為一款高性能 SoC,提供 1000 TOPS 的 INT8 推理性能,采用下一代(Lovelace)GPU 設(shè)計(jì)和下一代 Grace CPU 設(shè)計(jì)。該芯片甚至集成了 BlueField DPU 作為網(wǎng)絡(luò)和安全處理器,旨在提供一個(gè)可以處理自動(dòng)駕駛汽車(chē)所需的所有計(jì)算功能的 SoC。

但無(wú)論 Atlan本應(yīng)是什么,現(xiàn)在都已不復(fù)存在。截至 NVIDIA 新的 DRIVE SoC 路線圖,Atlan 已被廢棄。取而代之的是一個(gè)新的 SoC——Thor,它比Atlan 更強(qiáng)大。
與 2021 年的 Atlan 公告一樣,NVIDIA 僅在發(fā)布之前發(fā)布了有關(guān) Thor 的少數(shù)細(xì)節(jié)。高級(jí)細(xì)節(jié)包括,沒(méi)有命名特定的 NVIDIA CPU 和 GPU 架構(gòu),但 SoC 正在利用 Grace CPU、Ampere GPU 架構(gòu)和 Lovelace GPU 架構(gòu)首次引入的功能。與此同時(shí),NVIDIA 關(guān)于此事的博客文章確實(shí)更進(jìn)一步,指出 SoC 使用了 Arm 迄今為止秘密的 Poseidon CPU 內(nèi)核的汽車(chē)增強(qiáng) (AE) 版本。我們對(duì)Poseidon 知之甚少,它是 Arm 正在開(kāi)發(fā)的下一代高性能 CPU 內(nèi)核,將用于其下一代 Neoverse V 系列平臺(tái),取代剛剛發(fā)布的Neoverse V2。

從性能的角度來(lái)看,Thor 計(jì)劃使用新標(biāo)準(zhǔn)化的 FP8 數(shù)據(jù)格式提供 2 PFLOPS (2000 TFLOPS) 的浮點(diǎn)推理性能。盡管與 Atlan 的 1000 TFLOPS INT8 數(shù)字相比,這不是一個(gè)公平的比較,但它仍然代表了 8 位精度計(jì)算吞吐量的兩倍。SoC 的張量核心還將采用 NVIDIA 的 transformer engines,使 SoC 能夠進(jìn)一步加速transformer networks的處理。
值得注意的是,整合所有這些性能將使 Thor 成為一個(gè)非常龐大的芯片。雖然 NVIDIA 沒(méi)有宣布工藝節(jié)點(diǎn),但他們已經(jīng)表示它將使用 770 億個(gè)晶體管,這比他們的新旗艦 GH100 GPU 少了 30 億個(gè)晶體管。NVIDIA 的性能聲明并未表明是否使用了矩陣稀疏性,但即使是這樣,Thor 的 FP8 性能也將是 NVIDIA 旗艦 GPU 的一半。所有這些都突顯了 NVIDIA 對(duì)計(jì)劃中的 SoC 的極端性能目標(biāo)。
雖然 NVIDIA 的芯片模型在 AGX 板上以單芯片配置顯示它,但今天的公告還明確提到了 NVLink 芯片到芯片 (NVLink-C2C) 芯片互連技術(shù)。這是一個(gè)奇怪的提及,因?yàn)?NVIDIA 的關(guān)鍵藝術(shù)并沒(méi)有顯示 Thor 是基于chiplet的。這可能意味著 NVIDIA 將轉(zhuǎn)而使用 NVLink-C2C 來(lái)實(shí)現(xiàn)更強(qiáng)大的多芯片 DRIVE AGX 板(ala Pegasus),或者很可能 Thor 是基于chiplet的設(shè)計(jì),而 NVIDIA 故意將其通用化藝術(shù)。
除此之外,NVIDIA 沒(méi)有提供有關(guān) SoC 的任何進(jìn)一步技術(shù)細(xì)節(jié)。因此,有關(guān)使用的內(nèi)存類(lèi)型、GPU 架構(gòu)和其他功能塊的詳細(xì)信息仍有待觀察。
在這一點(diǎn)上,NVIDIA 也沒(méi)有詳細(xì)說(shuō)明為什么他們?nèi)∠?Atlan 來(lái)代替 Thor。Thor 無(wú)疑是一個(gè)更強(qiáng)大的設(shè)計(jì),并且似乎包含了一些在 Atlan 上找不到(或至少?gòu)奈垂_(kāi)過(guò))的新功能。這是否意味著 NVIDIA 正在以某種方式引入本應(yīng)是后 Atlan 芯片的芯片,或者他們是否因?yàn)榭蛻?hù)需要更好的自動(dòng)駕駛汽車(chē) AI 推理性能而放棄了 Atlan,還有待觀察。
拋開(kāi)硬件升級(jí)不談,很明顯,NVIDIA 正在為與 Atlan 相同的細(xì)分市場(chǎng)設(shè)計(jì) Thor。也就是說(shuō),它是一種高性能的單芯片設(shè)計(jì),用于處理自動(dòng)駕駛汽車(chē)的所有計(jì)算需求,從信息娛樂(lè)系統(tǒng)和傳感器融合到實(shí)際的自動(dòng)駕駛算法本身。與 Atlan 一樣,其目標(biāo)是用一臺(tái)可以完成所有工作的計(jì)算機(jī)取代目前汽車(chē)內(nèi)的獨(dú)立計(jì)算機(jī),利用具有廣泛隔離(包括 MIG)的功能安全設(shè)計(jì)技術(shù)來(lái)防止單獨(dú)的任務(wù)相互干擾。
然而,也許最令人驚訝的是,SoC 的這種變化預(yù)計(jì)不會(huì)影響 NVIDIA 的 SoC 交付日期。英偉達(dá)表示,他們將在 2025 年為汽車(chē)廠商提供Thor,這與亞特蘭的計(jì)劃到達(dá)時(shí)間相同。因此,雖然魔鬼在細(xì)節(jié)中,但在高水平上,英偉達(dá)的目標(biāo)是提供接近相同的Thor時(shí)間,因?yàn)樗麄儠?huì)交付Atlan 。不過(guò)值得注意的是,雖然 NVIDIA 此前曾宣布 Atlan 將在 2023 年出樣,但尚未發(fā)布關(guān)于 Thor 的此類(lèi)公告。因此,Thor 的送樣日期可能最終會(huì)晚于 Atlan 的送樣日期。
英偉達(dá)2019年對(duì)特斯拉自研芯片的評(píng)論原文
在2019年的特斯拉 Autonomy Day 投資者活動(dòng)中,埃隆·馬斯克 (Elon Musk) 公布了他的新型自動(dòng)駕駛汽車(chē)電腦的規(guī)格,他向全世界明確了幾件事。
首先,特斯拉正在提高所有其他汽車(chē)制造商的標(biāo)準(zhǔn)。
其次,特斯拉的自動(dòng)駕駛汽車(chē)將由基于其兩個(gè)新 AI 芯片的計(jì)算機(jī)提供動(dòng)力,每個(gè)芯片都配備 CPU、GPU 和深度學(xué)習(xí)加速器。該計(jì)算機(jī)每秒可提供 144 萬(wàn)億次操作 (TOPS),使其能夠從一系列環(huán)繞攝像頭、雷達(dá)和超聲波收集數(shù)據(jù),并為深度神經(jīng)網(wǎng)絡(luò)算法提供動(dòng)力。
第三,特斯拉正在研發(fā)下一代芯片,據(jù)說(shuō) 144 TOPS 還不夠。
在 NVIDIA,我們一直堅(jiān)信特斯拉重申的愿景:自動(dòng)駕駛汽車(chē)需要具備非凡能力的計(jì)算機(jī)。
這正是我們幾年前設(shè)計(jì)和制造 NVIDIA Xavier SoC 的原因。Xavier 處理器具有可編程 CPU、GPU 和深度學(xué)習(xí)加速器,可提供 30 TOPS的算力。我們基于雙芯片解決方案構(gòu)建了一臺(tái)名為 DRIVE AGX Pegasus 的計(jì)算機(jī),將 Xavier 與強(qiáng)大的 GPU 配對(duì)以提供 160 TOPS,然后將兩組放在計(jì)算機(jī)上,總共提供 320 TOPS。
正如我們一年前(2018年)宣布的那樣,我們并沒(méi)有坐以待斃。我們的下一代處理器 Orin 即將問(wèn)世。
這就是為什么 NVIDIA 是馬斯克比較特斯拉的標(biāo)準(zhǔn)——我們是唯一一家以每秒數(shù)萬(wàn)億次操作或 TOPS 來(lái)描述這個(gè)問(wèn)題的公司。
但是,盡管我們?cè)诖缶稚贤馑挠^點(diǎn)——這是一個(gè)只能通過(guò)超級(jí)計(jì)算機(jī)級(jí)系統(tǒng)才能解決的挑戰(zhàn)——但特斯拉的演示文稿中存在一些我們需要糾正的不準(zhǔn)確之處。
將特斯拉的兩芯片全自動(dòng)駕駛計(jì)算機(jī)與英偉達(dá)的單芯片駕駛輔助系統(tǒng)的性能進(jìn)行比較是沒(méi)有用的。Tesla 的 144 TOP 的兩芯片 FSD 計(jì)算機(jī)將與NVIDIA DRIVE AGX Pegasus 計(jì)算機(jī)進(jìn)行比較,后者在 AI 感知、定位和路徑規(guī)劃方面以 320 TOPS 運(yùn)行。
此外,雖然 Xavier 提供了 30 TOPS 的處理能力,但特斯拉錯(cuò)誤地聲稱(chēng)它提供了 21 TOPS。此外,帶有單個(gè) Xavier 處理器的系統(tǒng)是為輔助駕駛 AutoPilot 功能而設(shè)計(jì)的,而不是完全自動(dòng)駕駛。正如特斯拉所說(shuō),自動(dòng)駕駛需要更多的計(jì)算。
然而,特斯拉最重要的問(wèn)題是完全正確的:自動(dòng)駕駛汽車(chē)——這是提高安全性、效率和便利性的關(guān)鍵——是該行業(yè)的未來(lái)。它們需要大量的計(jì)算性能。
事實(shí)上,特斯拉認(rèn)為這種方法對(duì)行業(yè)的未來(lái)非常重要,因此它正在圍繞它建立自己的未來(lái)。這是前進(jìn)的道路。其他所有汽車(chē)制造商都需要提供這種水平的性能。
只有兩個(gè)地方可以獲得 AI 計(jì)算能力:NVIDIA 和 Tesla。其中只有一個(gè)是可供行業(yè)構(gòu)建的開(kāi)放平臺(tái)。
編輯:黃飛
?
電子發(fā)燒友App












評(píng)論