汽車(chē)廠商自研芯片英偉達(dá)超強(qiáng)汽車(chē)芯片來(lái)襲

因?yàn)閰捑肓藶?a target="_blank">半導(dǎo)體付出高昂的代價(jià)，因此通用汽車(chē)公司的自動(dòng)駕駛汽車(chē)部門(mén)決定開(kāi)始自己設(shè)計(jì)芯片。這是一個(gè)大膽的舉動(dòng)，但可能會(huì)讓汽車(chē)公司迷失方向。

就在 18 個(gè)月前，半導(dǎo)體巨頭 Nvidia展示了Cruise Origin Robotaxi，作為在 Cruise 汽車(chē)中使用圖形處理單元的案例研究，“以實(shí)時(shí)處理其車(chē)隊(duì)在舊金山混亂的街道上收集的大量數(shù)據(jù)。”

這家總部位于加利福尼亞的自動(dòng)駕駛汽車(chē)公司的硬件負(fù)責(zé)人Carl Jenkins最近告訴路透社，現(xiàn)在這種關(guān)系看起來(lái)已經(jīng)破裂，因?yàn)槭褂谩皝?lái)自著名供應(yīng)商的 GPU”的成本高且回旋余地小。Nvidia 沒(méi)有直接點(diǎn)名，但它是僅有的兩家 GPU 供應(yīng)商之一，另一家 Advanced Micro Devices Inc. 不是汽車(chē)行業(yè)的參與者。

Cruise 并不是第一家使用英偉達(dá)芯片，然后放棄的汽車(chē)公司。三年前，特斯拉公司宣布將獨(dú)自開(kāi)發(fā)用于其全自動(dòng)駕駛 (FSD) 計(jì)算機(jī)的芯片。當(dāng)時(shí)，英偉達(dá)隨后發(fā)布了一篇詳細(xì)的博客文章，解釋了為什么特斯拉CEO Elon Musk 在評(píng)估性能差異時(shí)是錯(cuò)誤的。

實(shí)際上，Cruise、Tesla 和 Nvidia 都對(duì)他們的芯片為何優(yōu)越有充分的論據(jù)。當(dāng)汽車(chē)制造商幾乎沒(méi)有能力定制產(chǎn)品或談判價(jià)格時(shí)，他們對(duì)支付高昂的芯片成本感到沮喪，這是可以理解的。但汽車(chē)行業(yè)的高管需要評(píng)估自己的核心競(jìng)爭(zhēng)力，并在走上獨(dú)立之路之前做出艱難的決定。

為此，他們可以從 Jeff Bezos 和盧森堡啤酒行業(yè)獲得指導(dǎo)。根據(jù) Amazon.com Inc. 創(chuàng)始人現(xiàn)在著名的演講，歐洲國(guó)家的釀酒商曾經(jīng)自己發(fā)電，因?yàn)檫@是啤酒制造過(guò)程中需要的輸入，他們無(wú)法從集中式電力中獲取電力網(wǎng)格。

但對(duì)這家釀酒商來(lái)說(shuō)不幸的是，正如他在2008 年的一次演講中指出的那樣，這種繁重的工作沒(méi)有區(qū)別——所有的電力都是一樣的——但需要在世界級(jí)的水平上完成。他們?cè)娇鞂l(fā)電外包，他們就能越快重新專(zhuān)注于釀造。

“他們自己發(fā)電的事實(shí)并沒(méi)有讓他們的啤酒味道更好，”貝佐斯說(shuō)。他的勸告今天繼續(xù)響亮：專(zhuān)注于讓您的啤酒味道更好的東西。

汽車(chē)制造商需要進(jìn)行同樣的計(jì)算，而且它的成本越來(lái)越高。過(guò)去十年，隨著半導(dǎo)體制造技術(shù)的進(jìn)步，開(kāi)發(fā)新芯片的價(jià)格上漲了 10 倍。在將其送去生產(chǎn)之前，每個(gè)組件都需要進(jìn)行設(shè)計(jì)、驗(yàn)證、測(cè)試和原型制作。根據(jù)麥肯錫公司的分析，目前最新的 5 納米制造節(jié)點(diǎn)的前期成本為 5.4 億美元，而11 年前首次推出的較舊的 28 納米技術(shù)的前期成本為 5000 萬(wàn)美元。

英偉達(dá)能夠承擔(dān)這些成本的一個(gè)主要原因是，它每年通過(guò)銷(xiāo)售用于計(jì)算機(jī)顯卡、人工智能服務(wù)器、數(shù)據(jù)處理中心和自動(dòng)駕駛汽車(chē)的芯片獲得 270 億美元的收入。設(shè)計(jì)芯片是英偉達(dá)的工作，因此半導(dǎo)體是英偉達(dá)的啤酒。

特斯拉和Cruise以及其他所有汽車(chē)制造商都需要詢(xún)問(wèn)他們的產(chǎn)品與競(jìng)爭(zhēng)對(duì)手的區(qū)別是什么。駕駛員做出選擇的因素有很多，包括發(fā)動(dòng)機(jī)功率和性能、外觀、內(nèi)部設(shè)計(jì)、安全性和配件。未來(lái)，F(xiàn)SD 將只是買(mǎi)家考慮的另一個(gè)功能。

而且，設(shè)計(jì)自己的芯片并不能解決當(dāng)前的短期供應(yīng)短缺問(wèn)題，但它可以讓汽車(chē)制造商更好地根據(jù)自己的需求定制組件，而不是購(gòu)買(mǎi)現(xiàn)成的產(chǎn)品。性能很可能會(huì)優(yōu)于第三方供應(yīng)商可以提供的產(chǎn)品，但這并不意味著他們銷(xiāo)售的最終產(chǎn)品——汽車(chē)——會(huì)好得多。多年前， Alphabet Inc 的 Google走上了獨(dú)立之路，押注為其龐大的數(shù)據(jù)中心設(shè)計(jì)定制芯片的好處——并遠(yuǎn)離英特爾公司——這將使其投資獲得回報(bào)。大這里的不同之處在于，從谷歌服務(wù)器存儲(chǔ)和抽取的數(shù)據(jù)是世界上最大的搜索引擎購(gòu)買(mǎi)和銷(xiāo)售的數(shù)據(jù)。

汽車(chē)制造商要確保他們的半導(dǎo)體賭注是值得的，他們不僅需要相信自動(dòng)駕駛功能將成為客戶(hù)購(gòu)買(mǎi)決定的主要因素，而且他們自己內(nèi)部開(kāi)發(fā)的芯片是這種差異化的關(guān)鍵。這是一項(xiàng)艱巨的任務(wù)。

經(jīng)過(guò)多年的發(fā)展，并與越來(lái)越高的成本作斗爭(zhēng)，汽車(chē)制造商很有可能最終會(huì)發(fā)現(xiàn)，雖然他們自己的芯片更出色，但它們并沒(méi)有讓啤酒的味道更好。

英偉達(dá)超強(qiáng)汽車(chē)芯片來(lái)襲

作為其秋季 GTC 2022 活動(dòng)的一部分，NVIDIA 早前發(fā)布了大量公告，該公司正在對(duì)其 DRIVE 汽車(chē) SoC 計(jì)劃進(jìn)行令人驚訝的更行，且立即生效。NVIDIA表示將取消Atlan，這是他們計(jì)劃用于 2025 年汽車(chē)的后 Orin SoC。取而代之的是，NVIDIA 宣布推出 Thor，這是一款功能更強(qiáng)大的 SoC，將于 2025 年推出。

NVIDIA 的 Atlan SoC 于 2021 年春季 GTC 首次亮相，NVIDIA 宣布將其作為下一代汽車(chē) SoC，以接替（現(xiàn)在的）Orin SoC。在宣布時(shí)，Atlan 計(jì)劃成為一款高性能 SoC，提供 1000 TOPS 的 INT8 推理性能，采用下一代（Lovelace）GPU 設(shè)計(jì)和下一代 Grace CPU 設(shè)計(jì)。該芯片甚至集成了 BlueField DPU 作為網(wǎng)絡(luò)和安全處理器，旨在提供一個(gè)可以處理自動(dòng)駕駛汽車(chē)所需的所有計(jì)算功能的 SoC。

但無(wú)論 Atlan本應(yīng)是什么，現(xiàn)在都已不復(fù)存在。截至 NVIDIA 新的 DRIVE SoC 路線圖，Atlan 已被廢棄。取而代之的是一個(gè)新的 SoC——Thor，它比Atlan 更強(qiáng)大。

與 2021 年的 Atlan 公告一樣，NVIDIA 僅在發(fā)布之前發(fā)布了有關(guān) Thor 的少數(shù)細(xì)節(jié)。高級(jí)細(xì)節(jié)包括，沒(méi)有命名特定的 NVIDIA CPU 和 GPU 架構(gòu)，但 SoC 正在利用 Grace CPU、Ampere GPU 架構(gòu)和 Lovelace GPU 架構(gòu)首次引入的功能。與此同時(shí)，NVIDIA 關(guān)于此事的博客文章確實(shí)更進(jìn)一步，指出 SoC 使用了 Arm 迄今為止秘密的 Poseidon CPU 內(nèi)核的汽車(chē)增強(qiáng) (AE) 版本。我們對(duì)Poseidon 知之甚少，它是 Arm 正在開(kāi)發(fā)的下一代高性能 CPU 內(nèi)核，將用于其下一代 Neoverse V 系列平臺(tái)，取代剛剛發(fā)布的Neoverse V2。

從性能的角度來(lái)看，Thor 計(jì)劃使用新標(biāo)準(zhǔn)化的 FP8 數(shù)據(jù)格式提供 2 PFLOPS (2000 TFLOPS) 的浮點(diǎn)推理性能。盡管與 Atlan 的 1000 TFLOPS INT8 數(shù)字相比，這不是一個(gè)公平的比較，但它仍然代表了 8 位精度計(jì)算吞吐量的兩倍。SoC 的張量核心還將采用 NVIDIA 的 transformer engines，使 SoC 能夠進(jìn)一步加速transformer networks的處理。

值得注意的是，整合所有這些性能將使 Thor 成為一個(gè)非常龐大的芯片。雖然 NVIDIA 沒(méi)有宣布工藝節(jié)點(diǎn)，但他們已經(jīng)表示它將使用 770 億個(gè)晶體管，這比他們的新旗艦 GH100 GPU 少了 30 億個(gè)晶體管。NVIDIA 的性能聲明并未表明是否使用了矩陣稀疏性，但即使是這樣，Thor 的 FP8 性能也將是 NVIDIA 旗艦 GPU 的一半。所有這些都突顯了 NVIDIA 對(duì)計(jì)劃中的 SoC 的極端性能目標(biāo)。

雖然 NVIDIA 的芯片模型在 AGX 板上以單芯片配置顯示它，但今天的公告還明確提到了 NVLink 芯片到芯片 (NVLink-C2C) 芯片互連技術(shù)。這是一個(gè)奇怪的提及，因?yàn)?NVIDIA 的關(guān)鍵藝術(shù)并沒(méi)有顯示 Thor 是基于chiplet的。這可能意味著 NVIDIA 將轉(zhuǎn)而使用 NVLink-C2C 來(lái)實(shí)現(xiàn)更強(qiáng)大的多芯片 DRIVE AGX 板（ala Pegasus），或者很可能 Thor 是基于chiplet的設(shè)計(jì)，而 NVIDIA 故意將其通用化藝術(shù)。

除此之外，NVIDIA 沒(méi)有提供有關(guān) SoC 的任何進(jìn)一步技術(shù)細(xì)節(jié)。因此，有關(guān)使用的內(nèi)存類(lèi)型、GPU 架構(gòu)和其他功能塊的詳細(xì)信息仍有待觀察。

在這一點(diǎn)上，NVIDIA 也沒(méi)有詳細(xì)說(shuō)明為什么他們?nèi)∠?Atlan 來(lái)代替 Thor。Thor 無(wú)疑是一個(gè)更強(qiáng)大的設(shè)計(jì)，并且似乎包含了一些在 Atlan 上找不到（或至少?gòu)奈垂_(kāi)過(guò)）的新功能。這是否意味著 NVIDIA 正在以某種方式引入本應(yīng)是后 Atlan 芯片的芯片，或者他們是否因?yàn)榭蛻?hù)需要更好的自動(dòng)駕駛汽車(chē) AI 推理性能而放棄了 Atlan，還有待觀察。

拋開(kāi)硬件升級(jí)不談，很明顯，NVIDIA 正在為與 Atlan 相同的細(xì)分市場(chǎng)設(shè)計(jì) Thor。也就是說(shuō)，它是一種高性能的單芯片設(shè)計(jì)，用于處理自動(dòng)駕駛汽車(chē)的所有計(jì)算需求，從信息娛樂(lè)系統(tǒng)和傳感器融合到實(shí)際的自動(dòng)駕駛算法本身。與 Atlan 一樣，其目標(biāo)是用一臺(tái)可以完成所有工作的計(jì)算機(jī)取代目前汽車(chē)內(nèi)的獨(dú)立計(jì)算機(jī)，利用具有廣泛隔離（包括 MIG）的功能安全設(shè)計(jì)技術(shù)來(lái)防止單獨(dú)的任務(wù)相互干擾。

然而，也許最令人驚訝的是，SoC 的這種變化預(yù)計(jì)不會(huì)影響 NVIDIA 的 SoC 交付日期。英偉達(dá)表示，他們將在 2025 年為汽車(chē)廠商提供Thor，這與亞特蘭的計(jì)劃到達(dá)時(shí)間相同。因此，雖然魔鬼在細(xì)節(jié)中，但在高水平上，英偉達(dá)的目標(biāo)是提供接近相同的Thor時(shí)間，因?yàn)樗麄儠?huì)交付Atlan 。不過(guò)值得注意的是，雖然 NVIDIA 此前曾宣布 Atlan 將在 2023 年出樣，但尚未發(fā)布關(guān)于 Thor 的此類(lèi)公告。因此，Thor 的送樣日期可能最終會(huì)晚于 Atlan 的送樣日期。

英偉達(dá)2019年對(duì)特斯拉自研芯片的評(píng)論原文

在2019年的特斯拉 Autonomy Day 投資者活動(dòng)中，埃隆·馬斯克 (Elon Musk) 公布了他的新型自動(dòng)駕駛汽車(chē)電腦的規(guī)格，他向全世界明確了幾件事。

首先，特斯拉正在提高所有其他汽車(chē)制造商的標(biāo)準(zhǔn)。

其次，特斯拉的自動(dòng)駕駛汽車(chē)將由基于其兩個(gè)新 AI 芯片的計(jì)算機(jī)提供動(dòng)力，每個(gè)芯片都配備 CPU、GPU 和深度學(xué)習(xí)加速器。該計(jì)算機(jī)每秒可提供 144 萬(wàn)億次操作 (TOPS)，使其能夠從一系列環(huán)繞攝像頭、雷達(dá)和超聲波收集數(shù)據(jù)，并為深度神經(jīng)網(wǎng)絡(luò)算法提供動(dòng)力。

第三，特斯拉正在研發(fā)下一代芯片，據(jù)說(shuō) 144 TOPS 還不夠。

在 NVIDIA，我們一直堅(jiān)信特斯拉重申的愿景：自動(dòng)駕駛汽車(chē)需要具備非凡能力的計(jì)算機(jī)。

這正是我們幾年前設(shè)計(jì)和制造 NVIDIA Xavier SoC 的原因。Xavier 處理器具有可編程 CPU、GPU 和深度學(xué)習(xí)加速器，可提供 30 TOPS的算力。我們基于雙芯片解決方案構(gòu)建了一臺(tái)名為 DRIVE AGX Pegasus 的計(jì)算機(jī)，將 Xavier 與強(qiáng)大的 GPU 配對(duì)以提供 160 TOPS，然后將兩組放在計(jì)算機(jī)上，總共提供 320 TOPS。

正如我們一年前（2018年）宣布的那樣，我們并沒(méi)有坐以待斃。我們的下一代處理器 Orin 即將問(wèn)世。

這就是為什么 NVIDIA 是馬斯克比較特斯拉的標(biāo)準(zhǔn)——我們是唯一一家以每秒數(shù)萬(wàn)億次操作或 TOPS 來(lái)描述這個(gè)問(wèn)題的公司。

但是，盡管我們?cè)诖缶稚贤馑挠^點(diǎn)——這是一個(gè)只能通過(guò)超級(jí)計(jì)算機(jī)級(jí)系統(tǒng)才能解決的挑戰(zhàn)——但特斯拉的演示文稿中存在一些我們需要糾正的不準(zhǔn)確之處。

將特斯拉的兩芯片全自動(dòng)駕駛計(jì)算機(jī)與英偉達(dá)的單芯片駕駛輔助系統(tǒng)的性能進(jìn)行比較是沒(méi)有用的。Tesla 的 144 TOP 的兩芯片 FSD 計(jì)算機(jī)將與NVIDIA DRIVE AGX Pegasus 計(jì)算機(jī)進(jìn)行比較，后者在 AI 感知、定位和路徑規(guī)劃方面以 320 TOPS 運(yùn)行。

此外，雖然 Xavier 提供了 30 TOPS 的處理能力，但特斯拉錯(cuò)誤地聲稱(chēng)它提供了 21 TOPS。此外，帶有單個(gè) Xavier 處理器的系統(tǒng)是為輔助駕駛 AutoPilot 功能而設(shè)計(jì)的，而不是完全自動(dòng)駕駛。正如特斯拉所說(shuō)，自動(dòng)駕駛需要更多的計(jì)算。

然而，特斯拉最重要的問(wèn)題是完全正確的：自動(dòng)駕駛汽車(chē)——這是提高安全性、效率和便利性的關(guān)鍵——是該行業(yè)的未來(lái)。它們需要大量的計(jì)算性能。

事實(shí)上，特斯拉認(rèn)為這種方法對(duì)行業(yè)的未來(lái)非常重要，因此它正在圍繞它建立自己的未來(lái)。這是前進(jìn)的道路。其他所有汽車(chē)制造商都需要提供這種水平的性能。

只有兩個(gè)地方可以獲得 AI 計(jì)算能力：NVIDIA 和 Tesla。其中只有一個(gè)是可供行業(yè)構(gòu)建的開(kāi)放平臺(tái)。

編輯：黃飛

閱讀全文