91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

用于工業(yè)AI的Jetson AGX Xavier模塊

星星科技指導員 ? 來源:嵌入式計算設計 ? 作者:Simon Holt ? 2022-06-08 14:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

工業(yè)物聯(lián)網(wǎng)架構師花了數(shù)年時間才得出結論,邊緣需要數(shù)據(jù)中心級的性能,以實現(xiàn)高效分析、提高安全性和降低網(wǎng)絡成本。在人工智能機器學習領域,傳感器設備內(nèi)部或附近對高端處理能力的需求從一開始就很明顯。

考慮到即使是簡單的自主機器(我知道這是矛盾的說法)也需要大量的計算能力來運行神經(jīng)網(wǎng)絡來執(zhí)行障礙物檢測、識別和避免等功能。例如,京東和菜鳥等公司生產(chǎn)的自動送貨車需要大約每秒 30 兆次運算 (TOPS) 的處理性能,而雅馬哈正在開發(fā)的自動駕駛檢查無人機需要大約 20 兆次運算 (TOPS) 的處理性能。

當然,這對嵌入式和工業(yè)工程師提出了一個經(jīng)典的設計挑戰(zhàn):平衡每瓦性能。性能太低,應用程序失敗。功耗太大,自主機器必須連接到持續(xù)的電源

隨著NVIDIA 的 Jetson AGX Xavier 模塊的發(fā)布,這種情況正在改變。

服務器級性能,嵌入式功耗

Jetson AGX Xavier 核心的 Xavier SoC 包含大量異構處理性能,適用于人工智能驅動的機器人應用程序,包括:

512 核 Volta GPU,帶有 64 個 TensorCore

八核、64 位基于 Arm 的 Carmel CPU

雙 NVDLA(NVIDIA 深度學習加速器)引擎

雙 7 路 VLIW 視覺加速器引擎

這代表 Jetson AGX 模塊的性能高達 32 TOPS,尺寸為 87 mm x 100 mm。如上圖所示,該芯片還包括一個 256 位 LPDDR4X 接口,能夠以 137 GBps 的速度將數(shù)據(jù)傳輸?shù)侥K上的 16 GB DRAM,用于與 AI 工作負載相關的頻繁讀寫。

基本上,Jetson AGX Xavier 以嵌入式模塊形式提供服務器級性能。然而,同樣重要的是,該模塊的功耗僅為 10W,或與臺式風扇差不多。用戶可將操作模式配置為 10W、15W 或 30W,NVIDIA 報告稱每瓦性能 (PPW) 的最佳點在 15W 左右。即使在那個水平(大約相當于藍光播放器的功耗),Jetson AGX Xavier 在推理性能和能源效率方面也大大超過了其前身 Jetson TX2 和 Intel Core i7 + GTX 1070 顯卡。

pYYBAGKgQDeAcKYxAADtibAg8G4288.png

Jetson AGX Xavier:引擎蓋下

Jetson AGX Xavier 的多項功能可實現(xiàn)這種類型的每瓦性能,從基礎芯片架構開始。雖然 SoC 上的每個內(nèi)核都有自己的內(nèi)存,但內(nèi)存是離散 SoC 模塊之間的零內(nèi)存復制。雖然 AGX Xavier 模塊確實通過外部 16 GB LPDDR4X DRAM 提供共享內(nèi)存,但片上數(shù)據(jù)只是通過管道傳遞到必要的處理核心。

架構的異構性也提高了效率,因為工作負載可以在最適合任務的架構上執(zhí)行。這方面的一個例子是片上加速引擎,它可以卸載 Volta GPU,以便它可以專注于更復雜或用戶定義的任務。例如,在以 8 位分辨率推斷固定功能卷積神經(jīng)網(wǎng)絡 (CNN) 時,NVDLA 引擎可提供高達 5 TOPS 的性能,以 16 位分辨率推斷 2.5 TFLOPS 時,功耗在 0.5W 和 1.5W 之間。

poYBAGKgQECARpmYAAFR4BDwBMw371.png

同時,Carmel CPU 內(nèi)核可以保留用于通用計算任務。

JetPack 簡化了深度學習編程的復雜性

Jetson AGX 系列運行 Linux,這在工業(yè)嵌入式系統(tǒng)中變得越來越普遍。許多希望利用 Jetson AGX Xavier 性能的工業(yè)和嵌入式開發(fā)人員可能不太熟悉的是對 GPU 和/或深度學習加速器進行編程。幸運的是,NVIDIA JetPack 4.1.1 軟件開發(fā)套件 (SDK)在CUDA Toolkit中提供了一攬子 API、嵌入式庫以及與常用語言的集成,因此您無需了解如何編程 GPU對 GPU 進行編程。

最新JetPack版本中的一些軟件工具包括:

Linux For Tegra R31.0.1 (K4.9)

CUDA 工具包 10.0

cuDNN 7.3

張量RT 5.0 GA

OpenCV 3.3.1

OpenGL 4.6 / GLES 3.2

伏爾甘 1.1

多媒體 API R31.1

阿格斯 0.97 相機 API

TensorRT 5.0 包中提供的 API 也簡化了對 DLA 進行編程以執(zhí)行神經(jīng)網(wǎng)絡工作負載。例如,_setDeviceType() 和 setDefaultDeviceType() 命令可用于在 GPU 或任一 DLA 上執(zhí)行特定的神經(jīng)網(wǎng)絡層或層,而像 _allowGPUFallback() 這樣的命令可讓工作負載在 DLA 不支持的情況下恢復到 GPU 。

此外,DeepStream 3.0 SDK 支持 Jetson AGX Xavier,該 SDK 利用 TensorRT、CUDA、多媒體和成像 API 來加速視頻分析應用程序的開發(fā)。

當然,低級 CUDA 編程是另一種選擇。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4838

    瀏覽量

    107854
  • NVIDIA
    +關注

    關注

    14

    文章

    5598

    瀏覽量

    109804
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5196

    瀏覽量

    135519
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    邊緣AI算力臨界點:深度解析176TOPS香橙派AI Station的產(chǎn)業(yè)價值

    /2TB選項)實現(xiàn)快速讀寫,未來還可以通過轉接卡擴展更高的帶寬外設,如高速采集卡或另一塊NPU模塊。 2、雙千兆網(wǎng)口 :在工業(yè)場景中,雙網(wǎng)口通常用于 數(shù)據(jù)隔離 。例如,一個網(wǎng)口連接工業(yè)
    發(fā)表于 03-10 14:19

    如何在NVIDIA Jetson AGX Thor上部署1200億參數(shù)大模型

    上一期介紹了如何在 NVIDIA Jetson AGX Thor 上使用 Docker 部署 vLLM 推理服務,以及使用 Chatbox 作為前端調(diào)用 vLLM 運行的模型(上期文章鏈接)。本期
    的頭像 發(fā)表于 12-26 17:06 ?4855次閱讀
    如何在NVIDIA <b class='flag-5'>Jetson</b> <b class='flag-5'>AGX</b> Thor上部署1200億參數(shù)大模型

    NVIDIA Jetson系列開發(fā)者套件助力打造面向未來的智能機器人

    NVIDIA Jetson AGX Thor、AGX Orin 以及 Jetson Orin Nano Super 開發(fā)者套件,助力打造面向未來的智能機器人。
    的頭像 發(fā)表于 12-13 10:20 ?3083次閱讀

    如何在NVIDIA Jetson AGX Thor上通過Docker高效部署vLLM推理服務

    繼系統(tǒng)安裝與環(huán)境配置后,本期我們將繼續(xù)帶大家深入 NVIDIA Jetson AGX Thor 的開發(fā)教程之旅,了解如何在 Jetson AGX Thor 上,通過 Docker 高效
    的頭像 發(fā)表于 11-13 14:08 ?4126次閱讀
    如何在NVIDIA <b class='flag-5'>Jetson</b> <b class='flag-5'>AGX</b> Thor上通過Docker高效部署vLLM推理服務

    NVIDIA Jetson AGX Thor Developer Kit開發(fā)環(huán)境配置指南

    NVIDIA Jetson AGX Thor 專為物理 AI 打造,與上一代產(chǎn)品 NVIDIA Jetson AGX Orin 相比,生成式
    的頭像 發(fā)表于 11-08 09:55 ?7282次閱讀
    NVIDIA <b class='flag-5'>Jetson</b> <b class='flag-5'>AGX</b> Thor Developer Kit開發(fā)環(huán)境配置指南

    通過NVIDIA Jetson AGX Thor實現(xiàn)7倍生成式AI性能

    Jetson Thor 平臺還支持多種主流量化格式,包括 NVIDIA Blackwell GPU 架構的新 NVFP4 格式,有助于進一步優(yōu)化推理性能。該平臺同時支持推測解碼等新技術,為在邊緣端加速生成式 AI 工作負載提供了新的途徑。
    的頭像 發(fā)表于 10-29 16:53 ?1439次閱讀

    BPI-AIM7 RK3588 AI與 Nvidia Jetson Nano 生態(tài)系統(tǒng)兼容的低功耗 AI 模塊

    套件 (100x80 毫米) 占用空間相同,與現(xiàn)有外殼兼容 Jetson Nano 兼容性 為 Jetson Nano 提供 5 V 和 12 V 電源輸入 比較 8 GB ArmSoM RK3588 AI
    發(fā)表于 10-11 09:08

    NVIDIA Jetson AGX Thor開發(fā)者套件重磅發(fā)布

    開發(fā)者與未來創(chuàng)造者們,準備好迎接邊緣AI的史詩級革新了嗎?NVIDIA以顛覆性技術再次突破極限,正式推出Jetson AGX Thor開發(fā)者套件!作為繼傳奇產(chǎn)品Jetson
    的頭像 發(fā)表于 08-28 14:31 ?1568次閱讀

    基于 NVIDIA Blackwell 的 Jetson Thor 現(xiàn)已發(fā)售,加速通用機器人時代的到來

    ·專為物理 AI 和機器人打造的機器人計算機 NVIDIA Jetson AGX Thor 開發(fā)者套件和量產(chǎn)級模組,現(xiàn)已發(fā)售。 ·超過 200 萬開發(fā)者正在使用 NVIDIA 的機器人技術棧,聯(lián)影
    發(fā)表于 08-26 09:28 ?1301次閱讀
    基于 NVIDIA Blackwell 的 <b class='flag-5'>Jetson</b> Thor 現(xiàn)已發(fā)售,加速通用機器人時代的到來

    NVIDIA Jetson AGX Thor開發(fā)者套件概述

    TFLOPS 的 AI 計算性能,從而輕松運行最新的生成式 AI模型,且功耗不超過 130 W。與 NVIDIA Jetson AGX Orin 相比,其
    的頭像 發(fā)表于 08-11 15:03 ?1911次閱讀

    NVIDIA Jetson + Isaac SDK 人形機器人方案全面解析

    Volta 6-core Carmel 21 10~15W 中性能服務型機器人 Jetson AGX Xavier 512-core
    的頭像 發(fā)表于 07-30 16:12 ?2209次閱讀

    Jetson平臺核心組件BOM清單概覽

    、Jetson Xavier NX、Jetson AGX Orin)的核心BOM清單進行梳理。需要注意的是,NVIDIA官方并
    的頭像 發(fā)表于 07-30 16:11 ?3156次閱讀

    NVIDIA Jetson + Isaac SDK 在人形機器人領域的方案詳解

    組件 描述 硬件平臺(Jetson系列) 面向邊緣AI和機器人開發(fā)的SoC模塊,搭載GPU + ARM CPU,支持多種傳感器和AI模型部署 軟件平臺(Isaac SDK / Isa
    的頭像 發(fā)表于 07-30 16:05 ?3634次閱讀

    邊緣AI MPU深度盤點:品牌、型號與技術特性全解析

    三個維度,結合典型應用場景,對主流邊緣AI MPU進行全面盤點。 一、國際品牌:技術領先,場景覆蓋全面 NVIDIA(英偉達) 代表型號 :Jetson系列(Orin Nano/NX/AGX
    的頭像 發(fā)表于 04-30 17:27 ?4166次閱讀

    市場上主流的端側AI MPU 大全

    ? ? NVIDIA ? ? Jetson系列 ?:面向邊緣AI的高性能MPU Jetson Orin Nano/NX/AGX(基于Ampere架構,4-64 TOPS算力)
    的頭像 發(fā)表于 04-02 17:44 ?4390次閱讀