91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

TensorRT極致推理加速,望塵科技打造新一代實時AI體育全場景多維重構(gòu)引擎

NVIDIA英偉達企業(yè)解決方案 ? 來源:未知 ? 2022-12-01 22:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

深圳望塵科技公司擁有國內(nèi)領(lǐng)先的 AI 視覺算法團隊和實時渲染引擎,十年來一直專注于體育游戲與其相關(guān) AI 視覺技術(shù)的研發(fā),積累了巨量的球員角色數(shù)據(jù)庫,不僅有所有在國際足聯(lián)注冊的 2 萬名職業(yè)球員精確到厘米的球員體型、骨長、BMI、體脂肌肉比等數(shù)據(jù),還有數(shù)千名頂級球員高精度的 3D 模型,幾乎全球所有主要球場的高精度模型。




基于這些高質(zhì)量結(jié)構(gòu)化的數(shù)據(jù),Arena4D 可將捕捉結(jié)果在實時渲染引擎中以接近照片級真實的質(zhì)量渲染,用完全自由的鏡頭特效和運鏡方式實現(xiàn)前所未有的震撼體驗。


Arena4D 空間追蹤識別及數(shù)據(jù)處理

面臨算力挑戰(zhàn)


  • 球員和球的運動速度快,姿態(tài)變化大,且衣服外貌相似性較大,難以使用行業(yè)通用的 MOT 算法進行高質(zhì)量的追蹤和姿態(tài)識別。

  • 即使是 4k 圖像,球員和球在圖像中太小,追蹤困難。

  • 多臺高清攝像頭每幀圖像需上傳到顯卡進行實時轉(zhuǎn)碼、降噪等前處理工作,數(shù)據(jù)吞吐量較大。

  • 基于神經(jīng)網(wǎng)絡(luò)的計算流水線,需要實時進行多個視角、多個運動員的追蹤、識別、姿態(tài)估計與降噪計算。

  • 在多個 AI 模型級聯(lián)計算流水線中,每個 AI 模型之間的數(shù)據(jù)處理與拷貝占用了大量的時間。


NVIDIA AI 計算平臺為Arena4D

實現(xiàn)全流程GPU加速提供算力支持


基于以上挑戰(zhàn),望塵科技選擇了采用 NVIDIA AI 計算平臺來提供支持,使用后給研發(fā)和項目落地帶來了巨大的支持和提升。


1、基于 GalaSports 體育游戲渲染生成巨量的合成數(shù)據(jù),在 NVIDIA 數(shù)據(jù)中心 GPU 上進行加速訓(xùn)練。首先在有 GT 的合成數(shù)據(jù)上訓(xùn)練基礎(chǔ)網(wǎng)絡(luò),然后再在手工標(biāo)注的真實數(shù)據(jù)上進行 finetune。


2、Arena4D 采用了 NVIDIA TensorRT 推理加速引擎,TensorRT 首先對神經(jīng)網(wǎng)絡(luò)進行量化處理,然后再優(yōu)化、合并算子,最后經(jīng)過 Batch 化,推理處理速度較原來提升了 4-12 倍,能高效地處理多路攝像頭 4k 高清數(shù)據(jù),實時提取球員的 3D Pose 和外貌特征并進行匹配計算。


3、將原有基于 CPU 運行的數(shù)據(jù)拷貝,圖像格式轉(zhuǎn)換,圖像 crop/resize 等耗時較多的操作流水線,利用 CUDA 進行實現(xiàn),完全切換到 GPU 處理,比起 CPU 實現(xiàn)的方案,加速 50~100 倍。


4、針對體育場景中運動員速度快、運動幅度大、圖像中尺寸小的特點,改進了網(wǎng)絡(luò)結(jié)構(gòu)和算子,使其適合體育場這種稀疏變化,追蹤角色小的場景;提升了 MOT 算法,通過多個視圖的 fusion 網(wǎng)絡(luò)對 2D 追蹤結(jié)果進行 finetune,實現(xiàn)多視圖在 3D 空間的追蹤。


圖1:整體流程

圖片來源及所屬:Galasports 望塵科技


5、針對神經(jīng)網(wǎng)絡(luò)流水線的計算延遲問題,首先根據(jù)體育比賽的使用場景與相機視角對模型結(jié)構(gòu)進行了優(yōu)化,根據(jù)不同體育類型的相機機位和球場尺度,設(shè)計了專門針對特定比賽的識別網(wǎng)絡(luò),大大降低了網(wǎng)絡(luò)的復(fù)雜度;基于連續(xù)幀的姿態(tài)計算骨長度和 BMI 等球員特征,在數(shù)據(jù)庫中進行匹配提升識別準確率;針對多相機從內(nèi)存到顯存大量數(shù)據(jù)拷貝 IObound 問題,使用 CUDA 多流技術(shù)實現(xiàn)了內(nèi)存拷貝與數(shù)據(jù)處理并行化,降低了 overhead,4 路4k 相機數(shù)據(jù)的拷貝與轉(zhuǎn)碼從 50ms 減少到 30ms;然后使用量化工具對網(wǎng)絡(luò)進行 fp16/int8(QAT) 量化加速,最后使用 NVIDIA TensorRT 針對 NVIDIA 數(shù)據(jù)中心 GPU 編譯,在 NVIDIA 數(shù)據(jù)中心 GPU 上能達到最優(yōu)性能的模型。


圖2:計算延遲解決思路

圖片來源及所屬:Galasports 望塵科技


6、整個流水線經(jīng)過 TensorRT 編譯運行在 NVIDIA 數(shù)據(jù)中心 GPU 上,每路視頻信號由一張 GPU 進行實時計算,最后在 CPU 中對多路計算結(jié)果降噪融合。最終,以足球場場景為例,追蹤目標(biāo)為 1 個足球 + 22 名球員 + 3 名教練的位置與骨骼,在一張 NVIDIA 數(shù)據(jù)中心 GPU 設(shè)備上我們實現(xiàn)了平均 50ms/幀的速度,在二張 NVIDIA 數(shù)據(jù)中心 GPU 設(shè)備上能達到平均 30ms/幀的速度,整個流水線比原型提升了 18 倍。


使用了 NVIDIA TensorRT 推理加速引擎NVIDIA 數(shù)據(jù)中心計算卡,Arena4D 整個流水線可實時運行,進一步提升了用戶使用體驗,為擴展 AI 體育方向的其他業(yè)務(wù)、甚至是 XR 場景的加入打下了良好的基礎(chǔ)。


NVIDIA 助力望塵科技

打造新一代實時 AI 體育全場景多維重構(gòu)引擎


Arena4D 通過 NVIDIA TensorRT 等技術(shù),實現(xiàn)了多視圖在 3D 空間的追蹤、提升了識別骨長度和 BMI 等球員特征的準確率、完成了內(nèi)存拷貝與數(shù)據(jù)處理的并行化、改進了網(wǎng)絡(luò)結(jié)構(gòu)和算子使其適合體育場的稀疏變化,最終實現(xiàn)全流程 GPU 加速,速度提升超過 50~100 倍。


AI 體育行業(yè)是最受關(guān)注的人工智能應(yīng)用領(lǐng)域之一,傳統(tǒng)的體育企業(yè)也開始擁抱科技,紛紛引入人工智能產(chǎn)業(yè)。一個集技術(shù)、人才與場景優(yōu)勢的科技企業(yè)必須與一個優(yōu)秀的合作伙伴一起積極開拓和長期發(fā)展。NVIDIA 提供的 GPU 解決方案,解決了深度學(xué)習(xí)機器學(xué)習(xí)的技術(shù)難題,使得望塵科技在 AI 體育領(lǐng)域能夠持續(xù)不斷地創(chuàng)新產(chǎn)品,拓寬 AI 應(yīng)用場景,為觀眾和球迷提供新時代的數(shù)字化全新觀賽體驗。


NVIDIA 初創(chuàng)加速計劃


望塵科技是 NVIDIA 初創(chuàng)加速計劃 (NVIDIA Inception) 會員企業(yè)。NVIDIA 初創(chuàng)加速計劃為免費會員制、旨在培養(yǎng)顛覆行業(yè)格局的優(yōu)秀創(chuàng)業(yè)公司。該計劃聯(lián)合國內(nèi)外知名的風(fēng)投機構(gòu),創(chuàng)業(yè)孵化器,創(chuàng)業(yè)加速器,行業(yè)合作伙伴以及科技創(chuàng)業(yè)媒體等,打造創(chuàng)業(yè)加速生態(tài)系統(tǒng)。能夠提供產(chǎn)品折扣,技術(shù)支持,市場宣傳,融資對接,業(yè)務(wù)推薦等一系列服務(wù),加速創(chuàng)業(yè)公司的發(fā)展。


想獲得 NVIDIA 初創(chuàng)加速生態(tài)助力?掃描下方二維碼,僅需一分鐘填寫意向申請表單,獲得快速聯(lián)系。



原文標(biāo)題:TensorRT極致推理加速,望塵科技打造新一代實時AI體育全場景多維重構(gòu)引擎

文章出處:【微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英偉達
    +關(guān)注

    關(guān)注

    23

    文章

    4091

    瀏覽量

    99274

原文標(biāo)題:TensorRT極致推理加速,望塵科技打造新一代實時AI體育全場景多維重構(gòu)引擎

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    使用NORDIC AI的好處

    原始傳感器數(shù)據(jù),可顯著降低功耗、延長電池壽命。[Edge AI 概述; Nordic Edge AI 技術(shù)頁] 降低云依賴與時延 直接在設(shè)備上做推理,很多決策可以“本地實時”完成,
    發(fā)表于 01-31 23:16

    曦望發(fā)布新一代推理GPU芯片,單位Token推理成本降低90%

    已突破萬片。 ? 啟望S3是專為大模型推理打造的定制化GPGPU芯片。在典型推理場景下,它的整體性價比較上一代提升超10倍。在算力與存儲設(shè)計
    的頭像 發(fā)表于 01-28 17:38 ?9242次閱讀

    云巨頭算力戰(zhàn)升級!微軟新一代3nm AI推理芯片性能提升30%,落地數(shù)據(jù)中心

    據(jù)外媒報道,微軟發(fā)布新一代人工智能芯片Maia 200,這款芯片有望成為英偉達旗艦處理器以及云服務(wù)競爭對手亞馬遜、谷歌同類產(chǎn)品的替代選擇。微軟稱,這款芯片是為 AI 推理規(guī)?;渴?b class='flag-5'>打造
    的頭像 發(fā)表于 01-27 12:29 ?9268次閱讀
    云巨頭算力戰(zhàn)升級!微軟<b class='flag-5'>新一代</b>3nm <b class='flag-5'>AI</b><b class='flag-5'>推理</b>芯片性能提升30%,落地數(shù)據(jù)中心

    算力密度翻倍!江原D20加速卡發(fā)布,卡雙芯重構(gòu)AI推理標(biāo)桿

    的關(guān)鍵技術(shù)瓶頸。 ? 在此背景下,江原科技推出采用自研AI芯片的AI加速卡江原D10,并在今年5月實現(xiàn)量產(chǎn)交付。在大算力AI芯片全流程國產(chǎn)化產(chǎn)業(yè)鏈實現(xiàn)首次突破后,11月11日,江原科技
    的頭像 發(fā)表于 11-14 08:21 ?1w次閱讀
    算力密度翻倍!江原D20<b class='flag-5'>加速</b>卡發(fā)布,<b class='flag-5'>一</b>卡雙芯<b class='flag-5'>重構(gòu)</b><b class='flag-5'>AI</b><b class='flag-5'>推理</b>標(biāo)桿

    NVIDIA TensorRT LLM 1.0推理框架正式上線

    TensorRT LLM 作為 NVIDIA 為大規(guī)模 LLM 推理打造推理框架,核心目標(biāo)是突破 NVIDIA 平臺上的推理性能瓶頸。為實
    的頭像 發(fā)表于 10-21 11:04 ?1208次閱讀

    【內(nèi)測活動同步開啟】這么???這么強?新一代大模型MCP開發(fā)板來啦!

    【內(nèi)測活動同步開啟】這么?。窟@么強?新一代大模型MCP開發(fā)板來啦! 聆思全新一代六合芯片「LS26系列」,搭載WIFI / BLE & BT / NPU,與「小聆AI」強強
    發(fā)表于 09-25 11:47

    積算科技上線赤兔推理引擎服務(wù),創(chuàng)新解鎖FP8大模型算力

    的模型輕量化部署方案。用戶通過遠程算力平臺預(yù)置的模型鏡像與AI工具,僅需50%的GPU算力即可解鎖大模型推理、企業(yè)知識庫搭建、智能體開發(fā),加速大模型在智能問答、報告生成、客服助手、智能體等典型行業(yè)
    的頭像 發(fā)表于 07-30 21:44 ?939次閱讀

    信而泰×DeepSeek:AI推理引擎驅(qū)動網(wǎng)絡(luò)智能診斷邁向 “自愈”時代

    模態(tài)的技術(shù)特性,DeepSeek正加速推動AI在金融、政務(wù)、科研及網(wǎng)絡(luò)智能化等關(guān)鍵領(lǐng)域的深度應(yīng)用。 信而泰:AI推理引擎賦能網(wǎng)絡(luò)智能診斷新范
    發(fā)表于 07-16 15:29

    如何在魔搭社區(qū)使用TensorRT-LLM加速優(yōu)化Qwen3系列模型推理部署

    TensorRT-LLM 作為 NVIDIA 專為 LLM 推理部署加速優(yōu)化的開源庫,可幫助開發(fā)者快速利用最新 LLM 完成應(yīng)用原型驗證與產(chǎn)品部署。
    的頭像 發(fā)表于 07-04 14:38 ?2229次閱讀

    PTR54L15系列低功耗無線多協(xié)議模組

    PTR54L15系列多協(xié)議無線模組,基于Nordic新一代nRF54L15平臺打造,以超低功耗、高性能和多協(xié)議支持為核心,為智能家居、工業(yè)自動化、可穿戴設(shè)備等場景提供了站式解決方案。
    發(fā)表于 06-28 21:23

    廣和通發(fā)布新一代AI語音智能體FiboVista

    近日,2025火山引擎Force原動力大會正式開幕。廣和通發(fā)布新一代AI語音智能體FiboVista,并已率先應(yīng)用于車聯(lián)網(wǎng),成為智能駕駛的“用車伙伴”和“出行伴侶”。通過創(chuàng)新AI大模型
    的頭像 發(fā)表于 06-17 09:22 ?1282次閱讀

    AI驅(qū)動智慧交通:加速應(yīng)用場景落地

    智慧交通與人工智能的深度融合正在催生新一代交通生態(tài)系統(tǒng),這種融合不僅體現(xiàn)在技術(shù)層面的創(chuàng)新突破,更在于重構(gòu)了整個交通產(chǎn)業(yè)的運行邏輯和價值鏈條。AI技術(shù)作為智慧交通的核心引擎,通過算法、算
    的頭像 發(fā)表于 06-06 14:12 ?697次閱讀

    高德聯(lián)合極氪推出新一代全域車道級導(dǎo)航

    近日,極氪007GT正式上市發(fā)布,并宣布將在業(yè)內(nèi)首搭基于高性能實時地圖渲染引擎構(gòu)建的新一代全域車道級導(dǎo)航,以全場景全要素3D高階渲染,帶來3A游戲般的驚艷視覺體驗。
    的頭像 發(fā)表于 04-17 09:49 ?1111次閱讀

    谷歌新一代 TPU 芯片 Ironwood:助力大規(guī)模思考與推理AI 模型新引擎?

    電子發(fā)燒友網(wǎng)報道(文 / 李彎彎)日前,谷歌在 Cloud Next 大會上,隆重推出了最新一代 TPU AI 加速芯片 ——Ironwood。據(jù)悉,該芯片預(yù)計于今年晚些時候面向 Google
    的頭像 發(fā)表于 04-12 00:57 ?3776次閱讀

    RAKsmart服務(wù)器如何重塑AI高并發(fā)算力格局

    AI大模型參數(shù)量突破萬億級、實時推理需求激增的當(dāng)下,傳統(tǒng)服務(wù)器架構(gòu)的并發(fā)處理能力已逼近物理極限。RAKsmart通過“硬件重構(gòu)+軟件定義”的雙引擎
    的頭像 發(fā)表于 04-03 10:37 ?938次閱讀