91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Imagination 與 MulticoreWare 合作將 GPU 技術(shù)用于全新的雙目視覺(jué)方案

穎脈Imgtec ? 2022-11-30 15:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Imagination 近日宣布了與MulticoreWare.Inc公司的合作,后者是多核和異構(gòu)計(jì)算環(huán)境軟件解決方案和開(kāi)發(fā)工具的領(lǐng)先供應(yīng)商。MulticoreWare公司在展銳T710開(kāi)發(fā)板上實(shí)現(xiàn)雙目視覺(jué)算法stereoBM的openCL版本的移植和優(yōu)化,移植后的算法在GPU平臺(tái)上性能提升明顯。展銳T710開(kāi)發(fā)板內(nèi)部集成了Imagination GM9446顯示芯片,主頻為800MHz,采用12nm工藝制造,支持openCL4.0, openCL1.2和openGL3.0版本,最高性能能夠達(dá)到128 FP32 FLOPs/Clock 和256 FP16 FLOPs/Clock。CPU支持八核處理器,主頻2.0GHz, 內(nèi)部集成AI神經(jīng)網(wǎng)絡(luò)處理器NPU,綜合算力達(dá)4.2TOPS。29a56fb8-7045-11ed-b116-dac502259ad0.png為了進(jìn)一步提升開(kāi)發(fā)板的算力,MulticoreWare團(tuán)隊(duì)在雙目視覺(jué)stereoBM的OpenCL實(shí)現(xiàn)中,使用了開(kāi)發(fā)板的Imagination GM9446系列GPU作為運(yùn)算核心,相對(duì)于傳統(tǒng)CPU的雙目視覺(jué)算法stereo版本得到了極高的加速比。這組算法的設(shè)計(jì)充分使用了Imagination GM9446的特點(diǎn),采用大窗口尺寸和小分辨率圖像620x188,local memory存儲(chǔ)優(yōu)化等方式提高了程序的性能。

算法經(jīng)過(guò)調(diào)整不同的參數(shù),窗口winSize大小為21,n_disp為64的時(shí)候,性能達(dá)到最佳。通常kernel越復(fù)雜,寄存器占用的空間就越大,最大工作組的大小就越小,有時(shí)候發(fā)揮不出來(lái)并行流水線的最大數(shù)量,從而影響性能。

29c21514-7045-11ed-b116-dac502259ad0.png

MulticoreWare公司團(tuán)隊(duì)在對(duì)kernel代碼優(yōu)化內(nèi)部的寄存器使用量,根據(jù)GM9446內(nèi)部結(jié)構(gòu),設(shè)置合理的global全局工作組大小256x圖片高度,local工作大小為256,從而最大程度發(fā)揮GPU并行流水線的并發(fā)量,一般情況下,第一個(gè)維度的工作組大小應(yīng)該是wave大小的倍數(shù)(例如32),這樣可以充分利用wave資源,MulticoreWare團(tuán)隊(duì)根據(jù)多年優(yōu)化經(jīng)驗(yàn),手動(dòng)調(diào)整工作組大小以滿足這個(gè)條件來(lái)保證性能有所提升。29d69908-7045-11ed-b116-dac502259ad0.png此外內(nèi)存讀取也是影響kernel運(yùn)行效率的一方面,在OpenCL中一般有全局global內(nèi)存,本地local內(nèi)存,常量Constant和Private四種形式組成,MulticoreWare公司團(tuán)隊(duì)在將stereo算法重新調(diào)整內(nèi)存布局,將主機(jī)內(nèi)存使用零拷貝技術(shù)與GPU內(nèi)存直接填充,另外將內(nèi)核kernel多次內(nèi)存訪問(wèn)的數(shù)據(jù),從global內(nèi)存轉(zhuǎn)存到local內(nèi)存中,雖然增加了一次轉(zhuǎn)存數(shù)據(jù)的時(shí)間,但是對(duì)于對(duì)此存取數(shù)據(jù)整體時(shí)間是縮減的,從降低IO時(shí)間的角度整體提高了kernel內(nèi)核的運(yùn)行效率,性能也有所改善。運(yùn)行10次后進(jìn)行效率對(duì)比,GPU比CPU計(jì)算最高提速80倍左右,平均提速50倍左右。

CPU(展銳T710 2.0GHz)

CPU(Unisoc T710, 2.0GHz)

GPU

(Imagination GM9446)

倍數(shù)

Multiple

131.935 ms0.76 ms41.9
256.17 ms0.699 ms80.3
354.22 ms0.72 ms75.3
451.67 ms0.77 ms67
531.72 ms0.74 ms42.8
627.12 ms0.73 ms37.1
733.35 ms0.77 ms43.3
850.12 ms0.75 ms66.8
931.29 ms0.71 ms44
1029.73 ms0.72 ms41.29

未來(lái)Imagination和MulticoreWare兩家公司將致力于共同促進(jìn)OpenCL在行業(yè)中的廣泛采用,鼓勵(lì)OpenCL廣泛應(yīng)用于異構(gòu)計(jì)算、APU、以及CPU和GPU獨(dú)立計(jì)算的領(lǐng)域中,實(shí)現(xiàn)計(jì)算資源利用率最大化、高效率處理數(shù)據(jù)傳輸。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135427
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    雙目立體視覺(jué)相機(jī)產(chǎn)品介紹

    本產(chǎn)品是一款主打高精度感知、采用5V穩(wěn)定供電的雙目立體視覺(jué)相機(jī),核心由兩個(gè)經(jīng)過(guò)精密同步調(diào)試與專業(yè)校準(zhǔn)的獨(dú)立相機(jī)模塊組成,固定基線嚴(yán)格設(shè)定為60mm,專為各類場(chǎng)景下的三維空間感知與精準(zhǔn)距離測(cè)量需求量
    的頭像 發(fā)表于 02-28 15:08 ?127次閱讀
    <b class='flag-5'>雙目</b>立體<b class='flag-5'>視覺(jué)</b>相機(jī)產(chǎn)品介紹

    雙目視覺(jué)是如何實(shí)現(xiàn)深度估計(jì)的?

    [首發(fā)于智駕最前沿微信公眾號(hào)]自動(dòng)駕駛的純視覺(jué)方案中,單目攝像頭因無(wú)法直接感知深度,在環(huán)境理解上存在根本局限,雙目視覺(jué)技術(shù)在此需求下應(yīng)運(yùn)而生。它通過(guò)模擬人眼,利用雙攝像頭的視差來(lái)推算距
    的頭像 發(fā)表于 12-31 09:45 ?501次閱讀
    <b class='flag-5'>雙目視覺(jué)</b>是如何實(shí)現(xiàn)深度估計(jì)的?

    ICCAD 2025:Imagination展示E系列GPU創(chuàng)新技術(shù)與多元生態(tài)應(yīng)用

    與計(jì)算領(lǐng)域的創(chuàng)新成果,特別是新一代E系列GPU的強(qiáng)大性能與廣泛應(yīng)用前景。一主題演講:E系列GPU引領(lǐng)AI與圖形融合新紀(jì)元在展會(huì)同期技術(shù)論壇上,Imagination
    的頭像 發(fā)表于 11-24 18:14 ?621次閱讀
    ICCAD 2025:<b class='flag-5'>Imagination</b>展示E系列<b class='flag-5'>GPU</b>創(chuàng)新<b class='flag-5'>技術(shù)</b>與多元生態(tài)應(yīng)用

    FPGA和GPU加速的視覺(jué)SLAM系統(tǒng)中特征檢測(cè)器研究

    特征檢測(cè)是SLAM系統(tǒng)中常見(jiàn)但耗時(shí)的模塊,隨著SLAM技術(shù)日益廣泛應(yīng)用于無(wú)人機(jī)等功耗受限平臺(tái),其效率優(yōu)化尤為重要。本文首次針對(duì)視覺(jué)SLAM流程開(kāi)展硬件加速特征檢測(cè)器的對(duì)比研究,通過(guò)對(duì)比現(xiàn)代SoC平臺(tái)
    的頭像 發(fā)表于 10-31 09:30 ?659次閱讀
    FPGA和<b class='flag-5'>GPU</b>加速的<b class='flag-5'>視覺(jué)</b>SLAM系統(tǒng)中特征檢測(cè)器研究

    Imagination GPU 驅(qū)動(dòng)更新:新增多項(xiàng) Vulkan 與 OpenCL 擴(kuò)展支持

    最近,ImaginationGPU驅(qū)動(dòng)完成了重大更新。Imagination客戶現(xiàn)已可通過(guò)合作伙伴門戶(PartnerPortal)獲取最新版Linux與Android驅(qū)動(dòng)開(kāi)發(fā)套件(DDK)。我們
    的頭像 發(fā)表于 10-13 09:21 ?868次閱讀
    <b class='flag-5'>Imagination</b> <b class='flag-5'>GPU</b> 驅(qū)動(dòng)更新:新增多項(xiàng) Vulkan 與 OpenCL 擴(kuò)展支持

    雙目環(huán)視立體視覺(jué)系統(tǒng)在智能駕駛行業(yè)的應(yīng)用

    在智能駕駛技術(shù)飛速發(fā)展的當(dāng)下,雙目立體視覺(jué)憑借其獨(dú)特的感知優(yōu)勢(shì),在 360 環(huán)視產(chǎn)品方案以及各類輔助駕駛功能中發(fā)揮著關(guān)鍵作用,在最新法規(guī)要求與復(fù)雜場(chǎng)景下表現(xiàn)突出,為汽車在AEB、NOA
    的頭像 發(fā)表于 09-23 11:35 ?1157次閱讀

    Imagination GPU 全面支持 Vulkan 1.4 和 Android 16

    Imagination開(kāi)發(fā)者社區(qū)中廣受歡迎的圖形API,因其提供了低開(kāi)銷、跨平臺(tái)訪問(wèn)現(xiàn)代GPU的能力,幫助開(kāi)發(fā)者在多種設(shè)備上最大化性能與效率。其對(duì)GPU操作的顯式控制,以及對(duì)
    的頭像 發(fā)表于 08-14 11:18 ?2288次閱讀
    <b class='flag-5'>Imagination</b> <b class='flag-5'>GPU</b> 全面支持 Vulkan 1.4 和 Android 16

    AMD助力MulticoreWare打造AI驅(qū)動(dòng)智能結(jié)算解決方案

    MulticoreWare 公司開(kāi)發(fā)了一款先進(jìn)的 AI 驅(qū)動(dòng)智能結(jié)算解決方案 RetailSentry AI,用于由 AMD 銳龍( Ryzen )嵌入式 8000 系列處理器提供支持的零售應(yīng)用。
    的頭像 發(fā)表于 08-12 17:07 ?2770次閱讀
    AMD助力<b class='flag-5'>MulticoreWare</b>打造AI驅(qū)動(dòng)智能結(jié)算解決<b class='flag-5'>方案</b>

    基于凌智視覺(jué)識(shí)別模塊的基于單目視覺(jué)的目標(biāo)物測(cè)量裝置

    1.視覺(jué)測(cè)量整體方案視覺(jué)測(cè)量系統(tǒng)采用單目視覺(jué)技術(shù)實(shí)現(xiàn)目標(biāo)物距離
    的頭像 發(fā)表于 07-31 15:35 ?975次閱讀
    基于凌智<b class='flag-5'>視覺(jué)</b>識(shí)別模塊的基于單<b class='flag-5'>目視覺(jué)</b>的目標(biāo)物測(cè)量裝置

    雙目視覺(jué)在智能駕駛領(lǐng)域的應(yīng)用

    圍繞“雙目智駕應(yīng)用”,我們推出系列文章深入解析雙目視覺(jué)如何跨越技術(shù)鴻溝,在中國(guó)智駕的沃土上生根發(fā)芽,探索其賦能未來(lái)出行的無(wú)限可能。
    的頭像 發(fā)表于 07-09 16:21 ?1297次閱讀

    Imagination與澎峰科技攜手推動(dòng)GPU+AI解決方案,共拓計(jì)算生態(tài)

    的深度融合展開(kāi)合作。雙方結(jié)合 Imagination 領(lǐng)先的 GPU IP 技術(shù)與澎峰科技在 AI 模型壓縮與性能優(yōu)化方面的軟硬協(xié)同能力
    發(fā)表于 05-21 09:40 ?1216次閱讀

    Imagination與澎峰科技攜手推動(dòng)GPU+AI解決方案,共拓計(jì)算生態(tài)

    近日,ImaginationTechnologies與國(guó)內(nèi)領(lǐng)先的異構(gòu)計(jì)算軟件與智算混合云服務(wù)提供商澎峰科技(PerfXLab)正式簽署合作備忘錄(MoU),圍繞GPU與AI的深度融合展開(kāi)合作。雙方
    的頭像 發(fā)表于 05-20 08:33 ?930次閱讀
    <b class='flag-5'>Imagination</b>與澎峰科技攜手推動(dòng)<b class='flag-5'>GPU</b>+AI解決<b class='flag-5'>方案</b>,共拓計(jì)算生態(tài)

    打破室外全域工作“盲區(qū)”!廣和通雙目視覺(jué)算法將成就云深處科技機(jī)器狗“慧眼”

    (2025年5月15日)在智能機(jī)器人領(lǐng)域,運(yùn)用視覺(jué)算法和能力處理室外工作長(zhǎng)期面臨挑戰(zhàn)。據(jù)官方報(bào)道,全球領(lǐng)先的AI解決方案提供商廣和通和具身智能行業(yè)應(yīng)用與技術(shù)創(chuàng)新引領(lǐng)者云深處科技合作,廣
    發(fā)表于 05-15 14:26 ?1636次閱讀
    打破室外全域工作“盲區(qū)”!廣和通<b class='flag-5'>雙目視覺(jué)</b>算法將成就云深處科技機(jī)器狗“慧眼”

    奧比中光發(fā)布新一代雙目3D相機(jī)Gemini 435Le

    近日,奧比中光在美國(guó)底特律舉辦的Automate 2025展會(huì)上發(fā)布Gemini 435Le,獲得眾多機(jī)器人專業(yè)人士的關(guān)注。作為最新一代工業(yè)級(jí)雙目視覺(jué)解決方案,Gemini 435Le雙目3D相機(jī)在前作基礎(chǔ)上針對(duì)智能機(jī)器人的工業(yè)自動(dòng)化應(yīng)用場(chǎng)景進(jìn)行了大幅提升,目前具備業(yè)界領(lǐng)
    的頭像 發(fā)表于 05-14 17:15 ?1097次閱讀

    GPU領(lǐng)域再迎重大創(chuàng)新——全新Imagination DXTP GPU功效提升20%

    功效比超高的DXTPGPUIP將為圖形計(jì)算與邊緣AI應(yīng)用SoC的創(chuàng)新提供巨大的幫助Imagination于不久前正式發(fā)布了DXTPGPUIP,這款新產(chǎn)品的亮點(diǎn)在于,在標(biāo)準(zhǔn)圖形工作負(fù)載下,其能效比
    的頭像 發(fā)表于 03-19 11:39 ?1179次閱讀
    <b class='flag-5'>GPU</b>領(lǐng)域再迎重大創(chuàng)新——<b class='flag-5'>全新</b><b class='flag-5'>Imagination</b> DXTP <b class='flag-5'>GPU</b><b class='flag-5'>將</b>功效提升20%