91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

“玲瓏”編解碼融合架構助力視頻多元化需求

LiveVideoStack ? 來源:LiveVideoStack ? 2023-05-20 11:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著近年來 AI 技術的興起,視頻監(jiān)控、汽車、智能家居、移動設備及數據中心等對高清視頻處理有了越來越高的要求。安謀科技全新視頻處理器——“玲瓏”V6/V8,針對主流市場的視頻流媒體技術進行了大量投入,通過一系列智能權衡實現了極大優(yōu)化,為所有合作伙伴提供靈活的組合和選擇。LiveVideoStackCon 2022北京站邀請到了安謀科技多媒體產品經理董峰,為我們分享“玲瓏”編解碼融合架構助力視頻多元化需求。

此次是安謀科技在LiveVideoStack大會的演講首秀。安謀科技是中國最大的芯片IP設計與服務供應商,在立足全球生態(tài)、深耕本土創(chuàng)新的基礎上,堅持以自研IP技術的創(chuàng)新發(fā)展與Arm IP相配合,為本土集成電路產業(yè)提供豐富的產品組合和解決方案。

自2018年獨立運營以來,安謀科技堅持開展自研IP和發(fā)展Arm IP業(yè)務,一方面是結合中國市場需求積極布局自研業(yè)務,堅持“全球標準,本土創(chuàng)新”,陸續(xù)推出“周易”NPU、“星辰”CPU、“山海”SPU以及“玲瓏”ISP&VPU等自研IP成果,并全部實現了客戶相關芯片產品的流片和量產。另一方面,安謀科技也致力于將Arm 先進的架構和技術引進國內,滿足國內公司開發(fā)具有全球競爭力產品的需求。在兩大支柱業(yè)務的合力之下,目前安謀科技已打造一體化、完整的異構計算IP核心矩陣,助力中國智能計算產業(yè)高速發(fā)展。

芯片IP廠商需要考慮多元化的需求,應當滿足不同場景下的不同訴求。對于視頻來說,無論是端、邊、云都有很大的視頻編解碼需求。端側手機、IPC、無人機等不同場景對視頻編解碼的需求存在較大差異。而云端和車載則是完全不同的方向。手機以及安防在編碼和解碼方面差異也較為明顯,手機客戶解碼需求更強,但是旗艦機對于一些圖傳也存在不同需求。作為IP廠商如何面對復雜多變的市場需求是首當其沖的問題。

57d7d058-ed66-11ed-90ce-dac502259ad0.png

安謀科技VPU團隊在2019年底成立,從2020年初開始研發(fā)自研產品。我們團隊從Arm Mali-V52的維護開始,逐漸完成兩代產品的研發(fā)。為了更好地滿足行業(yè)基本格式需求,我們新增了AVS2和AV1格式,“玲瓏”V5/V7花費了近三個季度完成,“玲瓏”V6/V8則花費了將近一年。除了增加格式之外,還增強了整體編碼能力。“玲瓏”V5/V7的HEVC編碼質量與Arm Mali-V52/76相比提升了15%,“玲瓏”V6/V8的H.264編碼質量也比“玲瓏”V5/V7提升了10%。面對多樣的產品需求,增加了復雜的前后處理,“玲瓏”V5/V7增加了Any ratio downscaling的后處理;“玲瓏”V6/V8增加了OSD的前處理,以及YUV到RGB的后處理。

57ec1090-ed66-11ed-90ce-dac502259ad0.png

“玲瓏”VPU支持全格式,整體面積較小?!傲岘嚒盫5全格式支持包括前后處理P&R之后是1.83。芯片IP行業(yè)一直在追求更高的性能、更小的功耗和更小的面積,產品在迭代過程中針對上述問題的改進還是頗有成效。在整體架構方面也有別于其它架構,“玲瓏”VPU以單核實現編解碼融合,既可以編碼也可以解碼,以適用于多樣場景的需求。不只是硬件格式的支持,還囊括了可編程的軟件部分,以滿足對多種場景變化的需求。

在硬件層面上,“玲瓏”VPU添加更多靈活可配的接口,其它能力通過軟件層面實現擴展。該產品整體是5個MCU的結構,不同的MCU對應控制不同的硬件加速器。在spec分析階段,需要考慮哪些可以固化、哪些可以通過靈活的軟件配置實現,再將可固化的部分做成純硬件。

盡管端和云對處理器性能要求差異巨大,但是從芯片IP角度出發(fā),還是希望能用統(tǒng)一的方式來支撐不同場景的需求,基于多核的可拓展性對性能進行擴展,通過擴展核數以支持不同場景需求。例如,端側客戶單核即可滿足需求,而邊緣側大致需要四核,那云端基本需要八核。在7nm制程前提下,八核基本可以實現8k@60fps編碼或8k@120fps解碼。

58034724-ed66-11ed-90ce-dac502259ad0.png

除了上述的多核可拓展性之外,“玲瓏”VPU對于MCU本身也會有所考量。不同于Arm Cortex A和Cortex M的核,其單獨為視頻場景進行定制優(yōu)化,基本上仍然是5級的流水。而在頻率方面,和整個VPU同頻。16FF下至少可達到800MHz。由此可見,該核本身就可以保證其性能,在視頻場景下更側重于加速器的控制,所以不會讓其觸碰pixel內容,在指令集方面也做了很多優(yōu)化。

除了6個加速器之外,“玲瓏”VPU還有兩個DMA相關的單元,一個是SDMA,另一個是VDMA。VDMA主要用于處理Frame級別的數據,包括編碼的輸入數據和解碼的輸出數據,前后處理也可以通過該單元靈活擴展。這幾代產品的迭代都是把功能分散到不同的加速器以及top層上。應對不同場景的需求,除了性能和基本功能之外,系統(tǒng)層面仍然有差異化的需求,多路的隔離、系統(tǒng)訪存延遲優(yōu)化、降帶寬、降延時等都屬于系統(tǒng)層面的優(yōu)化,也和Arm的生態(tài)保持一致。

58137d9c-ed66-11ed-90ce-dac502259ad0.png

在系統(tǒng)層面,通過降帶寬、降延時來應對大帶寬系統(tǒng)的需求,基于AFBC,可與Arm GPU以及Display搭配進行,內部中間的參考幀使用AFBC壓縮,可讓帶寬在輸入和輸出都不壓縮的情況下降低35%。在GPU使用VPU解碼數據進行紋理渲染時,整體的帶寬可降低至原先的45%。在Display場景中,也可以達到類似的效果。除了整個數據流,中間的參考幀數據也可以單獨拿出來為后面的單元進行相對地管理,也可以有效降低帶寬?!傲岘嚒盫PU圍繞各個層面進行統(tǒng)一考量,以更好地降低帶寬需求。

581bc6a0-ed66-11ed-90ce-dac502259ad0.png

VPU不僅需要在視頻場景中考量系統(tǒng)層面的優(yōu)化,也需要從系統(tǒng)層面進行考量,內部的并行也可以在top ram進行優(yōu)化,以減少多核之間的內存訪存。VPU與CPU處理器、視頻、顯示的聯合也可以做到類似的效果。

582e866e-ed66-11ed-90ce-dac502259ad0.png

就AFBC本身而言,也分為不同的版本。AFBC是Arm Frame Buffer Compression的縮寫,簡單理解就是Arm系統(tǒng)層面上的無損壓縮,主要目的是帶寬的優(yōu)化。AFBC的能力是基于Arm整個IP層面來實現的,是在系統(tǒng)層面的整體優(yōu)化。對于ISP而言,Arm也有專用的AFBC模塊用來連接ISP,端側場景也可以在視頻里直接輸入AFBC數據以減少帶寬。AFBC的好處很多,尤其是對rotation十分友好,系統(tǒng)層面通過AFBC就可以繞過rotation這種耗帶寬的處理,從原始數據進行rotation的訪問,對于系統(tǒng)的總線來說存在不小的壓力。但通過AFBC的方式在內部優(yōu)化rotation,能夠支持連續(xù)的訪問,這種方式更簡單高效。此外,AFBC的不同格式也對系統(tǒng)的隨機訪問有所支持。

58403b52-ed66-11ed-90ce-dac502259ad0.png

“玲瓏”VPU原生就支持多路,端側場景也需要多路,對于云端場景來說多路更是剛需。應對多路復雜多分辨率的場景,也是巨大的考驗。“玲瓏”VPU通過核心調度器負責多核調度,多核并行按照條帶級別劃分任務,任何核都可以通過核心調度器硬件直接調度。“玲瓏”VPU原生硬件可支持4個上下文,4路不同場景都可以通過核心調度器進行切換。而總線仲裁器則負責系統(tǒng)層面的訪問,與核互聯以整體判決,從而優(yōu)化緩存,在輸出時可通過AXI進行。三步結合,一起對訪存進行優(yōu)化。

585be532-ed66-11ed-90ce-dac502259ad0.png

為應對云端和邊緣場景,除了對核進行優(yōu)化之外,硬件也要進行優(yōu)化。低功率可以通過LPI接口得以實現。整體來看,多核、異步處理是優(yōu)化過程中的核心部分。不同的要求可以使用不同的管理策略,靈活配置能夠更好地服務客戶。

586d200e-ed66-11ed-90ce-dac502259ad0.png

REF主要用于處理參考幀的訪問,可通過隨機訪問以達到性能的優(yōu)化。

587b6100-ed66-11ed-90ce-dac502259ad0.png

“玲瓏”VPU內部的算法十分靈活,ME的目標也很靈活。產品編碼的迭代更多是在ME層面上實現。

“玲瓏”VPU架構里的軟件控制同樣靈活,面對相應的需求可及時調整。實力強勁的廠商也可以使用自己的ME。對于ME的接口開放也是非常靈活的。

5888a0f4-ed66-11ed-90ce-dac502259ad0.png

盡管MC較為標準,但對于硬件的實現也較為靈活。

58938424-ed66-11ed-90ce-dac502259ad0.png

Transform在這里主要負責所有的變換,融合了不同的格式,也可以通過參數控制。

589e7b0e-ed66-11ed-90ce-dac502259ad0.png

58a96fbe-ed66-11ed-90ce-dac502259ad0.png

RASC主要負責整體的管理,數據流也是核間的IPC所控制管理的,具有較高的靈活調度性,可避免硬件本身的風險。RASC的設計比較考驗整體的設計能力,“玲瓏”VPU采用了一個小的MCU,基本上所有的代碼和數據都在ram里,緩存也與其它同類產品有所區(qū)別,我們擁有外部模塊的快速訪問接口。

58b59adc-ed66-11ed-90ce-dac502259ad0.png

MMU整體考量方向包括多路和安全,多路本身就需要完整的內存層面的隔離,MMU VA32bit和PA40bit,基本上可以滿足所有場景的需求。

58c27662-ed66-11ed-90ce-dac502259ad0.png

在屬性管理方面, protect、可執(zhí)行等方面屬性與SMMU類似,但與Arm SMMU整體架構不同,此處MMU更像是GPU內的MMU,想要應對每個處理單元的訪問,每個uTLB都應該有所配置,Micro uTLB和PTW也都有相應的優(yōu)化。

58d03b44-ed66-11ed-90ce-dac502259ad0.png

58dceb1e-ed66-11ed-90ce-dac502259ad0.png

SDMA是一個更為標準化的DMA。除了bitstream之外,還要應對多個硬件加速單元控制結構之間的傳輸。所以“玲瓏”VPU在硬件加速層面有很多細節(jié)處理,用以滿足整體系統(tǒng)層面的優(yōu)化。

58ebb57c-ed66-11ed-90ce-dac502259ad0.png

58f60798-ed66-11ed-90ce-dac502259ad0.png

Frame級別的控制管理都是由VDMA進行的??梢钥吹脚cFORMATTER相關的前處理都在FORMATTER里進行,前后處理也有各自的數據通路。最新一代的“玲瓏”VPU要比圖中所示增加了更多新的功能,前后處理層面也有更多的擴展。

5903c176-ed66-11ed-90ce-dac502259ad0.png

Deblock是濾波的模塊,用以應對不同格式filter的需求。

5910ac2e-ed66-11ed-90ce-dac502259ad0.png

Bitstream是編碼解碼碼流處理模塊,也是用于應對不同格式。在系統(tǒng)層面的 Bitstream會相對獨立,在系統(tǒng)層面劃分為“和流相關”或“和frame相關”,硬件控制會在系統(tǒng)層面進行兩步劃分,無論是編碼還是解碼,都要先MB在級別的劃分。

5921a0d8-ed66-11ed-90ce-dac502259ad0.png

這張圖是解碼的基本程序,碼流、MB、MV等信息都會進行保存。

59354cd2-ed66-11ed-90ce-dac502259ad0.png

編碼過程也與解碼過程類似。





審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • RGB
    RGB
    +關注

    關注

    4

    文章

    831

    瀏覽量

    61995
  • ARM處理器
    +關注

    關注

    6

    文章

    361

    瀏覽量

    43308
  • 視頻編解碼
    +關注

    關注

    2

    文章

    54

    瀏覽量

    12087
  • HEVC
    +關注

    關注

    1

    文章

    37

    瀏覽量

    24507
  • ai技術
    +關注

    關注

    1

    文章

    1313

    瀏覽量

    25755

原文標題:“玲瓏”編解碼融合架構助力視頻多元化需求

文章出處:【微信號:livevideostack,微信公眾號:LiveVideoStack】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    請問如何構建和運行視頻編解碼器示例應用程序?

    如何構建和運行視頻編解碼器示例應用程序?
    發(fā)表于 03-10 06:27

    TLV320AIC1x系列編解碼器:高性能與低功耗的完美融合

    TLV320AIC1x系列編解碼器:高性能與低功耗的完美融合 在電子設備不斷追求小型、低功耗和高性能的今天,音頻編解碼器的性能對產品的整體表現起著至關重要的作用。TI的TLV320A
    的頭像 發(fā)表于 02-03 11:10 ?184次閱讀

    深入解析LM4546B AC '97多通道音頻編解碼

    ,并且執(zhí)行AC '97 Rev 2.1架構中的模擬密集型功能。該編解碼器使用18位Sigma - Delta ADC和DAC,提供90 dB的動態(tài)范圍,能
    的頭像 發(fā)表于 02-03 10:50 ?214次閱讀

    深入剖析LM4549B:高性能音頻編解碼器的技術指南

    和豐富的功能,成為了眾多音頻應用的理想選擇。今天,我們就來深入剖析一下這款強大的音頻編解碼器。 文件下載: lm4549b.pdf 1. 產品概述 LM4549B是一款完全符合PC99標準的音頻編解碼器,它能夠出色地執(zhí)行AC '97 Rev 2.1
    的頭像 發(fā)表于 02-03 10:50 ?235次閱讀

    探索PCM3168A音頻編解碼器:高音質與多功能的完美融合

    探索PCM3168A音頻編解碼器:高音質與多功能的完美融合 在音頻處理領域,一款性能卓越的編解碼器對于實現高質量的音頻體驗至關重要。今天,我們就來深入探討德州儀器(Texas Instruments
    的頭像 發(fā)表于 02-02 14:30 ?242次閱讀

    瑞芯微RK3562平臺FFmpeg硬件編解碼移植及性能測試實戰(zhàn)攻略

    數字音頻、視頻,提供了錄制、轉換以及流化音視頻的完整解決方案。實測數據(1)2K視頻編解碼,視頻文件大小為103MB硬件
    的頭像 發(fā)表于 11-28 19:02 ?1325次閱讀
    瑞芯微RK3562平臺FFmpeg硬件<b class='flag-5'>編解碼</b>移植及性能測試實戰(zhàn)攻略

    視頻編解碼封裝解封裝部件介紹

    是否有探索開源鴻蒙音視頻編解碼技術的欲望?是否對開源鴻蒙音視頻編解碼格式支持有訴求?別急——今天這份開源鴻蒙AVCodec Kit介紹文章,就是解答疑惑的指南!參考這份指南,可以使用開
    的頭像 發(fā)表于 10-31 09:15 ?509次閱讀
    音<b class='flag-5'>視頻</b><b class='flag-5'>編解碼</b>封裝解封裝部件介紹

    瑞芯微RK3588平臺FFmpeg硬件編解碼移植及性能測試實戰(zhàn)攻略

    數字音頻、視頻,提供了錄制、轉換以及流化音視頻的完整解決方案。實測數據(1)2K視頻編解碼視頻文件大小為103MB硬件
    的頭像 發(fā)表于 10-21 13:51 ?1763次閱讀
    瑞芯微RK3588平臺FFmpeg硬件<b class='flag-5'>編解碼</b>移植及性能測試實戰(zhàn)攻略

    增強T-BOX設計,新唐編解碼器的重要作用

    。 T-BOX音頻架構: T-BOX 音頻架構的主要特點包括: 獨立電源管理系統(tǒng) 雙麥克風音頻處理 編解碼器、D類音頻放大器和車載信息娛樂系統(tǒng)(IVI)的分離 新唐科技推出兩款專為車規(guī)級應用設計的低功耗、高
    發(fā)表于 09-05 06:26

    視耀T1 MINI-4路4K編解碼器丨端到端超低延時賦能4K超清視界

    \'小身材、大能量\'核心優(yōu)勢的同時,持續(xù)賦能智慧城市、元宇宙等前沿領域對極致畫質與實時交互的雙向需求。這款兼具技術深度與場景廣度的編解碼器,正逐步成為音視頻產業(yè)全鏈路升級的理想載體。\"
    發(fā)表于 08-28 13:43

    RK3576助力智慧安防:8路高清采集與AI識別

    在智慧城市和數字園區(qū)的建設過程中,安防監(jiān)控系統(tǒng)正從“被動記錄”走向“主動識別與分析”。隨著AI算法的成熟和高清視頻處理能力的提升,市場對多路視頻采集、實時拼接、智能識別的需求日益增強
    發(fā)表于 08-22 17:41

    AI玩具爆發(fā),音頻編解碼器如何滿足語音交互需求

    編解碼器(Audio Codec)是用于壓縮、解壓縮和轉換音頻信號的硬件設備或軟件算法。其核心作用是在保證音質的前提下,減少音頻數據的存儲空間和傳輸帶寬需求。 ? 通常音頻編解碼器擁有硬件和軟件兩方面,硬件上擁有獨立的電子元件,
    的頭像 發(fā)表于 06-20 01:07 ?7275次閱讀

    新一代視頻編解碼標準H.266走向主流 頭部視頻平臺滲透率超70%

    4月21日消息,視頻技術前沿研究與應用研討會近期在北京舉行,活動由阿里巴巴達摩院舉辦,中國網絡視聽協(xié)會副會長陶嘉慶等行業(yè)專家出席。達摩院視頻技術實驗室負責人葉琰介紹,新一代視頻編解碼
    發(fā)表于 04-21 11:24 ?1146次閱讀
    新一代<b class='flag-5'>視頻</b><b class='flag-5'>編解碼</b>標準H.266走向主流 頭部<b class='flag-5'>視頻</b>平臺滲透率超70%

    啟明智顯定制HMI方案,滿足多元化客戶需求

    通信協(xié)議,醫(yī)療設備則需要保證智慧屏能夠符合醫(yī)療級安全認證。啟明智顯深度理解客戶需求,面對多元且復雜的客戶需求,提出一站式HMI方案項目定制。定制HMI方案的優(yōu)勢硬件
    的頭像 發(fā)表于 04-17 18:02 ?648次閱讀
    啟明智顯定制<b class='flag-5'>化</b>HMI方案,滿足<b class='flag-5'>多元化</b>客戶<b class='flag-5'>需求</b>

    iTOP-3588開發(fā)板采用瑞芯微RK3588處理器四核心架構GPU內置獨立NPU強大的視頻編解碼

    視頻編解碼 8K編碼+8K解碼,多路視頻源同時解碼。支持8K@60fps H.265/H.264/VP9/AV1
    發(fā)表于 04-09 16:09