電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))在大型數(shù)據(jù)中心里,視頻處理或許是當(dāng)下占比最高的關(guān)鍵工作負(fù)載,疫情期間,人們?cè)谝曨l細(xì)分的產(chǎn)品上所花時(shí)間越來(lái)越多。對(duì)于云服務(wù)廠商來(lái)說(shuō),視頻市場(chǎng)帶來(lái)的紅利仍然在持續(xù),但對(duì)于視頻網(wǎng)站和視頻app等產(chǎn)品來(lái)說(shuō),他們面臨的服務(wù)器成本壓力也在與日俱增。
?
云平臺(tái)的視頻轉(zhuǎn)碼單價(jià)/ 華為云
比如隨著流量激增,Teams、Zoom和騰訊會(huì)議等服務(wù)都出現(xiàn)了崩潰的事故,有的視頻網(wǎng)站面臨巨額的服務(wù)器費(fèi)用和下跌的營(yíng)收,也開(kāi)始采取壓縮畫(huà)質(zhì)等策略。盡管服務(wù)器端的摩爾定律依然在延續(xù),但面對(duì)視頻處理的計(jì)算需求,已經(jīng)開(kāi)始有些力不從心了,哪怕在專(zhuān)業(yè)處理圖形的GPU加持下也是如此。如果不采用特定領(lǐng)域的ASIC硬件加速器,成本壓力將會(huì)繼續(xù)堆積。
全球最大視頻網(wǎng)站的策略
作為全球最大視頻網(wǎng)站Youtube的所有者,照理說(shuō)谷歌面臨的壓力是最大的,但Youtube從疫情至今,卻基本維持著穩(wěn)定的狀態(tài),而且視頻質(zhì)量也是同行中最高的那一檔。能維持住這樣服務(wù)器壓力,靠的并不是傳統(tǒng)的CPU+GPU商用服務(wù)器組合,而是谷歌自研的視頻處理芯片VCU。
谷歌預(yù)見(jiàn)了真正大規(guī)模視頻處理和其他消費(fèi)級(jí)服務(wù)器用例的根本差異,尤其是在數(shù)據(jù)多樣性、質(zhì)量要求、吞吐量和成本上。所以谷歌打算從計(jì)算資源最昂貴的一塊,也就是視頻處理這塊著手,設(shè)計(jì)自己的VCU處理單元,解決從視頻共享、照片與視頻云存儲(chǔ)、直播到云游戲等一眾業(yè)務(wù)上的視頻處理難題。
VCU的設(shè)計(jì)思路
谷歌的VCU全名為視頻編碼單元,單個(gè)芯片集成了10個(gè)編碼核心、3個(gè)解碼核心。從谷歌VCU芯片的布圖規(guī)劃也可以看出,大部分區(qū)域都分配給了編碼器核心,其次是四通道的LPDDR4內(nèi)存,不僅提供邊帶錯(cuò)誤糾正,也提供芯片所需的帶寬。
?
VCU芯片布圖規(guī)劃/ 谷歌
每個(gè)VCU服務(wù)器系統(tǒng)由10塊板卡組成,每塊板卡上配有2個(gè)VCU芯片。谷歌將一切非轉(zhuǎn)碼的處理工作丟給非VCU服務(wù)器,而VCU服務(wù)器則盡可能靠近視頻上傳的位置,降低延遲從而降低轉(zhuǎn)碼所需時(shí)間。
但我們要知道一點(diǎn),視頻處理專(zhuān)用的服務(wù)器成本之所以如此之高,并不是只有GPU價(jià)格高、性能要求高等原因,還有就是低利用率的問(wèn)題。并非所有的轉(zhuǎn)碼工作都能用滿(mǎn)芯片的硬件資源,所以谷歌采用了固件管理的隊(duì)列來(lái)啟用并發(fā)轉(zhuǎn)碼。
?
VCU加速卡/ 谷歌
比如某個(gè)操作是“將這一幀的畫(huà)面編碼為VP9位流,”那么應(yīng)用程序負(fù)責(zé)將指令寫(xiě)入隊(duì)列中,固件則只負(fù)責(zé)隊(duì)列調(diào)度和編解碼器核心的激活。如此一來(lái)編程只發(fā)生在應(yīng)用層面,避免了ASIC這類(lèi)硬件先天缺乏FPGA那樣靈活的可編程性,也符合數(shù)據(jù)中心快節(jié)奏的軟件迭代速度,同時(shí)又確保了沒(méi)有一個(gè)編碼核心能閑下來(lái)。
谷歌也給出了VCU與主流方案的差距,比如與純英特爾SkylakeCPU轉(zhuǎn)碼或4個(gè)英偉達(dá)T4 GPU轉(zhuǎn)碼的對(duì)比,8個(gè)VCU的配置在進(jìn)行H.264或VP9轉(zhuǎn)碼時(shí),性?xún)r(jià)比最高可達(dá)前兩種方案的20倍以上。
專(zhuān)用視頻處理硬件的未來(lái)
對(duì)于流量快速增長(zhǎng),負(fù)載持續(xù)增加的大規(guī)模數(shù)據(jù)中心和云服務(wù)來(lái)說(shuō),谷歌這種方案無(wú)疑是最省成本的。阿里巴巴、亞馬遜等云服務(wù)廠商紛紛開(kāi)始了自研服務(wù)器芯片計(jì)劃,這點(diǎn)人盡皆知,但從設(shè)計(jì)上就可以看出,這些芯片還是面向在通用服務(wù)器或AI服務(wù)器的,與視頻沾邊的應(yīng)用也大部分是AI視頻識(shí)別類(lèi)的。
而目前最讓視頻產(chǎn)品頭疼的轉(zhuǎn)碼這塊,卻少有ASIC產(chǎn)品的出現(xiàn),不少加速卡做成了PCIe的尺寸規(guī)格,但其實(shí)仍是基于CPU,尤其是編解碼性能稍強(qiáng)的英特爾CPU。反倒是Xilinx的AlveoU200/250 FPGA加速卡在性能上更有優(yōu)勢(shì),但考慮到這些加速卡高昂的價(jià)格,目前云服務(wù)平臺(tái)還沒(méi)有普及開(kāi)來(lái),甚至還在用老版的UltraScaleFPGA。
與此同時(shí),AV1這類(lèi)壓縮率更高編碼的編碼標(biāo)準(zhǔn)提出了更高的硬件要求,谷歌的VCU雖然性?xún)r(jià)比極高,也沒(méi)有支持AV1這一標(biāo)準(zhǔn),或許我們會(huì)在下一代VCU上看到。
?云平臺(tái)的視頻轉(zhuǎn)碼單價(jià)/ 華為云
全球最大視頻網(wǎng)站的策略
作為全球最大視頻網(wǎng)站Youtube的所有者,照理說(shuō)谷歌面臨的壓力是最大的,但Youtube從疫情至今,卻基本維持著穩(wěn)定的狀態(tài),而且視頻質(zhì)量也是同行中最高的那一檔。能維持住這樣服務(wù)器壓力,靠的并不是傳統(tǒng)的CPU+GPU商用服務(wù)器組合,而是谷歌自研的視頻處理芯片VCU。
谷歌預(yù)見(jiàn)了真正大規(guī)模視頻處理和其他消費(fèi)級(jí)服務(wù)器用例的根本差異,尤其是在數(shù)據(jù)多樣性、質(zhì)量要求、吞吐量和成本上。所以谷歌打算從計(jì)算資源最昂貴的一塊,也就是視頻處理這塊著手,設(shè)計(jì)自己的VCU處理單元,解決從視頻共享、照片與視頻云存儲(chǔ)、直播到云游戲等一眾業(yè)務(wù)上的視頻處理難題。
VCU的設(shè)計(jì)思路
谷歌的VCU全名為視頻編碼單元,單個(gè)芯片集成了10個(gè)編碼核心、3個(gè)解碼核心。從谷歌VCU芯片的布圖規(guī)劃也可以看出,大部分區(qū)域都分配給了編碼器核心,其次是四通道的LPDDR4內(nèi)存,不僅提供邊帶錯(cuò)誤糾正,也提供芯片所需的帶寬。
?VCU芯片布圖規(guī)劃/ 谷歌
每個(gè)VCU服務(wù)器系統(tǒng)由10塊板卡組成,每塊板卡上配有2個(gè)VCU芯片。谷歌將一切非轉(zhuǎn)碼的處理工作丟給非VCU服務(wù)器,而VCU服務(wù)器則盡可能靠近視頻上傳的位置,降低延遲從而降低轉(zhuǎn)碼所需時(shí)間。
但我們要知道一點(diǎn),視頻處理專(zhuān)用的服務(wù)器成本之所以如此之高,并不是只有GPU價(jià)格高、性能要求高等原因,還有就是低利用率的問(wèn)題。并非所有的轉(zhuǎn)碼工作都能用滿(mǎn)芯片的硬件資源,所以谷歌采用了固件管理的隊(duì)列來(lái)啟用并發(fā)轉(zhuǎn)碼。
?VCU加速卡/ 谷歌
谷歌也給出了VCU與主流方案的差距,比如與純英特爾SkylakeCPU轉(zhuǎn)碼或4個(gè)英偉達(dá)T4 GPU轉(zhuǎn)碼的對(duì)比,8個(gè)VCU的配置在進(jìn)行H.264或VP9轉(zhuǎn)碼時(shí),性?xún)r(jià)比最高可達(dá)前兩種方案的20倍以上。
專(zhuān)用視頻處理硬件的未來(lái)
對(duì)于流量快速增長(zhǎng),負(fù)載持續(xù)增加的大規(guī)模數(shù)據(jù)中心和云服務(wù)來(lái)說(shuō),谷歌這種方案無(wú)疑是最省成本的。阿里巴巴、亞馬遜等云服務(wù)廠商紛紛開(kāi)始了自研服務(wù)器芯片計(jì)劃,這點(diǎn)人盡皆知,但從設(shè)計(jì)上就可以看出,這些芯片還是面向在通用服務(wù)器或AI服務(wù)器的,與視頻沾邊的應(yīng)用也大部分是AI視頻識(shí)別類(lèi)的。
而目前最讓視頻產(chǎn)品頭疼的轉(zhuǎn)碼這塊,卻少有ASIC產(chǎn)品的出現(xiàn),不少加速卡做成了PCIe的尺寸規(guī)格,但其實(shí)仍是基于CPU,尤其是編解碼性能稍強(qiáng)的英特爾CPU。反倒是Xilinx的AlveoU200/250 FPGA加速卡在性能上更有優(yōu)勢(shì),但考慮到這些加速卡高昂的價(jià)格,目前云服務(wù)平臺(tái)還沒(méi)有普及開(kāi)來(lái),甚至還在用老版的UltraScaleFPGA。
與此同時(shí),AV1這類(lèi)壓縮率更高編碼的編碼標(biāo)準(zhǔn)提出了更高的硬件要求,谷歌的VCU雖然性?xún)r(jià)比極高,也沒(méi)有支持AV1這一標(biāo)準(zhǔn),或許我們會(huì)在下一代VCU上看到。
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
谷歌
+關(guān)注
關(guān)注
27文章
6254瀏覽量
111495
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
熱點(diǎn)推薦
谷歌評(píng)論卡,碰一碰即可完成谷歌評(píng)論 #谷歌評(píng)論卡 #NFC標(biāo)簽 #nfc卡
谷歌
深圳市融智興科技有限公司
發(fā)布于 :2026年01月15日 17:02:00
為何企業(yè)紛紛引入線束接頭氣密性測(cè)漏設(shè)備?
在智能制造升級(jí)的浪潮中,降本增效已成為企業(yè)核心競(jìng)爭(zhēng)力的關(guān)鍵指標(biāo)。線束接頭作為電氣系統(tǒng)的核心連接部件,其密封檢測(cè)環(huán)節(jié)的效率與成本控制,直接影響企業(yè)整體運(yùn)營(yíng)效益。如今,越來(lái)越多企業(yè)紛紛引入線束接頭氣密性
正運(yùn)動(dòng)技術(shù)喜獲 “AI天馬 · 臻品” 獎(jiǎng)項(xiàng)!
正運(yùn)動(dòng)技術(shù)堅(jiān)持國(guó)產(chǎn)自研,專(zhuān)注智能制造。我們以創(chuàng)新方案助力客戶(hù)降本增效,攜手共創(chuàng)長(zhǎng)期價(jià)值。
如何基于FFmpeg解碼WMV3視頻
在音視頻開(kāi)發(fā)的世界里,WMV3 就像一位沉靜的老友——它曾是 Windows Media 時(shí)代的主角,如今雖已淡出主流視野,卻仍在企業(yè)錄像、歷史資料、監(jiān)控存檔中默默守候;而 FFmpeg,這位開(kāi)源世界的“瑞士軍刀”,正是我們與這位老友對(duì)話(huà)的最佳翻譯官。
炸裂!為什么各行各業(yè)都紛紛擁抱物聯(lián)網(wǎng) + 智能?有人硬核方案讓降本增效爽到飛起!
的 “轉(zhuǎn)型加速器”——究竟是什么讓企業(yè)趨之若鶩? 一、降本增效:從 “經(jīng)驗(yàn)管理” 到 “數(shù)據(jù)驅(qū)動(dòng)”,有人方案直擊企業(yè)痛點(diǎn) 企業(yè)最核心的訴求永遠(yuǎn)是 “少花錢(qián)、多辦事”,而物聯(lián)網(wǎng)的本質(zhì)就是用數(shù)據(jù)打通生產(chǎn)堵點(diǎn),有人智能的方案更是把這點(diǎn)做到
集創(chuàng)北方推出首款移動(dòng)終端AI畫(huà)質(zhì)增強(qiáng)獨(dú)顯芯片
集創(chuàng)北方隆重推出首款12納米AI-PQ畫(huà)質(zhì)增強(qiáng)獨(dú)顯芯片。該芯片聚焦移動(dòng)終端用戶(hù)對(duì)高畫(huà)質(zhì)、高幀率、低功耗的核心訴求,融合了集創(chuàng)北方在多媒體AI處理、畫(huà)質(zhì)提升、低功耗芯片設(shè)計(jì)領(lǐng)域的核心技術(shù)。
鋼鐵廠降本秘訣:風(fēng)機(jī)預(yù)警讓停機(jī)時(shí)間砍半
鋼鐵廠降本關(guān)鍵在 “少損失”。風(fēng)機(jī)預(yù)警系統(tǒng)的核心,是將運(yùn)維從 “事后維修” 推向 “事前預(yù)防”,從 “經(jīng)驗(yàn)依賴(lài)” 轉(zhuǎn)向 “數(shù)據(jù)驅(qū)動(dòng)”。如今老王只需查看系統(tǒng)健康報(bào)表,按預(yù)警安排維護(hù),廠區(qū)風(fēng)機(jī)轟鳴依舊,卻少了驚心動(dòng)魄,多了安穩(wěn) —— 這背后,是千萬(wàn)級(jí)成本節(jié)約與企業(yè)競(jìng)爭(zhēng)力的提升。
FAQ_MA35D1移除RTC時(shí),時(shí)鐘仍在運(yùn)行是怎么回事?
FAQ_MA35D1移除RTC時(shí),時(shí)鐘仍在運(yùn)行是怎么回事?
發(fā)表于 09-03 08:13
谷歌查找我的設(shè)備配件(Google Find My Device Accessory)詳解和應(yīng)用
谷歌查找我的設(shè)備配件(Google Find My Device Accessory)介紹
谷歌查找我的設(shè)備配件是與谷歌 “查找我的設(shè)備” 應(yīng)用程序配合使用的配件,旨在幫助用戶(hù)更方便地追蹤和定位個(gè)人
發(fā)表于 08-31 21:10
AI終于賺錢(qián)了,科技巨頭紛紛猛加杠桿
電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)在2025年,科技巨頭們的AI業(yè)務(wù),終于開(kāi)始賺錢(qián)了。 ? 最近,谷歌、微軟、Meta、亞馬遜紛紛公布2025年二季度財(cái)報(bào),四大AI巨頭都交出了一份強(qiáng)勁的業(yè)績(jī)答卷。過(guò)去
安科瑞光儲(chǔ)充一體化解決方案如何給企業(yè)降本減碳
電子發(fā)燒友網(wǎng)站提供《安科瑞光儲(chǔ)充一體化解決方案如何給企業(yè)降本減碳.docx》資料免費(fèi)下載
發(fā)表于 07-16 15:42
?0次下載
STM32N6570-DK自帶的攝像頭運(yùn)行自帶的AI demo,畫(huà)質(zhì)特別差,這是應(yīng)該這個(gè)例程的原因,還是攝像頭不行?
STM32N6570-DK自帶的攝像頭運(yùn)行自帶的AI demo,畫(huà)質(zhì)特別差,這是應(yīng)該這個(gè)例程的原因,還是攝像頭不行?
發(fā)表于 06-18 07:18
STM32N6570-DK自帶的攝像頭運(yùn)行自帶的AI demo,畫(huà)質(zhì)特別差,這是應(yīng)該這個(gè)例程的原因,還是攝像頭不行?
STM32N6570-DK自帶的攝像頭運(yùn)行自帶的AI demo,畫(huà)質(zhì)特別差,這是應(yīng)該這個(gè)例程的原因,還是攝像頭不行?
發(fā)表于 06-16 06:02
谷歌地圖GPS定位
谷歌地圖GPS定位:精準(zhǔn)導(dǎo)航背后的技術(shù)解析 谷歌地圖作為全球最受歡迎的地圖服務(wù)之一,其精準(zhǔn)的GPS定位功能為用戶(hù)提供了極大便利。本文將深入探討谷歌地圖如何利用GPS技術(shù),實(shí)現(xiàn)高精度定位,并帶來(lái)革命性
STM32CubeMX在配置DCMI的腳位時(shí),在Mode的選項(xiàng)中, 只有8bits, 10bits與12bits, 為何沒(méi)有14bits?
STM32CubeMX在配置DCMI的腳位時(shí),在Mode的選項(xiàng)中, 只有8bits, 10bits與12bits, 為何沒(méi)有14bits?
發(fā)表于 04-27 08:49
視頻網(wǎng)站為了降本紛紛砍畫(huà)質(zhì),為何只有谷歌仍在堅(jiān)持?
評(píng)論