91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

SOK將HugeCTR中的高級(jí)特性進(jìn)行包裝使用

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:HugeCTR ? 2022-04-07 16:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1. Introduction

HugeCTR 能夠高效地利用 GPU 來進(jìn)行推薦系統(tǒng)的訓(xùn)練,為了使它還能直接被其他 DL 用戶,比如 TensorFlow 所直接使用,我們開發(fā)了 SparseOperationKit (SOK),來將 HugeCTR 中的高級(jí)特性封裝為 TensorFlow 可直接調(diào)用的形式,從而幫助用戶在 TensorFlow 中直接使用 HugeCTR 中的高級(jí)特性來加速他們的推薦系統(tǒng)。

pYYBAGJOmyGAEKlZAACdxZaXMq8920.png

圖 1. SOK embedding 工作流程

SOK 以數(shù)據(jù)并行的方式接收輸入數(shù)據(jù),然后在 SOK 內(nèi)部做黑盒式地模型轉(zhuǎn)換,最后將計(jì)算結(jié)果以數(shù)據(jù)并行的方式傳遞給初始 GPU。這種方式可以盡可能少地修改用戶已有的代碼,以更方便、快捷地在多個(gè) GPU 上進(jìn)行擴(kuò)展。

SOK 不僅僅是加速了 TensorFlow 中的算子,而是根據(jù)業(yè)界中的實(shí)際需求提供了對(duì)應(yīng)的新解決方案,比如說 GPU HashTable。SOK 可以與 TensorFlow 1.15 和 TensorFlow 2.x 兼容使用;既可以使用 TensorFlow 自帶的通信工具,也可以使用 Horovod 等第三方插件來作為 embedding parameters 以為參數(shù)的通信工具。

2. TF2 Comparison/Performance

使用 MLPerf 的標(biāo)準(zhǔn)模型 DLRM 來對(duì) SOK 的性能進(jìn)行測(cè)試。

poYBAGJOmyiAeiA8AADnMNf4awU433.png

圖 2. SOK性能測(cè)試數(shù)據(jù)

相比于 NVIDIA 的 DeepLearning Examples,使用 SOK 可以獲得更快的訓(xùn)練速度以及更高的吞吐量。

3. API

SOK 提供了簡(jiǎn)潔的、類 TensorFlow 的 API;使用 SOK 的方式非常簡(jiǎn)單、直接;讓用戶通過修改幾行代碼就可以使用 SOK。

定義模型結(jié)構(gòu)

poYBAGJOmy2ARBajAADRQdPyK68016.png

左側(cè)是使用 TensorFlow 的 API 來搭建模型,右側(cè)是使用 SOK 的 API 來搭建相同的模型。使用 SOK 來搭建模型的時(shí)候,只需要將 TensorFlow 中的 Embedding Layer 替換為 SOK 對(duì)應(yīng)的 API 即可。

使用 Horovod 來定義 training loop

pYYBAGJOmziAPRIaAAEf6YbWwDc794.png

同樣的,左側(cè)是使用 TensorFlow 來定義 training loop,右側(cè)是使用 SOK 時(shí),training loop 的定義方式??梢钥吹?,使用 SOK 時(shí),只需要對(duì) Embedding Variables 和 Dense Variables 進(jìn)行分別處理即可。其中,Embedding Variables 部分由 SOK 管理,Dense Variables 由 TensorFlow 管理。

使用 tf.distribute.MirroredStrategy 來定義 training loop

poYBAGJOm0WAXaRPAAFOJm89KHA665.png

類似的,還可以使用 TensorFlow 自帶的通信工具來定義 training loop。

開始訓(xùn)練

pYYBAGJOm02AGDvJAACSvcfi_CM767.png

在開始訓(xùn)練過程時(shí),使用 SOK 與使用 TensorFlow 時(shí)所用代碼完全一致。

4. 結(jié)語

SOK 將 HugeCTR 中的高級(jí)特性包裝為 TensorFlow 可以直接使用的模塊,通過修改少數(shù)幾行代碼即可在已有模型代碼中利用上 HugeCTR 的的先進(jìn)設(shè)計(jì)。

關(guān)于作者

NVIDIA GPU 計(jì)算專家研發(fā)團(tuán)隊(duì)成立于2020年7月,主要面向全球用戶開發(fā)基于英偉達(dá)通用計(jì)算產(chǎn)品的軟件解決方案。 目前團(tuán)隊(duì)致力于推薦系統(tǒng)訓(xùn)練框架 Merlin HugeCTR的開發(fā)。作為Merlin 系統(tǒng)三大核心軟件之一,Merlin HugeCTR 是一套針對(duì)于推薦系統(tǒng)設(shè)計(jì)的模型訓(xùn)練框架。項(xiàng)目啟動(dòng)于2018年,目前產(chǎn)品應(yīng)用于多家國(guó)際互聯(lián)網(wǎng)公司,自2020年以來,HugeCTR持續(xù)參與并推動(dòng)國(guó)際性競(jìng)賽MLPerf DLRM訓(xùn)練項(xiàng)目,從而實(shí)現(xiàn)了業(yè)界領(lǐng)先的優(yōu)化性能。 NVIDIA GPU 計(jì)算專家研發(fā)團(tuán)隊(duì)是一個(gè)小型國(guó)際化工程團(tuán)隊(duì),核心成員來自于多個(gè)國(guó)家(中國(guó),韓國(guó),荷蘭,德國(guó)),客戶分布于世界各地。日常工作使用英語溝通。 團(tuán)隊(duì)主要工作圍繞軟件產(chǎn)品開發(fā)展開,涉及產(chǎn)品維護(hù)、文檔、測(cè)試、發(fā)布、部署,日常工作中與各國(guó)硬件、產(chǎn)品、工程、客戶支持團(tuán)隊(duì)有著緊密的合作。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5598

    瀏覽量

    109809
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5199

    瀏覽量

    135527
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    面包自動(dòng)化包裝產(chǎn)線數(shù)據(jù)采集解決方案

    某企業(yè)從事各類面包糕點(diǎn)等食品的生產(chǎn)及銷售工作,市場(chǎng)規(guī)模持續(xù)擴(kuò)大。為應(yīng)對(duì)產(chǎn)能提升的挑戰(zhàn),已經(jīng)實(shí)現(xiàn)包裝環(huán)節(jié)的自動(dòng)化,實(shí)現(xiàn)從開箱-套袋-裝箱-稱重-封箱的全過程。現(xiàn)要求包裝產(chǎn)線設(shè)備數(shù)據(jù)采集起來,對(duì)接到本地值班室
    的頭像 發(fā)表于 12-13 11:17 ?732次閱讀
    面包自動(dòng)化<b class='flag-5'>包裝</b>產(chǎn)線數(shù)據(jù)采集解決方案

    工業(yè)顯示器在真空包裝機(jī)的應(yīng)用

    工業(yè)顯示器在真空包裝機(jī)扮演著核心控制與監(jiān)測(cè)角色,通過集成觸控交互、實(shí)時(shí)監(jiān)控、參數(shù)調(diào)整及故障診斷等功能,顯著提升了設(shè)備的自動(dòng)化水平、操作便捷性和生產(chǎn)穩(wěn)定性。
    的頭像 發(fā)表于 11-20 17:41 ?848次閱讀

    食品廠自動(dòng)包裝產(chǎn)線物聯(lián)網(wǎng)解決方案

    ,食品廠希望新的自動(dòng)包裝產(chǎn)線接入到MES平臺(tái)中,要求通過無線方式進(jìn)行通信,以避免停機(jī)布線并減少施工成本。對(duì)此,物通博聯(lián)提供高效可靠的物聯(lián)網(wǎng)解決方案。通過部署PLC數(shù)采網(wǎng)關(guān)接入控制器PLC,能夠?qū)崟r(shí)采集設(shè)備狀態(tài)、運(yùn)行參數(shù)、故障信
    的頭像 發(fā)表于 09-29 14:19 ?575次閱讀
    食品廠自動(dòng)<b class='flag-5'>包裝</b>產(chǎn)線物聯(lián)網(wǎng)解決方案

    倍加福超聲波技術(shù)解決智能包裝貼標(biāo)難題

    在食品飲料、醫(yī)藥、化妝品以及消費(fèi)品行業(yè),我們?nèi)粘=佑|的產(chǎn)品都離不開包裝。在自動(dòng)化包裝流程,從高速輸送、準(zhǔn)確填充、可靠配料,直至最終裝箱,倍加福都能為包裝應(yīng)用量身打造一站式智能化解決方
    的頭像 發(fā)表于 09-12 15:14 ?830次閱讀

    中國(guó)包裝行業(yè)權(quán)威專家一行蒞臨匯川技術(shù)參觀指導(dǎo)

    8月27日,中國(guó)包裝行業(yè)權(quán)威專家——中國(guó)醫(yī)藥包裝協(xié)會(huì)特聘會(huì)長(zhǎng)、中國(guó)包裝聯(lián)合會(huì)包裝印刷與標(biāo)簽專業(yè)委員會(huì)主任許文才教授,包聯(lián)
    的頭像 發(fā)表于 09-03 18:03 ?863次閱讀

    用visionboard進(jìn)行視覺項(xiàng)目,如何openmv示例項(xiàng)目燒錄到開發(fā)板脫機(jī)運(yùn)行?

    用visionboard進(jìn)行視覺項(xiàng)目,如何openmv示例項(xiàng)目燒錄到開發(fā)板脫機(jī)運(yùn)行
    發(fā)表于 08-15 06:59

    羅克韋爾助力逸超包裝實(shí)現(xiàn)設(shè)備智能化升級(jí)

    例如,傳統(tǒng)的設(shè)備在生產(chǎn)過程要改變包裝速度,就必須先停機(jī)。然而面對(duì)市場(chǎng)競(jìng)爭(zhēng)的白熱化,逸超包裝提出了在生產(chǎn)過程實(shí)時(shí)動(dòng)態(tài)調(diào)整生產(chǎn)速度的需求,以便適配上下游的設(shè)備,與此同時(shí),還需要適配上游
    的頭像 發(fā)表于 07-23 14:16 ?894次閱讀

    滾珠導(dǎo)軌:物流輸送與包裝分揀的“高速軌道”

    滾珠導(dǎo)軌憑借其低摩擦、高剛性的特點(diǎn),廣泛應(yīng)用于輸送線、分揀機(jī)及包裝機(jī)械,確保貨物搬運(yùn)與包裝流程的穩(wěn)定性和速度,成為行業(yè)自動(dòng)化升級(jí)的關(guān)鍵部件。
    的頭像 發(fā)表于 07-21 17:54 ?1168次閱讀
    滾珠導(dǎo)軌:物流輸送與<b class='flag-5'>包裝</b>分揀的“高速軌道”

    油類包裝機(jī)遠(yuǎn)程監(jiān)控物聯(lián)網(wǎng)解決方案

    油類包裝機(jī)(油包機(jī))門用于包裝具有一定流動(dòng)性的粘體物品的設(shè)備,如方便面的調(diào)味醬包、果醬、番茄醬、發(fā)乳、醬類等產(chǎn)品,能夠?qū)崿F(xiàn)自動(dòng)計(jì)量、下料、制袋、封口、打標(biāo)、撕口等整套包裝流程。 在數(shù)
    的頭像 發(fā)表于 06-16 17:08 ?486次閱讀

    利用普源示波器進(jìn)行功率器件動(dòng)態(tài)特性測(cè)試的研究

    深度等優(yōu)點(diǎn),在功率器件動(dòng)態(tài)特性測(cè)試具有廣泛的應(yīng)用前景。本文旨在研究利用普源示波器進(jìn)行功率器件動(dòng)態(tài)特性測(cè)試的方法,為相關(guān)領(lǐng)域的研究和應(yīng)用提供參考。 功率器件動(dòng)態(tài)
    的頭像 發(fā)表于 06-12 17:03 ?693次閱讀
    利用普源示波器<b class='flag-5'>進(jìn)行</b>功率器件動(dòng)態(tài)<b class='flag-5'>特性</b>測(cè)試的研究

    PCBA電路板運(yùn)輸包裝全攻略:防靜電、防潮、防震,一個(gè)都不能少!

    在智能硬件制造,電路板(PCBA)的運(yùn)輸包裝直接關(guān)系到產(chǎn)品的最終質(zhì)量和客戶體驗(yàn)。一塊精心設(shè)計(jì)的電路板可能因運(yùn)輸的疏忽而報(bào)廢,造成巨大損失。本文結(jié)合行業(yè)經(jīng)驗(yàn),從
    的頭像 發(fā)表于 05-08 09:44 ?4300次閱讀
    PCBA電路板運(yùn)輸<b class='flag-5'>包裝</b>全攻略:防靜電、防潮、防震,一個(gè)都不能少!

    Modbus老鐵別掉隊(duì)!EtherCAT閃電俠帶你狂飆包裝流水線!

    的功能特性,成功攻克了不同協(xié)議設(shè)備間通信不暢的難題,為包裝行業(yè)的智能化變革注入了強(qiáng)勁動(dòng)力,成為推動(dòng)行業(yè)發(fā)展的重要技術(shù)支撐。 包裝行業(yè)設(shè)備通信的復(fù)雜現(xiàn)狀 現(xiàn)代包裝生產(chǎn)線是一個(gè)高度集成且復(fù)
    的頭像 發(fā)表于 04-25 14:36 ?528次閱讀
    Modbus老鐵別掉隊(duì)!EtherCAT閃電俠帶你狂飆<b class='flag-5'>包裝</b>流水線!

    怎么正確操作泡罩包裝密封測(cè)試儀才能獲取精準(zhǔn)結(jié)果

    的準(zhǔn)備工作不容忽視。首先,仔細(xì)檢查設(shè)備的外觀,看看松動(dòng)區(qū)域是否有損壞。確保電源連接正常,氣源壓力穩(wěn)定,是儀器正常運(yùn)行的基礎(chǔ)。同時(shí),根據(jù)泡罩包裝包裝規(guī)格、材料和特性,選擇
    的頭像 發(fā)表于 04-09 15:01 ?712次閱讀
    怎么正確操作泡罩<b class='flag-5'>包裝</b>密封測(cè)試儀才能獲取精準(zhǔn)結(jié)果

    MAP氣調(diào)包裝頂空氣體檢測(cè)技術(shù)中會(huì)用到哪些傳感器?

    食品、飲料和其他易腐產(chǎn)品在運(yùn)輸和儲(chǔ)存過程,可能會(huì)受到氧化反應(yīng)、微生物污染和水分流失等因素的影響,導(dǎo)致質(zhì)量下降和保質(zhì)期縮短。為了克服這些挑戰(zhàn),氣調(diào)包裝(MAP)?技術(shù)被廣泛應(yīng)用于食品行業(yè),尤其是在
    的頭像 發(fā)表于 04-02 17:47 ?617次閱讀
    MAP氣調(diào)<b class='flag-5'>包裝</b>頂空氣體檢測(cè)技術(shù)中會(huì)用到哪些傳感器?

    包裝密封測(cè)試儀:操作技巧助你事半功倍

    包裝密封測(cè)試儀在現(xiàn)代生產(chǎn)和質(zhì)量控制起著至關(guān)重要的作用。掌握其操作技巧,不但可以提高工作效率,而且可以保證檢測(cè)結(jié)果的準(zhǔn)確性。首先,前期要做好充分的準(zhǔn)備在使用包裝密封測(cè)試儀之前,首先要熟悉設(shè)備
    的頭像 發(fā)表于 04-02 11:38 ?818次閱讀
    <b class='flag-5'>包裝</b>密封測(cè)試儀:操作技巧助你事半功倍