91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

京東:基于多類(lèi)目MoE模型的電商搜索引擎

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:深度學(xué)習(xí)自然語(yǔ)言處理 ? 2023-01-06 09:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

商品索引擎是電商平臺(tái)滿(mǎn)足用戶(hù)購(gòu)物需求的一個(gè)重要系統(tǒng),它根據(jù)用戶(hù)輸入的搜索詞,返回個(gè)性化的排序列表。商品一般會(huì)被歸為某一大類(lèi)下某個(gè)小類(lèi)目,例如電子產(chǎn)品,在電子產(chǎn)品這個(gè)大類(lèi)目下面還有更細(xì)粒度的類(lèi)目(冰箱或者電視)。這種體系用于構(gòu)造查詢(xún)類(lèi)別的層次結(jié)構(gòu)。在不同的查詢(xún)類(lèi)別中,價(jià)格和品牌知名度等特征的分布差異很大。在CTR(點(diǎn)擊率)/CVR(轉(zhuǎn)化率)預(yù)估問(wèn)題中,特征重要性在不同類(lèi)目間也是不一樣的。本文主要介紹專(zhuān)家混合模型(MoE)在京東搜索精排中的應(yīng)用,以及結(jié)合實(shí)際場(chǎng)景對(duì)MoE模型進(jìn)行的一系列改進(jìn)。

Part1. 背景介紹

越來(lái)越多的人轉(zhuǎn)向電子商務(wù)來(lái)滿(mǎn)足他們的購(gòu)物需求,這給搜索排名帶來(lái)了新的挑戰(zhàn)。電子商務(wù)搜索排名的一個(gè)關(guān)鍵輸入是產(chǎn)品類(lèi)別標(biāo)簽,店主通常被要求用特定的類(lèi)別來(lái)標(biāo)記他們的產(chǎn)品,以方便搜索索引。從這些產(chǎn)品類(lèi)別中,可以構(gòu)造查詢(xún)類(lèi)別的概念,通常是通過(guò)聚合在查詢(xún)下正確檢索到的最頻繁出現(xiàn)的產(chǎn)品類(lèi)別。目前大多數(shù)電子商務(wù)排名系統(tǒng)都沒(méi)有為每個(gè)查詢(xún)類(lèi)別部署專(zhuān)用模型的工程資源,即使是主要的查詢(xún)類(lèi)別也是如此。但是作為人工編目員,自然的策略是首先確定查詢(xún)最可能屬于的類(lèi)別,然后檢索該類(lèi)別中的項(xiàng)目。不同類(lèi)別的特性對(duì)于產(chǎn)品排名的重要性可能不同。直觀地說(shuō),根據(jù)用戶(hù)購(gòu)買(mǎi)反饋判斷,不同類(lèi)別的單獨(dú)排名策略應(yīng)該能夠提高整體產(chǎn)品搜索相關(guān)性。
??京東電商平臺(tái)有一套完整的以樹(shù)形結(jié)構(gòu)組織的多層級(jí)類(lèi)目結(jié)構(gòu)。下圖是一個(gè)兩層級(jí)類(lèi)目結(jié)構(gòu)的示意圖,不同的Top-Categories 之間,用戶(hù)的購(gòu)物行為會(huì)有比較明顯的差異,例如:當(dāng)用戶(hù)搜索食品相關(guān)商品時(shí),可能選擇銷(xiāo)量高的;而當(dāng)搜索服飾相關(guān)商品時(shí),可能會(huì)更關(guān)注風(fēng)格、品牌等信息。相反同一個(gè)Top-Categories下的Sub-Categories之間,用戶(hù)的購(gòu)物行為一般比較接近。

01a6ab4c-8d5c-11ed-bfe3-dac502259ad0.png

此外,對(duì)于一些小類(lèi)目的商品,在訓(xùn)練集樣本量上和大類(lèi)目相比差距懸殊,在模型訓(xùn)練過(guò)程中會(huì)被大類(lèi)目商品的樣本所影響和主導(dǎo)。針對(duì)類(lèi)目差異和小類(lèi)目學(xué)習(xí)這兩個(gè)問(wèn)題,本文提出了一種多類(lèi)目MoE(Mixture of Experts)模型。

Part2. 多類(lèi)目MoE模型

MoE模型

MoE 主要包括兩個(gè)核心部分:門(mén)網(wǎng)絡(luò)(gating network)和專(zhuān)家網(wǎng)絡(luò)(expert network)。門(mén)網(wǎng)絡(luò)的輸出作為對(duì)應(yīng)的專(zhuān)家網(wǎng)絡(luò)的權(quán)重,用于對(duì)專(zhuān)家網(wǎng)絡(luò)的輸出進(jìn)行加權(quán)求和。MoE 模型的輸出可以寫(xiě)成下面的公式:

其中,N表示專(zhuān)家網(wǎng)絡(luò)的個(gè)數(shù),G表示門(mén)網(wǎng)絡(luò),Q表示專(zhuān)家網(wǎng)絡(luò)。

Top-K gating MoE模型

模型會(huì)根據(jù)門(mén)網(wǎng)絡(luò)的輸出,選擇最大的K個(gè)權(quán)重所對(duì)應(yīng)的專(zhuān)家網(wǎng)絡(luò)進(jìn)行激活,然后只對(duì)選中的K個(gè)專(zhuān)家網(wǎng)絡(luò)的輸出進(jìn)行加權(quán)求和。計(jì)算公式如下:

在Top_k MoE模型中,如果一個(gè)專(zhuān)家網(wǎng)絡(luò)對(duì)應(yīng)的權(quán)重值不在最高的K個(gè)集合里,那么經(jīng)過(guò)softmax函數(shù)之后權(quán)重會(huì)變?yōu)?。從而在模型訓(xùn)練中這些專(zhuān)家網(wǎng)絡(luò)不會(huì)被激活,能降低模型的計(jì)算復(fù)雜度。

多類(lèi)目MoE的模型

針對(duì)上述提到的類(lèi)目差異和小類(lèi)目學(xué)習(xí)兩個(gè)問(wèn)題,本文在Top_K MoE 的基礎(chǔ)上加入了兩種改進(jìn)方法,提出了多類(lèi)目MoE的模型結(jié)構(gòu),如下圖:

01b7c71a-8d5c-11ed-bfe3-dac502259ad0.png

(1)Hierarchical Soft Constraint(HSC)網(wǎng)絡(luò)

針對(duì)小類(lèi)目樣本學(xué)習(xí)問(wèn)題,本文的改進(jìn)是增加一個(gè)與MoE門(mén)網(wǎng)絡(luò)結(jié)構(gòu)相同的HSC門(mén)網(wǎng)絡(luò)(圖種藍(lán)色部分)。HSC門(mén)網(wǎng)絡(luò)的輸入是Top-Category,輸出與MoE的門(mén)網(wǎng)絡(luò)結(jié)構(gòu)維度一致,代表了不同專(zhuān)家網(wǎng)絡(luò)對(duì)于Top-Category 的重要程度。同時(shí)將激活的專(zhuān)家網(wǎng)絡(luò)對(duì)應(yīng)的權(quán)重和HSC門(mén)網(wǎng)絡(luò)對(duì)應(yīng)的權(quán)重的L2距離作為模型訓(xùn)練的一個(gè)損失項(xiàng),加入到模型的訓(xùn)練過(guò)程中。
??具體來(lái)說(shuō),圖2中的Top-Category和Sub-Category具有層次關(guān)系,Top-Category是父節(jié)點(diǎn),Sub-Category是子節(jié)點(diǎn)。為了進(jìn)一步強(qiáng)調(diào)不同門(mén)網(wǎng)絡(luò)的功能,我們分別將它們稱(chēng)之為inference MoE gate(綠色部分)和constraint HSC gate(藍(lán)色部分)。

a. Inference MoE Gate

將Sub-Category的嵌入向量,輸入inference gate,其輸出代表專(zhuān)家的權(quán)重。定義inference gate函數(shù)如下:

其中,是一個(gè) q×N的可訓(xùn)練的權(quán)重矩陣,q表示embedding的維度,N表示expert的個(gè)數(shù)。
??為了節(jié)省計(jì)算,只在中保留前K個(gè)值,并將其余值設(shè)置為?∞。然后應(yīng)用softmax函數(shù)從前K個(gè)中得到如下的概率分布:
,如果
,如果<

由于有K個(gè)大于0的值,為了節(jié)省計(jì)算,只激活這些對(duì)應(yīng)的專(zhuān)家。模型的計(jì)算復(fù)雜度取決于單個(gè)專(zhuān)家的網(wǎng)絡(luò)和K的取值。

b. Inference MoE Gate

在模型中,constraint gate和inference gate具有相同的結(jié)構(gòu)。用表示constraint gate,表示inference gate,constraint gate的輸入特征記為,是Top-Category的嵌入向量,定義inference gate和constraint gate之間的分層軟約束(HSC)如下:



??通過(guò)上述HSC網(wǎng)絡(luò),可以讓相同Top-Category下的所有Sub-Category所激活的專(zhuān)家網(wǎng)絡(luò)盡量的接近。尤其對(duì)于樣本量少的小類(lèi)目,可以利用到相同Top-category下的其他類(lèi)目信息,能一定程度上解決小樣本學(xué)習(xí)難的問(wèn)題。

(2)Adversarial Regularization

第二個(gè)改進(jìn)是Adversarial Regularization。在Top_K門(mén)網(wǎng)絡(luò)結(jié)構(gòu)中,對(duì)于每條樣本,專(zhuān)家網(wǎng)絡(luò)都會(huì)分為激活的專(zhuān)家網(wǎng)絡(luò)和沒(méi)有激活的專(zhuān)家網(wǎng)絡(luò)。Adversarial Regularization的目的是在訓(xùn)練過(guò)程中讓不同專(zhuān)家網(wǎng)絡(luò)盡量區(qū)別開(kāi),避免專(zhuān)家網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果相同。即鼓勵(lì)激活的專(zhuān)家網(wǎng)絡(luò)和沒(méi)有被激活的專(zhuān)家網(wǎng)絡(luò)給出的預(yù)測(cè)結(jié)果差異較大。Adversarial Regularization計(jì)算公式如下:
其中, 表示激活的專(zhuān)家網(wǎng)絡(luò)集合, 表示沒(méi)有被激活的專(zhuān)家網(wǎng)絡(luò)集合。
??增加了HSC網(wǎng)絡(luò)和Adversarial Regularization之后,模型的損失函數(shù)如下所示:

Part3. 實(shí)驗(yàn)結(jié)論

作者在Amazon和In-house兩個(gè)數(shù)據(jù)集上分別評(píng)估了所提出模型的效果。表格中的Adv-MoE和HSC-MoE分別表示只有Adversarial Regularization和HSC loss的兩個(gè)模型,Adv&HSC-MoE表示作者提出的最終多類(lèi)目模型。
??作者首先在In-house數(shù)據(jù)集上測(cè)試了模型的整體效果、類(lèi)目差異的效果以及在小樣本類(lèi)目上的提升效果。表3給出了各個(gè)模型在AUC和NDCG兩個(gè)指標(biāo)上結(jié)果。與DNN模型相比,本文提出的Adv&HSC-MoE模型在AUC指標(biāo)上實(shí)現(xiàn)了0.96%的增益(NDCG為0.99%),具有較好的泛化性能。

01c91bdc-8d5c-11ed-bfe3-dac502259ad0.png

同時(shí),作者也在amazon數(shù)據(jù)集上做了實(shí)驗(yàn),下表顯示改進(jìn)后的Adv-MoE、HSC-MoE和Adv& HSC-MoE結(jié)果與In-house一致,驗(yàn)證了對(duì)抗正則化和分層軟約束技術(shù)的一般適用性。

01d89fee-8d5c-11ed-bfe3-dac502259ad0.png

MoE模型門(mén)網(wǎng)絡(luò)的輸出代表了各個(gè)專(zhuān)家網(wǎng)絡(luò)的權(quán)重,作者同樣測(cè)試了不同類(lèi)目下門(mén)網(wǎng)絡(luò)的輸出結(jié)果,以評(píng)估模型對(duì)于類(lèi)目差異的學(xué)習(xí)效果。本文將門(mén)網(wǎng)絡(luò)的輸出結(jié)果使用T-SNE降維展示出來(lái),以便觀察不同類(lèi)目的聚類(lèi)效果。圖5中藍(lán)色表示日用百貨類(lèi)目,綠色表示電器類(lèi)目,紅色表示流行服飾類(lèi)目。結(jié)果顯示,本文的方法聚類(lèi)效果更好,這表明對(duì)于相似的類(lèi)目,本文提出的模型更傾向于選擇相似的專(zhuān)家網(wǎng)絡(luò),差異大的類(lèi)目,更傾向于選擇不同的專(zhuān)家網(wǎng)絡(luò)。

01ee71d4-8d5c-11ed-bfe3-dac502259ad0.png

Part4. 總結(jié)

本文提出的對(duì)抗性正則化和層次軟約束技術(shù)是在產(chǎn)品搜索中開(kāi)發(fā)類(lèi)別感知排名模型的有效方法。它在行業(yè)規(guī)模的數(shù)據(jù)集上取得了顯著的改進(jìn),主要體現(xiàn)在以下幾個(gè)方面:(1)同一Top-Categories下的Sub-Categories可以共享相似的專(zhuān)家,從而克服了有限訓(xùn)練數(shù)據(jù)下的參數(shù)稀疏性;(2)對(duì)抗性正則化鼓勵(lì)專(zhuān)家“獨(dú)立思考”,從不同角度處理每個(gè)問(wèn)題。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 網(wǎng)絡(luò)
    +關(guān)注

    關(guān)注

    14

    文章

    8280

    瀏覽量

    94955
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3758

    瀏覽量

    52131
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1236

    瀏覽量

    26211

原文標(biāo)題:京東:基于多類(lèi)目MoE模型的電商搜索引擎

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    如何快速查找工業(yè)部件的 3D CAD 模型

    處于規(guī)格階段的早期,像3Dfindit這樣的 CAD 搜索引擎要比訪(fǎng)問(wèn)多個(gè)制造網(wǎng)站更快。 使用3Dfindit,您可以 按幾何體、草圖、標(biāo)準(zhǔn)和其他屬性搜索 按制造、產(chǎn)品類(lèi)別或
    發(fā)表于 03-04 16:22

    如何通過(guò)API接口同步京東平臺(tái)類(lèi)目數(shù)據(jù)

    ? 在現(xiàn)代電系統(tǒng)中,實(shí)時(shí)同步京東平臺(tái)的類(lèi)目數(shù)據(jù)至關(guān)重要。這能確保您的系統(tǒng)擁有最新的商品分類(lèi)信息,支持高效的庫(kù)存管理、搜索優(yōu)化和用戶(hù)體驗(yàn)提升。京東
    的頭像 發(fā)表于 03-02 16:02 ?125次閱讀
    如何通過(guò)API接口同步<b class='flag-5'>京東</b>平臺(tái)<b class='flag-5'>類(lèi)目</b>數(shù)據(jù)

    京東圖片搜索API深度解析:以圖搜貨賦能全場(chǎng)景

    京東圖片搜索API 是京東開(kāi)放平臺(tái)提供的一項(xiàng)基于圖像識(shí)別技術(shù)的視覺(jué)搜索服務(wù),能夠通過(guò)上傳圖片或圖片URL,在京東海量商品庫(kù)中精準(zhǔn)匹配外觀、功
    的頭像 發(fā)表于 02-08 14:56 ?721次閱讀

    關(guān)鍵詞搜索京東列表 API 技術(shù)對(duì)接指南

    一、前言 在商數(shù)據(jù)服務(wù)、代購(gòu)集運(yùn)系統(tǒng)搭建、平臺(tái)競(jìng)品分析、自有商城商品同步等業(yè)務(wù)場(chǎng)景中,京東商品列表的精準(zhǔn)、實(shí)時(shí)獲取是核心環(huán)節(jié)之一。 二、接口概述 關(guān)鍵詞
    的頭像 發(fā)表于 02-05 16:36 ?386次閱讀

    邁富時(shí)GEO服務(wù):技術(shù)驅(qū)動(dòng)AI搜索時(shí)代的企業(yè)增長(zhǎng)新引擎

    導(dǎo)語(yǔ): 隨著DeepSeek、豆包、文心一言等生成式AI搜索引擎的快速普及,用戶(hù)獲取信息的方式正從傳統(tǒng)"鏈接點(diǎn)擊"轉(zhuǎn)向"AI直接對(duì)話(huà)"。在這場(chǎng)深刻的信息檢索范式變革中,企業(yè)如何讓品牌內(nèi)容被AI系統(tǒng)
    的頭像 發(fā)表于 01-17 21:20 ?290次閱讀

    京東按關(guān)鍵字搜索商品 API接口item_search Pro

    京東搜索商品 API(item_search Pro)賦能運(yùn)營(yíng)全指南 item_search Pro 是京東商品
    的頭像 發(fā)表于 01-05 11:03 ?507次閱讀

    利用京東搜索關(guān)鍵詞 API 接口賦能運(yùn)營(yíng)

    利用京東搜索關(guān)鍵詞 API 接口賦能運(yùn)營(yíng):從技術(shù)調(diào)用到業(yè)務(wù)增長(zhǎng)全指南 京東搜索關(guān)鍵詞 API
    的頭像 發(fā)表于 01-05 09:21 ?335次閱讀

    國(guó)內(nèi) API 深度賦能:從選品、庫(kù)存到履約,重構(gòu)運(yùn)營(yíng)效率新范式

    邏輯與實(shí)際價(jià)值: 選品環(huán)節(jié):從經(jīng)驗(yàn)判斷到數(shù)據(jù)驅(qū)動(dòng)的精準(zhǔn)決策 傳統(tǒng)選品依賴(lài)買(mǎi)手經(jīng)驗(yàn),風(fēng)險(xiǎn)高且難以復(fù)制,而 API 通過(guò)打通平臺(tái)數(shù)據(jù),讓選品成為可量化的科學(xué)決策。一方面,商品詳情 API 和
    的頭像 發(fā)表于 12-17 09:35 ?327次閱讀

    NVIDIA Grace Blackwell平臺(tái)實(shí)現(xiàn)MoE模型性能十倍提升

    如今,幾乎任一前沿模型的內(nèi)部結(jié)構(gòu)都采用混合專(zhuān)家 (MoE) 模型架構(gòu),這種架構(gòu)旨在模擬人腦的高效運(yùn)作機(jī)制。
    的頭像 發(fā)表于 12-13 09:23 ?903次閱讀
    NVIDIA Grace Blackwell平臺(tái)實(shí)現(xiàn)<b class='flag-5'>MoE</b><b class='flag-5'>模型</b>性能十倍提升

    ???????京東API:開(kāi)啟物流新速度,訂單配送快人一步!

    競(jìng)爭(zhēng)日益激烈的今天,“速度”已成為用戶(hù)體驗(yàn)的核心要素。京東憑借其強(qiáng)大的自建物流體系,始終引領(lǐng)著配送時(shí)效的標(biāo)準(zhǔn)。而面向開(kāi)發(fā)者和合作伙伴開(kāi)放的 京東API ,則如同為
    的頭像 發(fā)表于 12-08 14:26 ?484次閱讀
    ???????<b class='flag-5'>京東</b>API:開(kāi)啟<b class='flag-5'>電</b><b class='flag-5'>商</b>物流新速度,訂單配送快人一步!

    5分鐘了解SEO優(yōu)化服務(wù)器對(duì)網(wǎng)站加載速度的影響

    一個(gè)為SEO優(yōu)化過(guò)的服務(wù)器,能顯著提升網(wǎng)站性能,從而在搜索引擎排名中占據(jù)有利位置。
    的頭像 發(fā)表于 12-02 10:27 ?339次閱讀

    蘇寧搜索接口深析:全品類(lèi)智能分軌如何解決 O2O 搜索痛點(diǎn)?

    本文深度解析蘇寧全品類(lèi)O2O搜索接口核心技術(shù),涵蓋智能分軌引擎、庫(kù)存聯(lián)動(dòng)系統(tǒng)與高并發(fā)架構(gòu)設(shè)計(jì),解決品類(lèi)參數(shù)識(shí)別、線(xiàn)上線(xiàn)下庫(kù)存同步等
    的頭像 發(fā)表于 10-28 16:20 ?901次閱讀
    蘇寧<b class='flag-5'>搜索</b>接口深析:全品類(lèi)智能分軌如何解決 O2O <b class='flag-5'>電</b><b class='flag-5'>商</b>的<b class='flag-5'>搜索</b>痛點(diǎn)?

    根據(jù)標(biāo)題獲取商品鏈接評(píng)論接口的技術(shù)實(shí)現(xiàn)

    [調(diào)用評(píng)論API] F --?> G[數(shù)據(jù)清洗存儲(chǔ)] ? 關(guān)鍵組件說(shuō)明: 搜索引擎接口 :通過(guò)電平臺(tái)開(kāi)放API實(shí)現(xiàn)標(biāo)題搜索 $$ text{API}_{search} = text{https://api.ecommerce.
    的頭像 發(fā)表于 10-20 16:03 ?678次閱讀
    根據(jù)標(biāo)題獲取商品鏈接評(píng)論接口的技術(shù)實(shí)現(xiàn)

    京東:利用商品管理API自動(dòng)調(diào)整商品上下架狀態(tài),優(yōu)化搜索排名

    ? 京東:利用商品管理API自動(dòng)調(diào)整商品上下架狀態(tài),優(yōu)化搜索排名 在運(yùn)營(yíng)中,高效管理商品狀態(tài)是提升銷(xiāo)售的關(guān)鍵。京東作為領(lǐng)先的
    的頭像 發(fā)表于 09-08 16:09 ?1167次閱讀
    <b class='flag-5'>京東</b>:利用商品管理API自動(dòng)調(diào)整商品上下架狀態(tài),優(yōu)化<b class='flag-5'>搜索</b>排名

    京東 API 接口,訂單管理高效解決方案!

    ? 在當(dāng)今高速發(fā)展的時(shí)代,京東作為領(lǐng)先的平臺(tái),其 API 接口為商家和開(kāi)發(fā)者提供了強(qiáng)大的工具,幫助實(shí)現(xiàn)訂單管理的高效化。本文將逐步解
    的頭像 發(fā)表于 07-04 16:12 ?810次閱讀
    <b class='flag-5'>京東</b><b class='flag-5'>電</b><b class='flag-5'>商</b> API 接口,訂單管理高效解決方案!