博客專欄

EEPW首頁(yè) > 博客 > 2W字長(zhǎng)文 | 漫談工業(yè)界圖神經(jīng)網(wǎng)絡(luò)推薦系統(tǒng)（5）

2W字長(zhǎng)文 | 漫談工業(yè)界圖神經(jīng)網(wǎng)絡(luò)推薦系統(tǒng)（5）

發(fā)布人：數(shù)據(jù)派THU 時(shí)間：2021-12-18 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

3.6 Gemini: A Novel and Universal Heterogeneous Graph Information Fusing Framework for Online Recommendations[39] [Gemini]，KDD 2020，滴滴

問(wèn)題背景：基于User-Item二分圖的方法，一種是直接在原圖上交叉聚合，另一種是借助輔助數(shù)據(jù)（如社交網(wǎng)絡(luò)）將其劃分為User-User，Item-Item同構(gòu)圖。前者會(huì)存在鄰居稀疏的問(wèn)題，后者則丟失了User-Item關(guān)聯(lián)信息，并且輔助數(shù)據(jù)限制了應(yīng)用場(chǎng)景。

業(yè)務(wù)場(chǎng)景：物品推薦排序階段

圖的構(gòu)建：群體用戶行為數(shù)據(jù)構(gòu)建的二分圖，接著通過(guò)User-Item-User，Item-User-Item關(guān)系導(dǎo)出User-User和Item-Item同構(gòu)圖，由于是通過(guò)二階鄰居導(dǎo)出的子圖，在某種程度上緩解了鄰居稀疏的問(wèn)題。

特征使用：

Node Embedding：同構(gòu)子圖可以使用User和Item的多種特征，但是作者對(duì)邊的異構(gòu)性進(jìn)行了建模，因此實(shí)際只能使用ID特征。

Edge Embedding

User-User子圖中，邊由導(dǎo)出時(shí)的中間Items決定（保留了原來(lái)的一階鄰居信息）

直接對(duì)Items Sum pooling無(wú)法建模重要性差異，因此作者提出了TF-IDF Pooling，其中TF是某Item在該邊對(duì)應(yīng)的所有Items中的占比，占比越大，說(shuō)明對(duì)該邊來(lái)說(shuō)越重要；IDF是某Item在所有邊對(duì)應(yīng)的Items集合中的占比，占比越大，說(shuō)明該Item重要性越低。TF-IDF=TF*IDF。

這里沒(méi)有直接用TF-IDF加權(quán)求和，而是將該得分分桶離散化然后Embedding，通過(guò)元素積的方式進(jìn)行特征交叉

采樣方法：Node-Wise Sampling Attention based Aggregating：加性模型計(jì)算Attention，并且考慮了Edge Embedding，得到鄰域Embedding后與自身Embedding進(jìn)行融合。

Gemini Framework

訓(xùn)練推斷：使用MLP計(jì)算User點(diǎn)擊某Item的概率，損失函數(shù)交叉熵，點(diǎn)擊Item為正樣本，曝光未點(diǎn)擊Item為負(fù)樣本（因此可以斷定是排序模型）

Joint training：在User-User上聚合鄰居時(shí)，Edge Embedding需要用到Item Embedding，反之亦然，所以User-User和Item-Item的聚合過(guò)程是相互依賴的。

Gemini-Collaboration Framework：似乎是將原來(lái)相互依賴的兩個(gè)聚合過(guò)程分開(kāi)，先將其中一個(gè)訓(xùn)練至收斂再進(jìn)行另一個(gè)，從而降低訓(xùn)練的復(fù)雜度，類似GAN的訓(xùn)練方式。

3.7 Multi-view Denoising Graph Auto-Encoders on Heterogeneous Information Networks for Cold-start Recommendation[40] [MvDGAE]，KDD 2021，騰訊

問(wèn)題背景：User-Item行為數(shù)據(jù)往往非常稀疏，新用戶或新商品存在冷啟動(dòng)問(wèn)題。一類方法通過(guò)引入更多屬性特征緩解，但是這會(huì)非常依賴特征數(shù)據(jù)的獲取和質(zhì)量；另一類方法通過(guò)HIN引入屬性信息來(lái)緩解（這和上面的有什么區(qū)別），但是它們大多通過(guò)有監(jiān)督的方式訓(xùn)練，會(huì)產(chǎn)生訓(xùn)練和測(cè)試階段的不一致（訓(xùn)練階段大多是old user或item，測(cè)試階段存在更多new user或item，它們?cè)趫D中的連接會(huì)比較稀疏，只存在一些屬性關(guān)聯(lián)）。

業(yè)務(wù)場(chǎng)景：文中沒(méi)有具體說(shuō)，從損失函數(shù)與推斷方式來(lái)看似乎是物品推薦的排序階段

圖的構(gòu)建：群體用戶行為數(shù)據(jù)+屬性數(shù)據(jù)構(gòu)成的異構(gòu)圖

特征使用：從聚合方式來(lái)看，只用上了ID特征（需要注意的是，這里是是指單個(gè)結(jié)點(diǎn)的ID特征，實(shí)際上在HIN中，屬性特征被建模為了結(jié)點(diǎn)，例如，電影的演員特征，演員被建模為了結(jié)點(diǎn)）

采樣方法：分為兩個(gè)階段，Encoder階段基于Meta-Path（首尾不限） Node-Wise采樣，Decoder階段基于特定的Meta-Path（首尾相同）采樣出User-User和Item-Item子圖，每個(gè)Meta-Path對(duì)應(yīng)一個(gè)View。Multi-view Graph Encoders

Node-level Aggregation based on Meta-path：通過(guò)GAT聚合Node-Wise采樣到的鄰居，這里不同于HAN，對(duì)于Meta-Path上的鄰居（存在不同類型）都會(huì)聚合。

Dropout on Multi-views：這里是對(duì)View的Dropout，而不是某個(gè)View下Edge的Dropout，通過(guò)Dropout可以迫使學(xué)習(xí)到的Embedding更具泛化性，在測(cè)試時(shí)對(duì)于連接稀疏的new user或item有更好效果。

Multi-view Graph Denoising Decoding

Construct Multi-View Graph：基于首尾相同的Meta-Path構(gòu)建不同View的User-User和Item-Item子圖，使得那些相似的User或Item的表征也更接近。

Multi-View Graph Decoding：用Encoder得到的Embedding重構(gòu)多個(gè)View的子圖，即鏈接預(yù)測(cè)任務(wù)。

Sampling Strategy：對(duì)所有結(jié)點(diǎn)對(duì)預(yù)測(cè)邊開(kāi)銷太大，需要經(jīng)過(guò)采樣預(yù)測(cè)部分邊，這里對(duì)Meta-Path 1-hop鄰居完全采樣，然后對(duì)2 hop鄰居部分隨機(jī)采樣，以緩解1-hop鄰居稀疏的問(wèn)題。

Bayesian Task Weight Learner：多個(gè)View子圖的Encoder和Decoder是獨(dú)立的，最終需要將它們的Loss整合到一起聯(lián)合訓(xùn)練，這里也用了異方差不確定性來(lái)自動(dòng)學(xué)習(xí)權(quán)重。

Optimization Objective：Loss由兩部分組成，一部分是重構(gòu)Loss，一部分是評(píng)分Loss（均方差）（如果只有點(diǎn)擊數(shù)據(jù)，那就是交叉熵），所以本文其實(shí)是利用到了標(biāo)簽數(shù)據(jù)，是無(wú)監(jiān)督+有監(jiān)督的結(jié)合。

3.8 Graph Intention Network for Click-through Rate Prediction in Sponsored Search[36] [GIN]，SIGIR 2019，阿里

問(wèn)題背景：使用單個(gè)用戶的歷史行為表征用戶興趣存在行為稀疏和泛化性弱的問(wèn)題；圖神經(jīng)網(wǎng)絡(luò)預(yù)訓(xùn)練的方式得到的Embedding與目標(biāo)任務(wù)不相關(guān)。

業(yè)務(wù)場(chǎng)景：搜索廣告排序階段

圖的構(gòu)建：群體用戶行為數(shù)據(jù)構(gòu)建Item同構(gòu)圖。首先將Item點(diǎn)擊序列按照Query相關(guān)性劃分為多個(gè)Session，然后在Session內(nèi)相鄰Item之間構(gòu)建鄰居關(guān)系（防止不相關(guān)的兩個(gè)Item成為鄰居），邊的權(quán)重為共現(xiàn)頻數(shù)。具體使用近30天所有用戶的點(diǎn)擊序列構(gòu)建商品相似圖。

特征使用：多種特征

采樣方法：Node-Wise Sampling，根據(jù)共現(xiàn)頻數(shù)計(jì)算概率分布模型結(jié)構(gòu)：為序列中的每個(gè)Item采樣鄰居用GNN聚合得到更一般的Embedding，即通過(guò)構(gòu)建圖引入額外信息豐富行為序列從而緩解行為稀疏問(wèn)題和泛化性弱的問(wèn)題。得到更一般的Embedding后就是常規(guī)的Target Attention抽取序列中的偏好信息。

3.9 ATBRG: Adaptive Target-Behavior Relational Graph Network for Effective Recommendation[37] [ATBRG]，SIGIR 2020，阿里

問(wèn)題背景：基于Meta-Path的方法，一方面需要人工經(jīng)驗(yàn)設(shè)計(jì)，另一方面會(huì)損失結(jié)構(gòu)信息（各Meta-Path獨(dú)立）；基于GNN的方法，一方面對(duì)Target Item和User分別采樣，缺少它們之間的交互性，另一方面隨機(jī)采樣鄰居可能會(huì)引入噪聲（這個(gè)得看圖是怎么構(gòu)建的吧，并且我們也可以按權(quán)重采樣）。

a中由于各Meta-Path獨(dú)立，襯衫和連衣裙沒(méi)能建立起關(guān)聯(lián)

b中一方面由于分別采樣，丟失了Target Item與用戶行為過(guò)的連衣裙的關(guān)聯(lián)，另一方面由于隨機(jī)采樣反而引入了開(kāi)水壺噪聲

c中用本文特有的構(gòu)建圖的方式，最終得到的KG圖既能較好地保留結(jié)構(gòu)信息，又能去除一些與Target Item不相關(guān)的噪聲。

業(yè)務(wù)場(chǎng)景：商品推薦排序階段

圖的構(gòu)建：群體用戶行為數(shù)據(jù)+屬性數(shù)據(jù)構(gòu)建的異構(gòu)圖

特征使用：ID特征

采樣方法：從Target Item和用戶行為過(guò)的Items構(gòu)成的Root Nodes合集中，分別為每個(gè)結(jié)點(diǎn)在圖中采樣K-Hop鄰居，根據(jù)采樣的結(jié)點(diǎn)集合從原圖中誘導(dǎo)出子圖（區(qū)別于獨(dú)立采樣，可以建立Target Item與行為過(guò)的相關(guān)的Item的聯(lián)系），對(duì)于該子圖中只有一個(gè)鄰居的結(jié)點(diǎn)進(jìn)行剪枝（這些結(jié)點(diǎn)很可能是噪聲）。

Embedding Layer：User和Target Item的Embedding（ID和其他特征），異構(gòu)圖（KG圖）中實(shí)體和關(guān)系的Embedding。

Relation-aware Extractor Layer：這里是用中心結(jié)點(diǎn)計(jì)算鄰居結(jié)點(diǎn)的重要性，同時(shí)對(duì)“關(guān)系”進(jìn)行了建模，即關(guān)系的類型會(huì)影響重要性，例如，點(diǎn)擊和購(gòu)買(mǎi)兩種關(guān)系，顯然表現(xiàn)出的興趣程度不同

Representation Activation Layer：得到Target Item和Sequence Item的Embedding后，這里又進(jìn)一步使用Target Attention篩選相關(guān)信息

Feature Interaction Layer：將所有Embedding Concat后送入MLP做特征交叉

3.10 GMCM: Graph-based Micro-behavior Conversion Model for Post-click Conversion Rate Estimation[38] [GMCM]，SIGIR 2020，阿里

問(wèn)題背景

微觀行為與最終是否成交高度相關(guān)，但是微觀行為不適合用序列建模，不同順序的微觀行為表達(dá)的可能是同一意圖，例如，用戶在購(gòu)買(mǎi)前先看評(píng)論再看問(wèn)大家，和先看問(wèn)大家再看評(píng)論，表達(dá)的意圖一樣。（這里的微觀行為是指用戶點(diǎn)擊商品后，購(gòu)買(mǎi)商品前發(fā)生的一系列行為，例如評(píng)論，收藏等）

CVR任務(wù)存在數(shù)據(jù)稀疏的問(wèn)題（用戶的成交行為是稀疏的）

CVR任務(wù)存在樣本選擇偏差的問(wèn)題（用戶是先點(diǎn)擊后成交，但是線上CVR預(yù)估時(shí)，是從全域候選集經(jīng)過(guò)召回后打分，而不是對(duì)用戶發(fā)生過(guò)點(diǎn)擊的Item打分）業(yè)務(wù)場(chǎng)景：商品推薦排序階段

圖的構(gòu)建：群體用戶行為數(shù)據(jù)構(gòu)建的異構(gòu)圖

微觀行為圖，結(jié)點(diǎn)是微觀行為，邊是共現(xiàn)頻數(shù)歸一化后的權(quán)重

用所有用戶的微觀行為數(shù)據(jù)構(gòu)建圖，即該圖反映的是一般性的群體規(guī)律，對(duì)于單個(gè)用戶其微觀行為數(shù)據(jù)體現(xiàn)在Node Loss中

特征使用：上游多種特征變換對(duì)齊后的Embedding

采樣方法：微觀行為圖是很小的，不需要進(jìn)行采樣 Multi-task Learning Modul：底層共享部分Embedding（特別是ID Embedding）

Graph-based CVR Networks

MLP Layers

Node Embedding Layer：將MLP的輸出通過(guò)N個(gè)1-Layer MLP映射為N個(gè)微觀行為結(jié)點(diǎn)Embedding

Graph Convolutional Networks

P是歸一化后的共現(xiàn)頻數(shù)，B是一個(gè)可學(xué)習(xí)的權(quán)重矩陣

這里分成了兩個(gè)任務(wù)，一個(gè)是預(yù)測(cè)某個(gè)微觀行為結(jié)點(diǎn)是否存在，即在構(gòu)建圖時(shí)是默認(rèn)所有微觀結(jié)點(diǎn)都存在，并且圖的邊權(quán)也是所有用戶數(shù)據(jù)統(tǒng)計(jì)出的。單個(gè)用戶的微觀行為數(shù)據(jù)是在Node Loss中體現(xiàn)的。

另一個(gè)是將CVR預(yù)測(cè)轉(zhuǎn)化為了圖分類任務(wù)，即微觀行為圖可以反映用戶是否會(huì)發(fā)生成交

圖的Embedding通過(guò)Graph Pooling得到，例如Sum pooling，Mean pooling，Concat Pooling

Loss Layer：相應(yīng)的PMG Loss也由Node Loss和CVR Loss構(gòu)成，最終Loss由PMG Loss和CTR Loss組合而成（也有分別訓(xùn)練）。這里將CTR預(yù)估分?jǐn)?shù)作為了IPV來(lái)Debias。

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀點(diǎn)，如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

LCD顯示屏相關(guān)文章:lcd顯示屏原理

lcd相關(guān)文章:lcd原理

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： AI

焦點(diǎn)

更多>>

技術(shù)專區(qū)

關(guān)閉

熟女俱乐部五十路二区av,又爽又黄禁片视频1000免费,国产卡一卡二卡三无线乱码新区,中文无码一区二区不卡αv,中文在线中文a

博客專欄

2W字長(zhǎng)文 | 漫談工業(yè)界圖神經(jīng)網(wǎng)絡(luò)推薦系統(tǒng)（5）

相關(guān)推薦

技術(shù)專區(qū)