《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 基于改進FP-growth的多品類打包推薦算法
基于改進FP-growth的多品類打包推薦算法
網絡安全與數據治理
李雄清1,2,李永1,2,王駿飛1,2,臧凌1,2,劉德志1,3, 卞宇軒1,3,柴閱林1,3,李卓瀟 1,3,劉云韜1,3
1.北京市民航大數據工程技術研究中心; 2.中國民航信息網絡股份有限公司; 3.北京航空航天大學
摘要: 多品類打包推薦是現代推薦系統中的重要任務,旨在通過組合不同類別的產品,向用戶進行一站式推薦,以滿足用戶的多樣化需求并提升用戶體驗。目前,該任務面臨即時響應需求高、數據規模龐大、數據稀疏性高等挑戰,現有打包算法難以應對。為解決上述問題,提出了一種基于改進FP-growth算法的多品類打包推薦算法,即在FP-growth算法的基礎上,對產品屬性間的關聯關系進行挖掘,并根據屬性關聯規則匹配出符合度最高的打包產品,有效緩解了產品間的數據稀疏性問題。在基于航空旅游零售領域的數據集上,本方法相較于基準方法顯著提高了打包質量和打包效率。
中圖分類號:TP311.1; TP274文獻標識碼:ADOI:10.19358/j.issn.2097-1788.2025.03.008
引用格式:李雄清,李永,王駿飛,等. 基于改進FP-growth的多品類打包推薦算法[J].網絡安全與數據治理,2025,44(3):47-53.
A multi-category bundling recommendation algorithm based on the improved FP-growth algorithm
Li Xiongqing1,2, Li Yong1,2, Wang Junfei1,2, Zang Ling1,2, Liu Dezhi1,3, Bian Yuxuan1,3, Chai Yuelin1,3, Li Zhuoxiao1,3, Liu Yuntao1,3
1. Beijing Engineering Research Center of Civil Aviation Big Data; 2. Travelsky Technology Limited; 3. Beihang University
Abstract: Multi-category bundling recommendation is a critical task in modern recommender systems, which aims to combine products from various categories into a one-stop recommendation to meet users′ diverse needs and enhance their experience. This task faces challenges such as high demand for real-time responses, large data scale and high data sparsity, which existing bundling algorithms struggle to address. This paper proposes a multi-category bundling recommendation algorithm based on an improved FP-growth algorithm, which mines associations between product attributes. The algorithm matches the most relevant bundling products based on attribute association rules,which effectively alleviates data sparsity under the product view. Experimental results on a dataset from the aviation travel retail sector show that the proposed method significantly improves both bundling quality and efficiency compared to baseline methods.
Key words : multi-category bundling; recommender systems; association rule mining; FP-growth algorithm; aviation travel retail

引言

多品類打包推薦作為現代推薦系統中的一類重要問題,在服裝搭配[1]、電子商務[2]等眾多領域受到了廣泛關注。該問題的核心在于如何挖掘多個不同類型產品間的關聯性并將其捆綁組合,以滿足用戶多樣化需求并提升用戶體驗。隨著推薦系統處理數據量的增長,現有的多品類打包推薦面臨諸多挑戰:一是即時響應需求高,擬打包產品數據會根據現實情況實時更新,推薦算法需要能夠即時準確地完成數據處理;二是數據規模龐大,需要推薦算法從海量數據中高效挖掘出產品間的關聯關系;三是數據稀疏性高,即數據中僅有少部分產品出現頻次很高,其余大部分產品的出現頻次極低,難以發掘出產品間關聯關系。

目前,應用于多品類打包的方法主要包括貝葉斯個性化推薦[3]、基于序列的方法[4-5]、基于圖的方法[6-7]等。其中,貝葉斯個性化推薦[3]利用貝葉斯定理更新用戶對產品的偏好概率,能夠處理用戶點擊等隱式反饋。基于序列的方法將待生成捆綁包視作產品序列,應用序列模型實現產品建模及捆綁包生成。He等[2]應用Transformer架構實現了捆綁包的預生成,并通過多輪對話框架進一步對捆綁包進行優化,能夠有效緩解交互稀疏性問題。Wei等[4]通過引入類型的嵌入向量,提高了對不同類型產品的建模精度,并采用非自回歸方式并行計算,提高了生成效率。基于圖的方法利用圖結構構建產品間關聯關系,能夠實現對復雜關系的精準建模。Chang等[6]使用多個視圖分別構建了產品、捆綁包和用戶的兩兩間關系,并設計了束搜索算法以實現捆綁包生成。Gong等[7]將打包推薦歸為圖的最大團問題,并提出了一種具有多頭自注意力編碼器和帶注意力機制解碼器的圖注意力網絡,實現了較高的打包準確率。

然而,上述方法模型訓練時間較長,難以滿足部分推薦系統的即時響應需求。例如,在航空旅游零售領域,機票、酒店等產品的價格、庫存等信息經常發生變動,推薦系統需要能夠即時快速響應,根據更新后的數據即時產出新的推薦結果。關聯規則挖掘是一種基于頻繁項集的方法,能夠有效挖掘出單品類產品間隱藏的關聯關系,同時由于關聯規則可以存儲在數據庫中,在實際應用中具有較高的推薦效率。Apriori算法[8]是關聯規則挖掘中最經典的方法,其不足在于需要頻繁掃描數據庫,運算耗時長。為解決這一問題,Zaki等[9]提出了Eclat算法,加入倒排思想,降低了數據庫掃描次數;Han等[10]提出了FP-growth算法,采用另一種更為高效的數據結構FP-Tree,有效壓縮了數據,提高了運算效率。

不過,在現實場景中,多品類產品數量龐大,包含不同品類產品的訂單數量較少,產品間關聯信息往往更為稀疏,導致Apriori、FP-growth等傳統關聯規則挖掘算法需要海量訂單數據才能進行有效挖掘。為此,本文提出一種基于改進FP-growth的多品類打包推薦算法,將頻繁項集中的項從產品替換為產品屬性,從挖掘產品間的關聯規則轉變為挖掘產品屬性間的關聯規則,有效降低潛在規則數量,提高稀疏數據的挖掘效率,減少挖掘過程所需訂單數量。


本文詳細內容請下載:

http://www.rjjo.cn/resource/share/2000006377


作者信息:

李雄清1,2,李永1,2,王駿飛1,2,臧凌1,2,劉德志1,3,

卞宇軒1,3,柴閱林1,3,李卓瀟 1,3,劉云韜1,3

(1.北京市民航大數據工程技術研究中心, 北京101318;

2.中國民航信息網絡股份有限公司, 北京101318;

3.北京航空航天大學, 北京100191)


Magazine.Subscription.jpg

此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 亚洲国产日韩欧美一区二区三区 | www黄网站| 亚洲 欧美 精品 | 国产视频中文字幕 | 久草中文在线 | 亚洲国产精品大秀在线播放 | 毛片在线播放网站 | 五月久久亚洲七七综合中文网 | 久久一日本道色综合久 | 中国老妇另类xxxx | 俄罗斯黄色一级片 | 亚洲第一在线 | 欧美在线一级毛片视频 | 国产成人在线观看免费网站 | 亚洲免费视 | 国产精品欧美一区二区在线看 | 99视频在线 | 美国做受三级的视频播放 | 香蕉超级碰碰碰97视频蜜芽 | 日本欧美一级aaaaa毛片 | 久久夜色精品国产噜噜亚洲a | 99re久久资源最新地址 | 全免费a级毛片免费看 | 亚洲日本欧美产综合在线 | 国产高清视频在线 | 亚州三级 | 成人网在线视频 | 国产一级毛片视频在线! | 日本乱人伦片中文字幕三区 | 欧美亚洲中日韩中文字幕在线 | 99久久精品费精品国产一区二 | 成人在线视频国产 | 欧美日韩在线播一区二区三区 | 成人公开视频 | 91久久网 | 免费观看a级网站 | 国产三级网 | 亚洲一区二区免费视频 | 欧美性一级 | 99久久精品国产亚洲 | 美女张开腿双腿让男人桶 |