《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 基于約束的多維Apriori改進算法
基于約束的多維Apriori改進算法
電子技術應用
王志昊,蘇明月,李東方,沈煒,楊光
(北京計算機技術及應用研究所,北京 100854)
摘要: 針對經典多維關聯規則挖掘算法執行效率不高、存在冗余規則的不足,提出基于約束的多維Apriori改進算法,在多維Apriori算法的基礎上,將用戶約束引入挖掘過程,根據關于謂詞的約束產生用戶感興趣的頻繁謂詞集,并以此為依據刪減事務集。該算法一方面通過用戶約束大大縮減了候選謂詞集的產生,另一方面經過刪減的事務集也降低了掃描數據庫的開銷,最終實現了挖掘效率的提高以及冗余規則的減少。應用該算法在FPGA代碼缺陷事務集上進行對比實驗,實驗結果證明了該算法相比多維Apriori算法,在搜索效率以及挖掘結果的準確性方面均得到了改善,有效提高了FPGA代碼缺陷分析的準確性。
中圖分類號:TP311 文獻標志碼:A DOI: 10.16157/j.issn.0258-7998.233873
中文引用格式: 王志昊,蘇明月,李東方,等. 基于約束的多維Apriori改進算法[J]. 電子技術應用,2023,49(10):100-105.
英文引用格式: Wang Zhihao,Su Mingyue,Li Dongfang,et al. Algorithm of multi-dimensional Apriori with constraints[J]. Application of Electronic Technique,2023,49(10):100-105.
Algorithm of multi-dimensional Apriori with constraints
Wang Zhihao,Su Mingyue,Li Dongfang,Shen Wei,Yang Guang
(Institute 706, Second Academy of China Aerospace Science and Industry Corporation, Beijing 100854, China)
Abstract: Aiming at the inefficiency of multi-dimensional association rules mining algorithm and the existence of redundant rules, an algorithm of multi-Dimensional apriori with constraints is proposed. Based on the multi-dimensional Apriori algorithm, the algorithm controls the mining process with user constraints. According to the predicate constraint, the frequent predicate set that is of interest to the user is generated, and the transaction set is deleted based on the predicate constraint. On the one hand, the algorithm greatly reduces the generation of candidate predicate sets through user constraints. On the other hand, the reduced transaction set also reduces the scanning database overhead. Finally, the efficiency of mining is improved and the redundant rules are reduced. This algorithm is used to compare experiments on FPGA code defect transaction sets. The experimental results show that compared with the multi-dimensional Apriori algorithm, this algorithm has improved the search efficiency of frequent predicate sets and the accuracy of mining results.
Key words : association rules mining;multi-dimensional association rule;Apriori;frequent predicate set;predicate constraint;data mining

0 引言

現代社會,生產力快速發展,通過不斷變革生產信息技術,人們大大提高了創造和收集數據的能力,迅速擴大了數據資料的規模。急劇增長的數據資料和數據庫迫使人們采用新的技術手段和工具來處理海量的數據,自動自主地幫助人們管理、提取并分析有用的信息,來發掘有價值的知識,為人們提供決策服務。由此,數據挖掘(Data Mining)[1] 在這樣的宏觀背景下誕生。將數據挖掘技術充分運用到現實的生產中,提高企業生產的效率,降低生產成本。數據挖掘的應用范圍較廣,如聚類、預測、分類、異常分析以及相互關聯性分析。

數據挖掘中,關聯規則是較為主要的研究對象。其中頻繁項集的產生是最核心、最受關注的問題。關聯規則反映了一個事物與其他事物之間的相互依存和關聯性[2]。換句話說,關聯規則是一種隱含在數據中的知識模型,其通過量化數字,從海量數據中挖掘出有價值的數據項之間的相關關系[3]。

關聯規則挖掘最初由Agrawal[4]等人于1993年提出,通過關聯規則的挖掘可以找出潛藏在數據庫中各個屬性之間的關系,輔助人們更合理地進行商業活動、金融決策和生產生活等。

目前,典型的挖掘關聯規則的算法主要是Apriori算法[5],其核心在于找到數據庫中的所有頻繁項集。Apriori算法通過逐級產生頻繁項集并利用先驗性質縮減候選項集產生。在掃描數據集的過程中,Hossain提出可使用自動遞歸連接來挖掘候選項目集[6],然后剪枝用于挖掘頻繁項集。2021年,Li等人提出基于時序約束的關聯規則挖掘,減小了系統開銷[7]。Wang等人利用MapReduce的思想改進Apriori算法,有效提高了搜索效率[8]。2022年,Dhinakaran等人集成Apriori算法和仿生算法,通過降低處理大型數據集時的低運行時性能來解決頻繁項集問題[9]。



本文詳細內容請下載:http://www.rjjo.cn/resource/share/2000005721




作者信息:

王志昊,蘇明月,李東方,沈煒,楊光

(北京計算機技術及應用研究所,北京 100854)


微信圖片_20210517164139.jpg

此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 精品久久成人免费第三区 | 久久精品视频免费播放 | 国产成人av在线 | 一级a欧美毛片 | 91香蕉国产在线观看免费永久 | 深夜爽爽爽gif福利免费 | 亚洲精品98久久久久久中文字幕 | 最新亚洲人成网站在线影院 | 一级美女片| 999久久| 亚洲视频中文字幕在线 | 亚洲综合天堂 | 性强烈欧美一级毛片 | 久久综合九色综合欧洲色 | 好吊妞国产欧美日韩视频 | 国产在线观看午夜不卡 | 欧美精品一区视频 | 国产成人一区二区三区免费观看 | 久久在线免费观看视频 | 手机看片日韩日韩韩 | 欧美视频在线一区二区三区 | 欧美成人免费一级人片 | 91九色视频无限观看免费 | 久久久久国产一级毛片高清片 | 色偷偷成人网免费视频男人的天堂 | 狠狠色丁香婷婷久久综合考虑 | 美女视频黄a视频免费全程 美女视频黄a视频免费全过程 | 亚洲国产午夜精品理论片的软件 | 九九久久精品国产 | 91国内精品久久久久影院优播 | 欧美一级片在线播放 | 欧美高清在线视频一区二区 | 日本不卡一区视频 | 国产91久久精品一区二区 | 久草久草视频 | 国产三级全黄 | 亚洲毛片| 国产一级久久久久久毛片 | 日本午夜vr影院新入口 | 日韩一区国产二区欧美三区 | 奇米网狠狠干 |