西  安  交  通  大  学  学  报
Vol.37 No.8

Journal of Xi'an Jiaotong University

Aug.2003


基于数据库约简的关联规则挖掘算法
刘培奇,李增智,王云岚,朱海萍,赵银亮
(西安交通大学电子与信息工程学院,710049,西安)
摘要:通过对Apriori算法挖掘过程进行分析,提出了一种基于数据库约简的关联规则挖掘算法.该算法利用每趟挖掘中一些非频繁项集的超集、并集,逐步约简事务数据库中的事务,提高了关联规则的挖掘效率.在这些非频繁项集的基础上建立了数据库约简的定理和推论,并在Apriori算法的基础上设计了ApioriNEW算法.经过对算法进行分析和实验,算法AprioriNEW的挖掘效率比较高.一般情况下,平均可将挖掘效率提高约30%.AprioriNEW算法特别适合大型数据库的关联规则挖掘,已应用在网络故障诊断专家系统的知识获取中.
关键词:数据库约简;关联规则;频繁项集;事务数据库
中图分类号:TP311文献标识码:A文章编号: 0253-987X(2003)08-0836-04