长安大学学报(自然科学版)
JOURNAL OF CHANG'AN UNIVERSITY(NATURAL SCIENCE EDITION)
2004 Vol.24 No.6 P.102-105


快速挖掘最大频繁项目集的新算法

New algorithm of fast mining maximum frequent itemsets

杨君锐 

摘 要:针对关联规则下最大频繁项目集的特性,提出了一种快速挖掘最大频繁项目集的新算法MMFI(mining maximum frequent itemsets).该算法摆脱了传统的经典算法Apriori及其变种情况下的自底向上的搜索策略,利用集合枚举树(set-enumerationtree)的变形结构采取了自顶向下的新的搜索方式,并通过其独特的启发式判断策略、候选项目集的生成策略等,大大减少侯选项目集的生成,从而降低了CPU搜索时间,提高了挖掘效率.
关键词:数据挖掘;关联规则;最大频繁项目集;算法
分类号:TP311 文献标识码:A

文章编号:1671-8879(2004)06-0102-04

基金项目:陕西省教育厅专项科研基金(03JS042)
作者简介:杨君锐(1961-),男,陕西西安人,西安科技大学副教授.
作者单位:杨君锐(西安科技大学,计算机科学与技术系,陕西,西安,710054) 

参考文献:

[1]Agrawal R,Srikant R. Fast algorithms for mining association rules[A]. Proc. 1994 Int'l Conf. VLDB' 94[C]. Santiago,Chile: ACM Press, 1994. 487-499.
[2]Thomas S. An efficient algorithm for the incremental updating of association rules in large databases[A].Proc. Of the 3rd Int'l conf. On KDD and Data Mining[C]. California: Newport Beach, 1997. 134- 145.
[3]Bayardo R. Efficiently mining long patterns from databases[A]. Hass L M, Tiwary A. Proc. of the ACMSIGMOD Int'l Conf. on Management of Data[C].New York: ACM Press, 1998.85 - 93.
[4]Lin D I, Kedem Z M. Pincer-Search:a new algorithm for discovering the maximum frequent set[A]. Schek H J,Saltor F. Proc. Of the 6th European Conf. On EDT[C]. Heidelberg: Springer-Verlag, 1998. 105- 119.
[5]路松峰,卢正鼎.快速开采最大频繁项目集[J].软件学报,2001,12(2):293-297.
[6]Rymon R. Search through systematic set enumeration[A]. Nebel B, Rich C. Proc. Of the 3rd Int'l Conf. On Principles of Knowledge Representation and Reasoning[C]. Cambridge, Massachusetts: 1992. 539 - 550.
[7]李雄飞,苑森淼.多段支持度数据挖掘算法研究[J].计算机学报,2001,24(6):661-665.


收稿日期:2003年9月10日

出版日期:2004年11月1日