万方数据资源系统

长安大学学报(自然科学版)
JOURNAL OF CHANG'AN UNIVERSITY(NATURAL SCIENCE EDITION)
2007 Vol.27 No.2 P.107-110

数字化期刊

网页文献的快速模糊聚类

王剑辉  姜龙滨  杨姝 

摘 要:基于对文献聚类的3种方法(c-means法、模糊c-means法和学习向量量化法)的统计和分析,借鉴了模糊聚类思想,尤其是用协方差矩阵来描述聚类的形状和大小,并将其应用于学习向量量化算法中.针对新的参考向量开发了模糊竞争学习模式,并用该算法成功地解决了文献聚类的难题.实验结果表明:学习向量量化算法能有效地解决文献的聚类问题,运行时间短;该算法与模糊聚类算法相比更健壮;该算法使在线文献聚类分析成为可能.
关键词:模糊聚类;模糊竞争学习;学习向量量化;网页文献
分类号:TP39 文献标识码:A

文章编号:1671-8879(2007)02-0107-04

Fast fuzzy clustering of web documents

WANG Jian-hui  JIANG Long-bin  YANG Shu 

作者简介:王剑辉(1965-),男,辽宁沈阳人,副教授,博士研究生,E-mail:jwang116@hotmail.com.
作者单位:王剑辉(沈阳师范大学,科信软件学院,辽宁,沈阳,110034) 
     姜龙滨(沈阳师范大学,科信软件学院,辽宁,沈阳,110034) 
     杨姝(沈阳师范大学,科信软件学院,辽宁,沈阳,110034) 

参考文献:

[1]Kohonen T.Self-organizing maps[M].Berlin:Springer-Verlag,2001.
[2]Hoeppner F,Klawonn F.Fuzzy cluster analysis[M].England:Wiley & Sons,1999.
[3]Gustafson E E,Kessel W C.Fuzzy clustering with a fuzzy covariance matrix[C]//(IEEE CDC,San Diego,CA)Proc.18th IEEE Conference on Decision and Control.USA:IEEE Press,1979:52-56.
[4]Gath I,Geva A B.Unsupervised optimal fuzzy clustering[C]//(IEEE CDC,San Diego,CA).IEEE Trans.Pattern Analysis & Machine Intelligence.USA:IEEE Press,1989:82-84.
[5]Salton G,Allan J.Automatic structuring and retrieval of large text files[J].Communications of the ACM,1994,37(1):97-108.
[6]Salton G,Buckley C.Term weighting approaches in automatic text retrieval[J].Information Processing & Management,1988,24(4):513-523.
[7]Salton G,Wang A.A vector space model for automatic Indexing[J].Communications of the ACM,1975,18(5):613-620.
[8]Klose A,Nuemberger A.Interactive text retrieval based on document similarities[J].Physics and Chemistry of the Earth(Part A):Solid Earth and Geodesy,2000,25(5):649-654.
[9]Abraham A,Ruiz-Del-Solar J.Soft computing systems:design,management and applications[M].Netherlands:IOS Press,2002.

收稿日期:2006年9月12日

出版日期:2007年3月30日