西  安  交  通  大  学  学  报
Vol.37 No.12

Journal of Xi'an Jiaotong University

Dec.2003

基于随机抽样和聚类特征的聚类算法
周兵,沈钧毅,彭勤科
(西安交通大学电子与信息工程学院,710049,西安)
摘要:在分析BIRCH算法不足的基础上,提出了一种基于随机抽样和聚类特征的聚类算法(CLAP).该算法采用随机抽样技术,从数据库中抽取一部分数据进行聚类的预处理过程,这样大大降低了运行时间.CLAP通过设立索引树的叶节点的直径和聚类直径,提高了聚类的精度,并采用全局搜索和局部搜索相结合的方式,消除了输入顺序对聚类质量的影响.测试结果表明,CLAP算法不仅提高了聚类速度,而且改善了聚类质量.
关键词:聚类;BIRCH算法;随机抽样
中图分类号:TP311文献标识码:A文章编号: 0253987X(2003)12123404