西  安  交  通  大  学  学  报

Vol.39 No.12

Journal of Xi'an Jiaotong University

Jan.2005

engl.gif (1752 字节)

zfh.gif (1500 字节)

 

分类器模拟算法及其应用
杨利英,覃征,张选平
(西安交通大学电子与信息工程学院,710049,西安)

摘要:针对标准数据集在评估多分类器系统的组合方法时存在的不足,设计了一种新的分类器模拟算法.该算法利用分类器的识别率建立混淆矩阵,由混淆矩阵生成基分类器的决策,进而结合分类器之间的相关性度量生成所有的模拟数据.通过实验评估表明,该算法能够模拟任意多个分类器和任意多个模式类别的数据,且能够表达出分类器之间的关联性.又应用生成的模拟数据集对多数投票和堆叠泛化这2种组合方法进行了实验,结果表明分类器之间的负相关有助于提高系统的性能,特别是当单个分类器识别率取0.8、关联度从0.8295降至-0.4847时,多数投票和堆叠泛化的性能分别提高了14.98%和41.99%.
关键词:多分类器系统;分类器模拟算法;相关性
中图分类号:TP181文献标识码:A文章编号:0253-987X(2005)12-1311-04