西  安  交  通  大  学  学  报

Vol.39 No.04

Journal of Xi'an Jiaotong Universtity

Nov.2005

 
基于混合模型的多搜索引擎融合
霍 华,冯博琴
(西安交通大学电子与信息工程学院,710049, 西安)
 

摘要: 为提高组合检索系统的性能,提出一种基于混合模型的多搜索引擎融合方法. 该方法利用高斯、指数密度函数分别描述相关、非相关文档的相关分值分布,用基于混合模型的算法规范化处理相关分值,估计非相关文档的相关分值,并进行分值合并. 这样做既考虑到相关、非相关文档在分值分布上的差异, 又考虑了用户对成员搜索引擎的性能评价. 实验结果表明,利用该方法的平均查准率要比成员搜索引擎平均提高37.8%,也明显高于Sum-CombSUM、Sum-CombMNZ和Standard-CombSUM 3种常用的融合方法.

关键词: 相关分值;混合模型;搜索引擎融合;分值合并
中图分类号: TP391 文献标识码: A 文章编号: 0253-987X(2005)04-0356