| 现代图书情报技术 2006, 1(12) 40-43 DOI: ISSN: 1003-3513 CN: 11-2856/G2 | |||||||||||||||||||||||||||||||||||||||||||||||||
| 本期目录 | 下期目录 | 过刊浏览 | 高级检索 [打印本页] [关闭] | |||||||||||||||||||||||||||||||||||||||||||||||||
| 论文 |
| ||||||||||||||||||||||||||||||||||||||||||||||||
|
基于网页摘要分析的元搜索引擎研究* | |||||||||||||||||||||||||||||||||||||||||||||||||
|
翁勍力1,2 施水才2 赵捧未1 | |||||||||||||||||||||||||||||||||||||||||||||||||
|
1(西安电子科技大学经济管理学院 西安 710071) | |||||||||||||||||||||||||||||||||||||||||||||||||
| 摘要:
针对目前搜索引擎返回结果的海量性,构建一个元搜索引擎,旨在高效利用多个成员搜索引擎返回的结果。介绍元搜索引擎的基本架构及当前结果融合的主要方法,应用统计学方法研究网页标题、网页摘要与网页文本之间的相关性关系,从而确定相关度权值进行结果相关性判断。实验证明,元搜索引擎搜索结果的平均准确率比各个成员引擎的搜索结果平均准确率都有较大提高。 | |||||||||||||||||||||||||||||||||||||||||||||||||
| 关键词: 元搜索 摘要分析 相关度 | |||||||||||||||||||||||||||||||||||||||||||||||||
|
A Study on Meta-search Based on Abstract Analysis | |||||||||||||||||||||||||||||||||||||||||||||||||
|
Weng Qingli1,2 Shi Shuicai2 Zhao Pengwei1 | |||||||||||||||||||||||||||||||||||||||||||||||||
|
1(Institute of Economy and Management, Xidian University, Xi’an 710071,China) | |||||||||||||||||||||||||||||||||||||||||||||||||
| Abstract:
Facing too much results returned by different search engines, this paper designs a meta-search in order to fully utilize the results. It introduces the basic structure of meta-search and methods of results merging. And employs the techniques of statistics to study the relevance between title and page content, relevance between abstract and page content, and then fixes the weights of title and abstract when judge the relevance of search results. The experiment proves the improvement of average veracity comparing with the member search engines. | |||||||||||||||||||||||||||||||||||||||||||||||||
| Keywords: Meta-search Abstract analysis Relevance | |||||||||||||||||||||||||||||||||||||||||||||||||
| 收稿日期 2006-09-14 修回日期 网络版发布日期 2006-12-25 | |||||||||||||||||||||||||||||||||||||||||||||||||
| 分类号: TP391 |
|||||||||||||||||||||||||||||||||||||||||||||||||
| 基金项目:
*本文系国家自然科学基金项目“Web数据挖掘技术研究”(项目编号:60272084)及北京市教育委员会科技发展计划重点项目“面向大规模真实文本的数据挖掘技术”(项目编号:KZ200310772013)的研究成果之一。 | |||||||||||||||||||||||||||||||||||||||||||||||||
| 通讯作者: 翁勍力 通讯作者E_mail: tutu_19821120@hotmail.com | |||||||||||||||||||||||||||||||||||||||||||||||||
|
| |||||||||||||||||||||||||||||||||||||||||||||||||
| 参考文献: | |||||||||||||||||||||||||||||||||||||||||||||||||
1李广建,黄崑. 元搜索引擎及其主要技术. 情报科学, 2002, 20(2) :175-179 |
|||||||||||||||||||||||||||||||||||||||||||||||||
| 本刊中的类似文章 | |||||||||||||||||||||||||||||||||||||||||||||||||
| 1.王芳,张晓林.元搜索引擎:原理与利用[J]. 现代图书情报技术, 1998,14(6): 18-21 | |||||||||||||||||||||||||||||||||||||||||||||||||
| 2.原福永,陈金森,林海霞 .基于XML的智能元搜索引擎研究[J]. 现代图书情报技术, 2006,1(7): 29-32 | |||||||||||||||||||||||||||||||||||||||||||||||||
| 3.陈祖琴,郑宏 .基于元搜索引擎的中文数据库引文分析系统[J]. 现代图书情报技术, 2006,1(11): 65-68 | |||||||||||||||||||||||||||||||||||||||||||||||||
| 4.徐金雷,杨晓江 .专业搜索引擎的排序算法研究[J]. 现代图书情报技术, 2006,1(7): 20-24 | |||||||||||||||||||||||||||||||||||||||||||||||||
| 5.欧阳剑,李冠盛 .元搜索引擎原理在实现分布式虚拟联合目录中的应用研究[J]. 现代图书情报技术, 2006,1(9): 63-67 | |||||||||||||||||||||||||||||||||||||||||||||||||
| 6.许文,都云程,李渝勤,施水才 .一种通用HTML网页主题信息提取方法*[J]. 现代图书情报技术, 2007,2(1): 40-43 | |||||||||||||||||||||||||||||||||||||||||||||||||
| 7.邱宇红,郭继军.向量空间模型在医学文献相关性研究中的应用[J]. 现代图书情报技术, 2007,2(7): 63-67 | |||||||||||||||||||||||||||||||||||||||||||||||||
| 8.谢蕙,秦杰,胡双双.基于用户查询关键词的网页去重方法研究[J]. 现代图书情报技术, 2008,24(7): 43-46 | |||||||||||||||||||||||||||||||||||||||||||||||||
| 9.李培.基于词序的多关键词加权检索融合研究*[J]. 现代图书情报技术, 2008,24(10): 32-37 | |||||||||||||||||||||||||||||||||||||||||||||||||
| 10.王梅文.基于本体进行自动分类的元搜索引擎的设计与实现[J]. 现代图书情报技术, 2008,24(9): 58-63 | |||||||||||||||||||||||||||||||||||||||||||||||||
| 11.姜华.基于本体的语义检索技术研究与实现[J]. 现代图书情报技术, 2008,24(4): 39-43 | |||||||||||||||||||||||||||||||||||||||||||||||||
| 12.李明.中文元搜索引擎万纬搜索研究[J]. 现代图书情报技术, 2003,19(5): 48-50 | |||||||||||||||||||||||||||||||||||||||||||||||||
| 13.张俭恭,陈定权,吴振新.关于搜索引擎与元搜索引擎的讨论[J]. 现代图书情报技术, 2002,18(2): 36-38 | |||||||||||||||||||||||||||||||||||||||||||||||||
| 14.乐庆玲.大型元搜索引擎的自动化构建[J]. 现代图书情报技术, 2004,20(11): 35-38 | |||||||||||||||||||||||||||||||||||||||||||||||||
| 15.段寿建,杨朝凤,甘健侯.基于领域本体的概念语义相似度和相关度综合量化研究*[J]. 现代图书情报技术, 2009,25(11): 40-43 | |||||||||||||||||||||||||||||||||||||||||||||||||
| 16.刘畅,林剑锋,王雁杰.元搜索引擎的调查分析[J]. 现代图书情报技术, 2004,20(9): 40-43 | |||||||||||||||||||||||||||||||||||||||||||||||||
| 17.张学宏(编译).元搜索引擎Dogpile研究[J]. 现代图书情报技术, 2005,21(7): 34-37 | |||||||||||||||||||||||||||||||||||||||||||||||||
| Copyright 2008 by 现代图书情报技术 | |||||||||||||||||||||||||||||||||||||||||||||||||