现代图书情报技术 2007, 2(1) 10-14  DOI:      ISSN: 1003-3513 CN: 11-2856/G2

本期目录 | 下期目录 | 过刊浏览 | 高级检索                                                            [打印本页]   [关闭]
论文
扩展功能
本文信息
Supporting info
PDF(568KB)
[HTML全文](KB)
参考文献[PDF]
参考文献
服务与反馈
把本文推荐给朋友
加入我的书架
加入引用管理器
引用本文
Email Alert
本文关键词相关文章
信息检索
中文信息处理
知识发现
同义词
相关词
排除词
本文作者相关文章
章成志
苏新宁
PubMed
Article by
Article by

面向信息检索的词汇知识发现

章成志 苏新宁

(南京大学信息管理系 南京 210093)

摘要

针对信息检索中词汇知识发现问题,提出面向信息检索的词汇知识发现框架结构,对面向信息检索的词汇的定义、同义词、相关词、排除词等词汇知识获取与挖掘进行详细的介绍,为后续的语义检索研究打下基础。

关键词 信息检索   中文信息处理   知识发现   同义词   相关词   排除词  

Lexical Knowledge Discovery for Information Retrieval

Zhang Chengzhi   Su Xinning

(Department of Information Management, Nanjing University,Nanjing 210093,China)

Abstract:

This paper introduces the problem of lexical knowledge discovery for information retrieval and provides the frame of lexical knowledge discovery. The authors pose the method of words’ definition extraction, synonym recognition, relevance words recognition, mutually exclusive words recognition. The work plays an important role for the semantic search.

Keywords: Information retrieval   Chinese information processing   Knowledge discovery   Synonym words   Relevance words   Mutually exclusive words  
收稿日期 2006-10-08 修回日期  网络版发布日期 2007-01-25 
分类号:

TP391   G252

基金项目:

通讯作者: 章成志 通讯作者E_mail: zcz51@citiz.net
 

参考文献:

1许勇, 荀恩东, 贾爱平, 宋柔. 基于互联网的术语定义获取系统.中文信息学报. 2004, 18(4):37-43
2Bing Liu, Chee Wee Chin, Hwee Tou Ng. Mining topic-specific concepts and definitions on the web. In: Proceedings of the 12th international conference on World Wide Web, Budapest, Hungray,2003:251-160
3Xu J, Cao Y, Li H, Zhao M. Ranking definitions with supervised learning method. In: Proceedings of 14th International Conference on World Wide Web, Chiba, Japan, 2005:811- 819
4Salton G, McGill M J. Introduction to Modern Information Retrieval. New York:McGraw-Hill Book Co.,  1983
5王云. 查找同义词和相关词的循环衍生法. 核情报工作与研究,1997(2):7-8
6罗盛芬,孙茂松.基于字串内部结合紧密度的汉语自动抽词实验研究.中文信息学报.2003,17(3):9-14
7崔航,文继荣,李敏强.基于用户日志的查询扩展统计模型.软件学报,2003,14(9):1593-1599
8章成志,苏兰芳,苏新宁.基于多语境的相关词自动提取系统的设计与实现.现代图书情报技术,2006,(9):23-28,80
9孙茂松,左正平,邹嘉彦.高频最大交集型歧义切分字段在汉语分词中的作用中文信息学报,1999,13(1):27-34
10Mu Li, Jianfeng Gao, Changning Huang et al. Unsupervised Training for Overlapping Ambiguity Resolution in Chinese Word Segmentation. In: Proceedings of the Second SIGHAN Workshop on Chinese Language Processing. Sapporo,Japan, 2003:1-7
11苏新宁,杨薇.Web环境下全文检索系统开发平台的设计情报科学,2002,20(4):402-404,415

本刊中的类似文章
1.许春漫 .数字图书馆个性化信息检索模型研究*[J]. 现代图书情报技术, 2006,1(3): 15-19
2.张晗,崔雷,姜洋 .运用非相关文献知识发现方法挖掘科研机构潜在的合作方向[J]. 现代图书情报技术, 2006,1(4): 45-48
3.翟喜奎 .中文信息处理在数字图书馆中的应用[J]. 现代图书情报技术, 2006,1(8): 8-11
4.吴绍根 .汉语自动分词模式自动机构造研究[J]. 现代图书情报技术, 2006,1(5): 47-49
5.王兰成,王立双.一种基于数字图书馆的文本信息标引技术的改进研究*[J]. 现代图书情报技术, 2006,1(2): 5-9
6.赵丹群.数据挖掘:原理、方法及其应用[J]. 现代图书情报技术, 2000,16(6): 41-44
7.张雪英.网络专业指引库的构建理论及实现技术探讨[J]. 现代图书情报技术, 2000,16(6): 65-66
8.赵丹群.因特网上的专利信息检索及相关问题分析[J]. 现代图书情报技术, 1999,15(2): 28-30
9.赵丹群.试论联机检索系统的用户接口技术[J]. 现代图书情报技术, 1999,15(4): 6-10
10.王菁,赵满华.加强机检教学力度 培养21世纪合格人才[J]. 现代图书情报技术, 1999,15(4): 64-66
11.王晓玲.Z39.50协议的发展与在中国应用的思考[J]. 现代图书情报技术, 1999,15(6): 10-12
12.韩丽风,郑晓惠.SCI网络版评介[J]. 现代图书情报技术, 1999,15(6): 47-48
13.陈豫,杨洪陶.网络化BDSIRS全文信息检索系统的开发研究[J]. 现代图书情报技术, 1998,14(1): 6-11
14.丁申桃.电子信息源及其检索[J]. 现代图书情报技术, 1998,14(2): 7-9
15.王芳,张晓林.元搜索引擎:原理与利用[J]. 现代图书情报技术, 1998,14(6): 18-21
16.张利平.基于Push技术的Internet网络信息检索系统[J]. 现代图书情报技术, 1998,14(6): 22-25
17.雷燕.WWW信息检索技巧[J]. 现代图书情报技术, 1998,14(6): 39-42
18.吴丹.英汉交互式跨语言检索系统设计与实现*[J]. 现代图书情报技术, 2009,3(2): 89-95
19.孙国泉.网络机器人[J]. 现代图书情报技术, 1997,13(6): 35-38
20.任安良,潘一辅.基于XBASE语言的通用信息检索系统的实现[J]. 现代图书情报技术, 1996,12(2): 31-33
21.邓发云,唐莉苹.基于Web的校际共享教学与服务网站的设计*[J]. 现代图书情报技术, 2005,21(1): 79-81
22.花芳,林赛华,孙平.基于VFP的《文献信息检索与利用》题库管理系统与试题设计[J]. 现代图书情报技术, 2005,21(1): 64-66
23.李鹏,乔晓东,张用军,赵新力 .Ontology与CBR集成的Web智能信息检索研究*[J]. 现代图书情报技术, 2006,1(12): 34-36
24.施水才,孙丽华.基于数字纸张的信息检索和数据挖掘技术[J]. 现代图书情报技术, 2005,21(1): 9-11
25.原福永,陈金森,林海霞 .基于XML的智能元搜索引擎研究[J]. 现代图书情报技术, 2006,1(7): 29-32
26.沈艺.中文机读目录字符集的完整性[J]. 现代图书情报技术, 1996,12(5): 44-47
27.张承庆.中国专利信息检索系统的实现[J]. 现代图书情报技术, 1995,11(5): 3-6
28.沈辅成.TOTALS系统的实现技术[J]. 现代图书情报技术, 1995,11(5): 38-41
29.谭晓冬.超文本检索技术的发展[J]. 现代图书情报技术, 1994,10(3): 29-35
30.马铭锦,杨伟兵 .基于JSP的信息检索课网上教学系统的设计与实现[J]. 现代图书情报技术, 2006,1(6): 77-79
31.陈振标,张文德,苏悦.基于CGSP的数字图书馆资源检索*[J]. 现代图书情报技术, 2007,2(10): 16-18
32.李湖生.基于Internet的Dialog系统检索平台[J]. 现代图书情报技术, 2001,17(1): 57-59
33.王蕙 .基于海洋生物认知的专项信息系统设计与实现*[J]. 现代图书情报技术, 2006,1(5): 86-88
34.吴丹 .本体驱动的跨语言信息检索研究[J]. 现代图书情报技术, 2006,1(5): 22-26
35.章成志,苏兰芳,苏新宁 .基于多语境的相关词自动提取系统的设计与实现[J]. 现代图书情报技术, 2006,1(9): 23-28
36.章成志,苏新宁 .面向信息检索的排除词识别研究[J]. 现代图书情报技术, 2007,2(2): 44-48
37.孙巍 .一种面向中文信息检索的汉语自动分词方法[J]. 现代图书情报技术, 2006,1(7): 33-36
38.杨学明 .Web中文文本聚类研究及实现*[J]. 现代图书情报技术, 2006,1(12): 81-84
39.武兴龙,刘新旺 .二元语义信息检索模型*[J]. 现代图书情报技术, 2006,1(6): 43-46
40.聂卉 .基于本体的查询扩展与规范[J]. 现代图书情报技术, 2007,2(3): 35-38
41.汪帆,黄春毅 .不同P2P网络拓扑结构下的检索机制研究[J]. 现代图书情报技术, 2007,2(2): 90-93
42.张志娟,刘新旺.基于多粒度二元语义的SGML文件信息检索模型*[J]. 现代图书情报技术, 2007,2(7): 27-31
43.章成志,苏新宁 .基于知识空间的智能信息检索模型研究[J]. 现代图书情报技术, 2006,1(12): 29-33
44.张伟,黄奇.基于本体的信息检索系统提高检索结果相关性的研究[J]. 现代图书情报技术, 2007,2(8): 22-25
45.田俊华,杨晓江.分布式并行信息检索系统的设计与实现-基础教育资源搜索引擎个案研究[J]. 现代图书情报技术, 2007,2(8): 76-79
46.郭文丽,张晓林.嵌入式数字图书馆工具条的设计与实现[J]. 现代图书情报技术, 2007,2(6): 1-4
47.孙海霞,成颖.潜在语义标引(LSI)研究综述*[J]. 现代图书情报技术, 2007,2(9): 49-53
48.陈燕红,黄名选.基于Apriori改进算法的局部反馈查询扩展[J]. 现代图书情报技术, 2007,2(9): 84-87
49.张晗,任志国,于倩,崔雷.基于UMLS医学本体的挖掘文献间潜在联系的设计与实现[J]. 现代图书情报技术, 2007,2(9): 72-75
50.姜科,陆伟,姜捷璞,刘丹.XML检索系统及其比较研究*[J]. 现代图书情报技术, 2007,2(10): 66-70
51.黄名选,陈燕红,张师超.基于关联规则挖掘的查询扩展模型研究[J]. 现代图书情报技术, 2007,2(10): 47-51
52.窦永香,赵捧未,秦春秀.基于本体的对等网语义检索系统[J]. 现代图书情报技术, 2007,2(12): 25-29
53.陈红刚,庄超.基于多协同的即时信息检索框架[J]. 现代图书情报技术, 2008,24(2): 48-52
54.王敏,张志强.图书情报领域知识发现研究文献内容分析[J]. 现代图书情报技术, 2008,24(2): 64-68
55.乐小虬,李宇,张晓林,张智雄,李春旺.嵌入式桌面信息服务及其系统实现[J]. 现代图书情报技术, 2008,24(3): 7-11
56.姚兴山.基于Hash算法的中文分词的研究[J]. 现代图书情报技术, 2008,24(3): 78-81
57.郝嘉树,王惠临.跨语言检索中统一提问式翻译与检索过程方法探讨*[J]. 现代图书情报技术, 2008,24(4): 18-22
58.杨陟卓,韩燮.一种基于特征抽取的文档信息过滤算法研究[J]. 现代图书情报技术, 2008,24(4): 29-34
59.樊红侠.基于粗糙―模糊集的Web信息检索改进模型[J]. 现代图书情报技术, 2008,24(8): 53-57
60.苏明明,宋文.基于本体的语义搜索引擎解决方案研究新进展[J]. 现代图书情报技术, 2008,24(11): 24-28
61.张云秋,冷伏海.基于文献内聚度的非相关文献知识发现排序方法研究*[J]. 现代图书情报技术, 2009,25(6): 50-54
62.曾子明,张李义.一种基于语义相似度和多属性决策方法的商品信息智能检索模型*[J]. 现代图书情报技术, 2010,26(1): 22-27
63.张李义,张震云.一种新的跨语言商品信息检索方法在图书搜索中的应用*[J]. 现代图书情报技术, 2010,26(1): 9-14
64.付鸿鹄,张晓林 .段落检索及其相关算法研究[J]. 现代图书情报技术, 2007,2(2): 39-43
65.刘芳,杨海滨,华薇娜.数据格式转换软件的设计与实现[J]. 现代图书情报技术, 2008,24(4): 80-85
66.张晓林.面向网络的开放性图书情报自动化系统结构和运行机制[J]. 现代图书情报技术, 1995,11(3): 13-17
67.宋玲,马军.Internet信息检索分析与研究[J]. 现代图书情报技术, 2001,17(1): 37-40
68.韩毅.P2P网络信息检索的研究进展[J]. 现代图书情报技术, 2007,2(7): 36-40
69.王兰成,曾琼,陈雪强,王京 .本体论方法在文献型信息检索系统中的应用研究[J]. 现代图书情报技术, 2007,2(1): 15-19
70.李春旺.信息检索可视化技术[J]. 现代图书情报技术, 2003,19(6): 44-46
71.张长安.基于校园网的文献服务模式及信息网络建设技术探讨[J]. 现代图书情报技术, 2003,19(5): 93-94
72.常春.Ontology在信息管理领域的研究背景[J]. 现代图书情报技术, 2003,19(6): 4-7
73.李明.中文元搜索引擎万纬搜索研究[J]. 现代图书情报技术, 2003,19(5): 48-50
74.陈敏.数据采掘与信息资源的开发利用[J]. 现代图书情报技术, 2001,17(2): 27-29
75.黄如花,季一欣.OCLC FirstSearch及其检索[J]. 现代图书情报技术, 2001,17(2): 35-39
76.黄崑,符绍宏.自动分词技术及其在信息检索中应用的研究[J]. 现代图书情报技术, 2001,17(3): 26-29
77.祝忠明,沈英.Z39.50/Web网关系统的设计与实现原则[J]. 现代图书情报技术, 2001,17(4): 3-5
78.毛军.分类法在OPAC中的应用[J]. 现代图书情报技术, 2001,17(4): 14-16
79.原福永,陶凤莉,郭威,周兴林.基于DotNet的智能模糊搜索系统的实现*[J]. 现代图书情报技术, 2009,25(7-8): 43-48
80.张玉连,刘娟,齐峰,周兴林.基于摘要和日志中相关词共现策略的移动查询扩展*[J]. 现代图书情报技术, 2009,(10): 40-44
81.张露,成颖.信息检索中的语境研究综述*[J]. 现代图书情报技术, 2009,(10): 14-21
82.赵红.搜索引擎的智能化与网络信息资源的检索研究[J]. 现代图书情报技术, 2003,19(5): 51-54
83.袁媛,杜小勇,马文峰.数字图书馆信息服务平台的建设*[J]. 现代图书情报技术, 2003,19(5): 8-10
84.丛红日.网上信息专题数据库建设[J]. 现代图书情报技术, 2003,19(4): 76-77
85.黄国才.跨语言综合搜索引擎设计[J]. 现代图书情报技术, 2001,17(4): 31-33
86.刘蜀仁,钱俊雯,谷雪蔷.多类型电子资源在查新检索中的综合使用[J]. 现代图书情报技术, 2001,17(4): 37-39
87.陶跃华,孙茂松.基于潜语义标引的自然语言检索[J]. 现代图书情报技术, 2001,17(5): 40-41
88.王昌权,李隆基,宋礼秀.用ASP实现Milins系统的信息检索[J]. 现代图书情报技术, 2001,17(5): 48-51
89.胡杰,陈志刚,孙辨华.WWW-Z39.50网关的设计与实现*[J]. 现代图书情报技术, 2000,16(1): 20-22
90.莫梅琦,马虹,杨力.Internet上的Free Medline[J]. 现代图书情报技术, 2000,16(1): 42-44
91.张教业.光盘网络信息检索系统开发与应用[J]. 现代图书情报技术, 2000,16(4): 61-63
92.谢志耘.光盘网络信息检索系统的发展趋势[J]. 现代图书情报技术, 2000,16(3): 31-33
93.傅守灿,刘燕飞.基于WWW的期刊信息检索系统设计与实现[J]. 现代图书情报技术, 2000,16(3): 37-39
94.张颖,贺亚锋.网络信息检索展望[J]. 现代图书情报技术, 2000,16(3): 40-43
95.黄如花.SSCI网络版的检索[J]. 现代图书情报技术, 2000,16(5): 37-39
96.黄丽娟.基于内容的多媒体信息检索[J]. 现代图书情报技术, 2000,16(5): 40-43
97.贾西兰,丁申桃,曾姗.浅论影响CD—ROM数据光盘检索效果的技术因素[J]. 现代图书情报技术, 1997,13(2): 54-56
98.曾民族.文本信息检索技术进展和性能评价框架[J]. 现代图书情报技术, 1997,13(3): 14-18
99.严春兰,方红,刘启茂,汪德喜.基于SYBASE的图书馆网络资源服务及应用系统[J]. 现代图书情报技术, 1997,13(3): 36-40
100.沈红军,徐进鸿.声音与图象信息的存贮和检索研究[J]. 现代图书情报技术, 1997,13(4): 46-51
101.黄晓斌,邓爱贞.现代信息管理的深化——数据挖掘和知识发现的发展趋势[J]. 现代图书情报技术, 2003,19(4): 1-3
102.夏立新.网络信息检索的失误分析及扩检与缩检措施的选择[J]. 现代图书情报技术, 2003,19(3): 55-57
103.黄崑,赖茂生.Web 信息检索技术及研究进展[J]. 现代图书情报技术, 2004,20(5): 44-48
104.张延国,叶峰.词典类软件全文检索技术研究及实现[J]. 现代图书情报技术, 2004,20(4): 37-39
105.祝忠明,沈英.HTTP/Z39.50网关系统的实现[J]. 现代图书情报技术, 2002,18(2): 19-21
106.李广建,黄崑.用户模型及其学习方法[J]. 现代图书情报技术, 2002,18(6): 24-27
107.傅欣.第三代搜索引擎的智能化趋势研究[J]. 现代图书情报技术, 2002,18(6): 28-30
108.霍艳蓉.Web信息检索的关键技术[J]. 现代图书情报技术, 2002,18(6): 31-32
109.王连军 .Web文本挖掘浅析[J]. 现代图书情报技术, 2002,18(6): 38-40
110.张云秋,于双成.多媒体信息检索:技术与实例分析[J]. 现代图书情报技术, 2002,18(4): 61-63
111.宋云龙,王振云.网络环境下高校用户的信息检索教育[J]. 现代图书情报技术, 2002,18(4): 76-77
112.罗龙艳.基于可视化技术的信息检索初探[J]. 现代图书情报技术, 2002,18(4): 36-38
113.陈定权.信息检索系统中的用户相关反馈机制[J]. 现代图书情报技术, 2002,18(4): 33-35
114.孔桃,赖茂生.基于语义联想的中文图像搜索引擎——构想与实验*[J]. 现代图书情报技术, 2002,18(3): 63-65
115.沈玮杰.基于文献结构的自动文摘的初探[J]. 现代图书情报技术, 2002,18(3): 23-27
116.向桂林,张俭恭,陈定权.Metasearcher 检索异质数据源的原理及应用[J]. 现代图书情报技术, 2002,18(3): 40-42
117.郭少友.基于XML的分布式信息检索[J]. 现代图书情报技术, 2003,19(2): 51-53
118.侯震宇.信息检索系统中的相关性评价问题[J]. 现代图书情报技术, 2003,19(2): 45-47
119.王知津,周海英.语义学理论与信息检索[J]. 现代图书情报技术, 2003,19(2): 1-5
120.黄晴珊.基于Authorware网络信息检索多媒体CAI课件的开发*[J]. 现代图书情报技术, 2003,19(1): 79-81
121.邹小筑,缪红梅,陈万寅.FTP信息资源获取方法与技巧*[J]. 现代图书情报技术, 2003,19(1): 87-88
122.王知津,李明珍.十年来我国信息检索研究述评[J]. 现代图书情报技术, 2004,20(12): 25-31
123.吴瑛.信息检索网络教学系统的设计与开发[J]. 现代图书情报技术, 2004,20(11): 61-64
124.乔鸿,余锦凤.分类目录思想在信息检索中的应用——“先控”智能信息检索系统[J]. 现代图书情报技术, 2004,20(11): 24-26
125.邓辉,刘畅.基于P2P技术的高效检索模型构建研究[J]. 现代图书情报技术, 2004,20(11): 32-34
126.李培,武丽辉.基于移动代理的分布式信息检索[J]. 现代图书情报技术, 2004,20(10): 55-59
127.于淑惠.一个基于移动Agent的信息检索系统[J]. 现代图书情报技术, 2004,20(10): 46-50
128.王兰成,李超 .结合两种相似度计算的主题信息检索方法研究[J]. 现代图书情报技术, 2009,25(11): 53-58
129.宋玲丽,成颖.相关反馈技术中的检索词排序算法[J]. 现代图书情报技术, 2004,20(8): 44-47
130.冯凯,王筱明,龙金花.信息检索课程在校园网VOD教学中流媒体技术的实现[J]. 现代图书情报技术, 2004,20(8): 48-51
131.吴颖红.KDD活动的开展及其价值分析[J]. 现代图书情报技术, 2004,20(3): 29-31
132.孔黎,张成昱.基于知识发现的异质数据源学术资源检索分类系统设计*[J]. 现代图书情报技术, 2004,20(2): 46-49
133.李爱国,汪社教.信息检索可视化[J]. 现代图书情报技术, 2004,20(2): 50-52
134.沈艺.OAI协议及其应用[J]. 现代图书情报技术, 2004,20(2): 1-3
135.沈正华(编译),李武,段明莲(编译).数字视频图书馆的交互式地图*[J]. 现代图书情报技术, 2004,20(2): 4-9
136.沈艺.OpenURL及其应用[J]. 现代图书情报技术, 2004,20(1): 30-32
137.王知津,郑红军.基于代数理论的信息检索模型及其推广[J]. 现代图书情报技术, 2005,21(7): 30-33
138.赵林静,庄夏.基于语义的馆藏信息检索模型研究[J]. 现代图书情报技术, 2005,21(7): 15-17
139.苏新宁,章成志,卫平.论信息资源整合[J]. 现代图书情报技术, 2005,21(9): 54-61
140.付鸿鹄.基于Web的开放领域问答系统研究[J]. 现代图书情报技术, 2005,21(9): 36-40
141.江淇.基于P2P的适应性信息检索系统的设计[J]. 现代图书情报技术, 2005,21(9): 41-44
142.王妙娅,赖茂生.跨语言信息检索中的询问翻译方法及其研究进展[J]. 现代图书情报技术, 2005,21(4): 37-41
143.马翠嫦,王东.近五年信息检索论文分析研究[J]. 现代图书情报技术, 2005,21(4): 42-44
144.文燕平.WWW信息检索可视化实现原理研究[J]. 现代图书情报技术, 2005,21(4): 10-13
145.侯玉芳,耿骞.一个基于本体的信息检索平台[J]. 现代图书情报技术, 2005,21(8): 27-31
146.江华,赵建新,王海岚.PAT数组全文检索技术的研究与改进[J]. 现代图书情报技术, 2005,21(8): 37-41
147.丁一.Web上基于特定主题的RG-HITS算法研究[J]. 现代图书情报技术, 2005,21(6): 26-29
148.张秋霞,刘壮生.试论网络检索工具检索性能的置信区间[J]. 现代图书情报技术, 2005,21(6): 45-47
149.邓菲.基于生物信息学的鳜鱼基因知识发现*[J]. 现代图书情报技术, 2005,21(5): 68-70
150.李明伍.基于DLL的Z39.50客户端的实现*[J]. 现代图书情报技术, 2005,21(5): 30-32

Copyright 2008 by 现代图书情报技术