现代图书情报技术 2006, 1(3) 55-58  DOI:      ISSN: 1003-3513 CN: 11-2856/G2

本期目录 | 下期目录 | 过刊浏览 | 高级检索                                                            [打印本页]   [关闭]
论文
扩展功能
本文信息
Supporting info
PDF(0KB)
[HTML全文](KB)
参考文献[PDF]
参考文献
服务与反馈
把本文推荐给朋友
加入我的书架
加入引用管理器
引用本文
Email Alert
本文关键词相关文章
信息抽取
信息抽取系统
评估
可移植性
开放域
本文作者相关文章
邓尚民
孙玉伟
PubMed
Article by
Article by

信息抽取系统的研究现状

邓尚民 孙玉伟

(山东理工大学科技信息研究所 淄博 255049)

摘要

对信息抽取的概念和发展状况做了论述,介绍了国内外信息抽取系统发展状况,指出了存在的问题以及相应的解决方案,最后对中文信息抽取系统的建设提出了几点建议。

关键词 信息抽取   信息抽取系统   评估   可移植性   开放域  

A Survey on Information Extraction System

Deng Shangmin   Sun Yuwei

(Institute of Scientific and Technical Information of Shandong University of Technology, Zibo 255049, China)

Abstract:

The paper presents the concept and development situation of IE and introduces IE systems of foreign countries as well as that of China, pointing out the problems existing in the construction of IE system and giving some solutions to them. Finally, a few suggestions are made for the construction of Chinese IE system.

Keywords: Information extraction   Information extraction system   Evaluation   Portability   Open-domain  
收稿日期 2005-12-22 修回日期  网络版发布日期 2006-03-25 
分类号:

TP391   G350.7

基金项目:

通讯作者: 孙玉伟 通讯作者E_mail: wusuowei_0003@163.com
 

参考文献:

1Ralph Grishman. Information extraction:Techniques and Challenges.In Maria Teresa Pazienza,editor,Information Extraction. Springer-Verlag, Lecture Nots in Artificial Intelligence,Room,1997
2Ralph Grishman and Beth Sundheim. Message Understanding Conference-6: A Brief History. In Proceedings of 16th International Computational Linguistics.1996
3Chinchor N.overview of MUC-7/MET-2.in: Proceedings of the Seventh Message Understanding Conference,1998
4Proceedings of the Third Message Understanding Conference(MUC-3). Morgan Kaufmann,May,1991
5Proceedings of the Fourth Message Understanding Conference(MUC-4). Morgan Kaufmann, 1992
6Proceedings of the Fifth Message Understanding Conference(MUC-5). Baltimore,MD, August, 1993. Morgan Kaufmann
7Proceedings of the Sixth Message Understanding Conference(MUC-6). Columbia,MD,November,1995. Morgan Kaufmann
8Merchant, R,; Okurowski, M.E.; and Chinchor,N. The Multilingual Entity Task (MET) Overview.In Proceedings, Tipster Text Program (Phase II). 1996
9Appelt, D. et al., FASTUS: A Finite-State Processor for Information Extraction from Real-World Text, Proceedings of the 13th International Joint Conference on Artificial Intelligence (IJCAI-93), August, 1993:1172-1178
10Hobbs, Jerry; Douglas Appelt;John Bear;David Israel; Mabry Tyson. FASTUS: a Cascated Finte-State Transducer for Extracting Information from Natural-LanguageText . Technical Note No . 519 . SRI International Artificial Intelligence Center . 1992
11孙斌.信息提取技术概述.术语标准化与信息技术.2003(1)
12Douglas Appelt, Jerry Hobbs, John Bear, David Israel, Megumi Kameyama, Andy Kehler, David Martin, Karen Meyers, and Mabry Tyson. SRI International FASTUS system: MUC-6 test results and analysis. In Proc. Sixth Message Understanding Conf. (MUC-6), Columbia, MD, November 1995. Morgan Kaufmann.
13Rohini K. Srihari;Wei Li;Cheng Niu ;Thomas Cornell. InfoXtract: A Customizable Intermediate Level Information Extraction Engine.In Proceedings of HLT/NAACL 2003 Workshop on Software Engineering and Architecture of Language Technology Systems (SEALTS).2003:52-59
14Srihari, R. and W. Li. A Question Answering System Supported by Information Extraction. In Proceedings of ANLP 2000. Seattle. 2000
15Ralph Grishman and John Sterling. New York University: Description of the PROTEUS System as used for MUC-5. In Proc. Fifth Message Understanding Conf. (MUC-5), Baltimore, MD, August 1993. Morgan Kaufmann
16Ralph Grishman.The NYU System for MUC- 6 or Where’s the Syntax? In Proc.Sixth Message Understanding Conference.(MUC-6), Columbia, MD, November 1995.Morgan Kaufman.
17Roman Yangarber and Ralph Grishman. Customization of information extraction systems. In Paola Ve-lardi, editor, Proc. International Workshop on Lexically Driven Information Extraction, Frascati, Italy,July 1997
18Yangarher R Grishman R.NYU: Description of the Proteus/PET system as used for MUC-7(C).in: Proceedings of the seventh Message Understanding Conference,1998
19Nancy A.Chinchor. MUC/MET Evaluation Trends.1999
20Chikashi NOBOTO, Satoshi SEKINE. Towards Automatic Acquisition of Patterns for Information Extraction.1999
21Niu, C., W. Li and R. Srihari. Weakly Supervised Learning for Cross-document Person Name Disambiguation Supported by Information Extraction. 2004
22Srihari, R., W. Li, L. Crist, and C. Niu. Intelligence Discovery Portal based on Corpus Level Information Extraction.In Proceedings of 2005 International Conference on Intelligence Analysis Methods and Tools. 2005

本刊中的类似文章
1.董丽,吴冬曼,周虹,林彤,黄晓玲,解春伟,赵熊 .基于LibQUAL+TM的图书馆服务质量评估方法研究和实践分析[J]. 现代图书情报技术, 2006,1(3): 76-81
2.许鑫,黄仲清.垂直搜索引擎应用中的若干策略探讨*——以12580餐饮垂直搜索为例[J]. 现代图书情报技术, 2009,3(2): 62-70
3.翟东升,余旸,李莉.网络信息抽取技术及其在TBT预警中的应用*[J]. 现代图书情报技术, 2005,21(9): 76-79
4.李慧,刘东苏,王玙 .基于OWL的电子商务安全管理框架[J]. 现代图书情报技术, 2006,1(11): 69-72
5.沈正华.光盘数据库质量的评估[J]. 现代图书情报技术, 1996,12(4): 38-40
6.杭月芹,姚滢,沈洁 .基于单文档的上下文查询信息抽取*[J]. 现代图书情报技术, 2006,1(10): 30-33
7.柳佳刚,陈山,贺令亚.基于本体和DOM相结合的Web信息抽取器[J]. 现代图书情报技术, 2009,25(5): 44-49
8.袁名敦.图书馆自动化应用软件的质量和评价问题[J]. 现代图书情报技术, 1991,7(3): 2-5
9.高霄云,杨建林 .基于规则的中文时间词和数词的自动识别算法[J]. 现代图书情报技术, 2007,2(3): 46-50
10.王非 .网络学术文献信息门户[J]. 现代图书情报技术, 2006,1(9): 53-57
11.朱红灿,龙朝阳 .基于熵的新闻网页抽取方法的研究[J]. 现代图书情报技术, 2007,2(4): 48-51
12.徐德智,刘正 .OWL知识库的对比研究[J]. 现代图书情报技术, 2006,1(11): 36-40
13.孙素云.基于UDDI扩展的Web服务信誉度模型研究[J]. 现代图书情报技术, 2007,2(7): 32-35
14.藕军,任明仑 .搜索引擎返回结果自动抽取[J]. 现代图书情报技术, 2007,2(2): 49-52
15.廉站俊,吕学强,张玉杰,施水才.基于句子相似度计算的信息抽取*[J]. 现代图书情报技术, 2007,2(6): 38-41
16.黄永文,李广建.数字图书馆中的ETL应用研究综述[J]. 现代图书情报技术, 2007,2(12): 1-5
17.洪梅,马建霞 .开源机构库软件可用性评估方法的探讨[J]. 现代图书情报技术, 2007,2(12): 6-10
18.王昊,邓三鸿.HMM和CRFs在信息抽取应用中的比较研究[J]. 现代图书情报技术, 2007,2(12): 57-63
19.赵琦,刘建华,冯浩然.从ACE会议看信息抽取技术的发展趋势*[J]. 现代图书情报技术, 2008,24(3): 18-23
20.赵洪,肖洪,薛德军,师庆辉.Web表格信息抽取研究综述[J]. 现代图书情报技术, 2008,24(3): 24-31
21.张辉,徐朝军,王蔚.教育游戏资源智能搜索系统的设计与实现*[J]. 现代图书情报技术, 2008,24(6): 46-50
22.徐健,张智雄,吴振新.实体关系抽取的技术方法综述*[J]. 现代图书情报技术, 2008,24(8): 18-23
23.吕聚旺,都云程,王弘蔚,施水才.基于新型主题信息量化方法的Web主题信息提取研究*[J]. 现代图书情报技术, 2008,24(12): 48-53
24.陈敬文,彭哲.基于CPN网络的Web正文抽取技术研究[J]. 现代图书情报技术, 2008,24(11): 65-71
25.高文利,高元先.学位论文参考文献的自动抽取及标注[J]. 现代图书情报技术, 2008,24(11): 72-75
26.黄水清,陈双喜,任妮.基于ISO27001的数字图书馆信息安全风险评估模型研究*[J]. 现代图书情报技术, 2009,25(6): 44-49
27.高文利.基于本体的军备情报抽取系统的设计与实现*[J]. 现代图书情报技术, 2010,26(1): 83-87
28.王满,徐朝军.网络课程资源自动量化评价研究*[J]. 现代图书情报技术, 2010,26(1): 88-93
29.化柏林, 郭江.基于规则的高校实验室Web信息抽取的系统设计与实现*[J]. 现代图书情报技术, 2009,(10): 62-66
30.陈良,程小澜.建设图书馆自动化系统的决策与前期准备[J]. 现代图书情报技术, 1995,11(3): 18-23
31.赵英莉.中科院文献情报机构评估系统的设计与实现[J]. 现代图书情报技术, 2001,17(1): 71-72
32.沈劲枝,寇文波,田晨耕.基于特征定位边界预测的Web档案正文采集*[J]. 现代图书情报技术, 2009,25(12): 52-56
33.贾美英,杨炳儒,郑德权,曹鸿强,杨靖,张练.基于模式匹配的军事演习情报信息抽取*[J]. 现代图书情报技术, 2009,(9): 70-75
34.倚海伦,师俏梅,李晶.图书馆资源评估读者调查系统的设计与实现[J]. 现代图书情报技术, 2009,(9): 91-95
35.陈艳梅,张斌.HTML到XML转换技术的研究与实现[J]. 现代图书情报技术, 2003,19(5): 66-67
36.武三琳.论高校图书馆自动化评估[J]. 现代图书情报技术, 2001,17(5): 22-24
37.张智雄.信息抽取技术及其在数字图书馆中的应用前景分析[J]. 现代图书情报技术, 2004,20(6): 1-5
38.赵仪,赵熊,张成昱.专业网站的评价指标分析[J]. 现代图书情报技术, 2002,18(4): 43-45
39.董丽,周虹,赵熊.读者满意度调查分析系统的设计与实现[J]. 现代图书情报技术, 2004,20(12): 72-75
40.孙玉艳,张文德.企业专利量化评估系统的设计与实现*[J]. 现代图书情报技术, 2009,25(11): 64-68
41.张新民,胡红亮,王艳,梁战平,张传本,郑力.网站信息架构的评估[J]. 现代图书情报技术, 2004,20(3): 51-55
42.吴伟,刘友华.基于DOM的Web信息自动抽取[J]. 现代图书情报技术, 2004,20(2): 68-71
43.尹良伟,都平平.数字化图书馆时代高校图书馆评估的指标体系探讨及标准策划[J]. 现代图书情报技术, 2004,20(2): 25-28
44.顾东蕾.期刊网站的评价指标体系[J]. 现代图书情报技术, 2005,21(11): 68-71
45.张会田.图书馆常用WebPAC系统比较评估研究[J]. 现代图书情报技术, 2005,21(9): 28-31
46.宋艳娟,张文德.基于XML的PDF文档信息抽取系统的研究*[J]. 现代图书情报技术, 2005,21(9): 10-13
47.丁晟春,苗露.企业科技信息服务网站的IA评估研究[J]. 现代图书情报技术, 2005,21(8): 72-76
48.程妮,崔建海,王军.国外信息过滤系统的研究综述[J]. 现代图书情报技术, 2005,21(6): 30-38

Copyright 2008 by 现代图书情报技术