|
|
现代图书情报技术 2007, 2(3) 46-50 DOI:
ISSN: 1003-3513 CN: 11-2856/G2 |
|
|
|
|
本期目录 |
下期目录 |
过刊浏览 |
高级检索
[打印本页]
[关闭]
|
|
| 论文 |
|
|
基于规则的中文时间词和数词的自动识别算法 |
|
|
高霄云 杨建林 |
|
|
(南京大学信息管理系 南京 210093) |
|
|
摘要:
对中文时间词和数词在文本中的常见形式进行归纳,以此为基础构建用于识别时间词、数词的规则集,提出一个基于规则的时间词和数词自动识别算法,并对该算法在竞争情报分析领域和机器翻译领域中的应用价值进行论述。 |
|
|
关键词:
词语切分
信息抽取
规则
|
|
|
Chinese Time Words and Numerals Automatic Segmentation Method Based on Rules |
|
|
Gao Xiaoyun Yang Jianlin
|
|
|
(Department of Information Management, Nanjing University, Nanjing 210093, China)
|
|
|
Abstract:
This paper firstly generalizes the formats of Chinese time words and numerals appearing in the text. Based on them, this paper then sets up a rule sets for recognition, proposes a method about Chinese time words and numerals based on rules and discusses its application value in competitive intelligence analysis as well as machine translation field at last. |
|
|
Keywords:
Word segmentation
Information extraction
Rule
|
|
|
收稿日期 2007-01-08 修回日期 2007-02-10 网络版发布日期 2007-03-25 |
|
|
分类号: TP391 G252 |
|
|
基金项目:
|
|
|
通讯作者: 高霄云 通讯作者E_mail: blue-6095@163.com |
|
|
|
|
|
| 参考文献: |
1余战秋.中文分词技术及其应用初探.电脑知识与技术,2004(32):81-83
2孙茂松,邹嘉彦.汉语自动分词研究评述.当代语言学,2001,3(1):22-32
3温有奎.基于知识元的文本知识标引.情报学报,2006,25(3):282-288
4Regina Barzilay, Noemie Elhadad, and Kathleen R. McKeown. Sentence Ordering in Multidocument Summarization. In: Proceedings of the 1st Human Language Technology Conference. San Diego, California, 2001
5孙广范,宋金平,袁琦.机器翻译中规则和模板的协调方法研究.中文信息学报,2006(20):31-35
6张江.基于规则的分词方法.计算机与现代化,2005,(4):18-20
7郑泽之,张普,杨建国.基于语料库的字母词语自动提取研究.中文信息学报,2005,19(2):78-85 |
| 本刊中的类似文章 |
| 1.邓尚民,孙玉伟 .信息抽取系统的研究现状[J]. 现代图书情报技术, 2006,1(3): 55-58 |
| 2.王咏.防火墙技术与网络安全[J]. 现代图书情报技术, 1998,14(6): 28-31 |
| 3.许鑫,黄仲清.垂直搜索引擎应用中的若干策略探讨*——以12580餐饮垂直搜索为例[J]. 现代图书情报技术, 2009,3(2): 62-70 |
| 4.翟东升,余旸,李莉.网络信息抽取技术及其在TBT预警中的应用*[J]. 现代图书情报技术, 2005,21(9): 76-79 |
| 5.王昊.基于关联规则挖掘研究学科间相关性[J]. 现代图书情报技术, 2005,21(3): 23-28 |
| 6.黄俊贵.中国文献编目规则的路向[J]. 现代图书情报技术, 1995,11(4): 25-29 |
| 7.杭月芹,姚滢,沈洁 .基于单文档的上下文查询信息抽取*[J]. 现代图书情报技术, 2006,1(10): 30-33 |
| 8.张亮,陈肇雄,黄河燕,马玉芝.面向应用的汉语句法分析辅助系统的设计与实现*[J]. 现代图书情报技术, 2006,22(1): 47-50 |
| 9.陈祖琴,张惠玲,葛继科,郑宏.基于加权关联规则挖掘的相关文献推荐*[J]. 现代图书情报技术, 2007,2(10): 57-61 |
| 10.柳佳刚,陈山,贺令亚.基于本体和DOM相结合的Web信息抽取器[J]. 现代图书情报技术, 2009,25(5): 44-49 |
| 11.陆觉民,郑宇 .数据挖掘技术的改进在图书馆个性化服务中的应用[J]. 现代图书情报技术, 2006,1(8): 65-68 |
| 12.佘俊胜,黄战 .一种面向图书馆新书推荐服务的广义关联规则挖掘算法[J]. 现代图书情报技术, 2006,1(10): 16-20 |
| 13.王非 .网络学术文献信息门户[J]. 现代图书情报技术, 2006,1(9): 53-57 |
| 14.张晗,路振宇,崔雷 .利用关联规则对医学文本数据库进行知识抽取的尝试*——以四种抗肿瘤药为例[J]. 现代图书情报技术, 2006,1(9): 49-52 |
| 15.朱红灿,龙朝阳 .基于熵的新闻网页抽取方法的研究[J]. 现代图书情报技术, 2007,2(4): 48-51 |
| 16.吕学强,黄河,李渝勤,施水才 .BBS中文新词语自动挖掘*[J]. 现代图书情报技术, 2007,2(1): 37-39 |
| 17.谭金波 .基于本体实现网页规则分类的方法[J]. 现代图书情报技术, 2007,2(3): 39-42 |
| 18.藕军,任明仑 .搜索引擎返回结果自动抽取[J]. 现代图书情报技术, 2007,2(2): 49-52 |
| 19.谭金波,杨晓江,李艺.基于统计-规则方法的网页层次分类技术研究[J]. 现代图书情报技术, 2007,2(8): 59-62 |
| 20.廉站俊,吕学强,张玉杰,施水才.基于句子相似度计算的信息抽取*[J]. 现代图书情报技术, 2007,2(6): 38-41 |
| 21.黄名选,陈燕红,张师超.基于关联规则挖掘的查询扩展模型研究[J]. 现代图书情报技术, 2007,2(10): 47-51 |
| 22.黄永文,李广建.数字图书馆中的ETL应用研究综述[J]. 现代图书情报技术, 2007,2(12): 1-5 |
| 23.王昊,邓三鸿.HMM和CRFs在信息抽取应用中的比较研究[J]. 现代图书情报技术, 2007,2(12): 57-63 |
| 24.赵琦,刘建华,冯浩然.从ACE会议看信息抽取技术的发展趋势*[J]. 现代图书情报技术, 2008,24(3): 18-23 |
| 25.赵洪,肖洪,薛德军,师庆辉.Web表格信息抽取研究综述[J]. 现代图书情报技术, 2008,24(3): 24-31 |
| 26.申春艳,王惠临.基于规则的英语复句关联词自动标注技术*[J]. 现代图书情报技术, 2008,24(3): 40-44 |
| 27.张辉,徐朝军,王蔚.教育游戏资源智能搜索系统的设计与实现*[J]. 现代图书情报技术, 2008,24(6): 46-50 |
| 28.王强.基于事务标识列表的关联规则挖掘算法[J]. 现代图书情报技术, 2008,24(8): 63-69 |
| 29.徐健,张智雄,吴振新.实体关系抽取的技术方法综述*[J]. 现代图书情报技术, 2008,24(8): 18-23 |
| 30.陈祖琴,葛继科,郑宏.基于本体构建的协同推荐研究[J]. 现代图书情报技术, 2008,24(9): 53-57 |
| 31.吕聚旺,都云程,王弘蔚,施水才.基于新型主题信息量化方法的Web主题信息提取研究*[J]. 现代图书情报技术, 2008,24(12): 48-53 |
| 32.陈敬文,彭哲.基于CPN网络的Web正文抽取技术研究[J]. 现代图书情报技术, 2008,24(11): 65-71 |
| 33.高文利,高元先.学位论文参考文献的自动抽取及标注[J]. 现代图书情报技术, 2008,24(11): 72-75 |
| 34.许德山,乔晓东,朱礼军,姜彩虹,宫丽环.本体推理在知识检索中的应用*[J]. 现代图书情报技术, 2009,3(1): 58-63 |
| 35.高文利.基于本体的军备情报抽取系统的设计与实现*[J]. 现代图书情报技术, 2010,26(1): 83-87 |
| 36.王满,徐朝军.网络课程资源自动量化评价研究*[J]. 现代图书情报技术, 2010,26(1): 88-93 |
| 37.化柏林, 郭江.基于规则的高校实验室Web信息抽取的系统设计与实现*[J]. 现代图书情报技术, 2009,(10): 62-66 |
| 38.沈劲枝,寇文波,田晨耕.基于特征定位边界预测的Web档案正文采集*[J]. 现代图书情报技术, 2009,25(12): 52-56 |
| 39.施聪莺,徐朝军,杨晓江.基于规则和Rocchio分类器的学前综合教育资源分类*[J]. 现代图书情报技术, 2009,25(7-8): 75-79 |
| 40.葛登科,王亚民.基于GIS的空间关联规则挖掘方法研究[J]. 现代图书情报技术, 2009,25(7-8): 97-101 |
| 41.贾美英,杨炳儒,郑德权,曹鸿强,杨靖,张练.基于模式匹配的军事演习情报信息抽取*[J]. 现代图书情报技术, 2009,(9): 70-75 |
| 42.陈艳梅,张斌.HTML到XML转换技术的研究与实现[J]. 现代图书情报技术, 2003,19(5): 66-67 |
| 43.张智雄.信息抽取技术及其在数字图书馆中的应用前景分析[J]. 现代图书情报技术, 2004,20(6): 1-5 |
| 44.沈迪飞.金融证券系统的数据基础建设和巨灵公司的实践[J]. 现代图书情报技术, 2002,18(2): 79-82 |
| 45.张巍,于洋,游宏梁.面向词汇知识库自动构建的概念术语关系识别[J]. 现代图书情报技术, 2009,25(11): 10-16 |
| 46.肖珑,冯项云,沈芸芸.描述元数据结构及其扩展规则研究*[J]. 现代图书情报技术, 2004,20(9): 5-7 |
| 47.潘有能,邓三鸿.基于XML和关联规则的Web挖掘研究*[J]. 现代图书情报技术, 2004,20(7): 30-34 |
| 48.吴伟,刘友华.基于DOM的Web信息自动抽取[J]. 现代图书情报技术, 2004,20(2): 68-71 |
| 49.司徒浩臻.数据挖掘技术在图书馆信息服务中的应用[J]. 现代图书情报技术, 2005,21(10): 15-18 |
| 50.宋艳娟,张文德.基于XML的PDF文档信息抽取系统的研究*[J]. 现代图书情报技术, 2005,21(9): 10-13 |
|
| Copyright 2008 by 现代图书情报技术 |