|
|
现代图书情报技术 2006, 1(9) 34-37 DOI:
ISSN: 1003-3513 CN: 11-2856/G2 |
|
|
|
|
本期目录 |
下期目录 |
过刊浏览 |
高级检索
[打印本页]
[关闭]
|
|
| 论文 |
|
|
一种基于本体论和潜在语义索引的文本语义处理方法* |
|
|
秦春秀 刘怀亮 赵捧未 |
|
|
(西安电子科技大学经济管理学院 西安 710071) |
|
|
摘要:
提出一种基于潜在语义索引和本体论的文本语义处理方法。首先构建一个基于本体论的虚拟标准文本特征向量,然后采用潜在语义索引方法以虚拟标准文本特征向量为参照对文本集进行语义聚类,最后在虚拟标准文本特征向量的导引下利用本体库中的知识对聚类获得的文本集合的类别和语义进行显性标注。实验表明,该方法能较好地在语义层面对文本进行有效的聚类,而且聚类结果能显性地显示类聚所属的类别。 |
|
|
关键词:
潜在语义索引
本体论
文本聚类
语义
标注
|
|
|
A Text Semantic Information Processing Method Based on Ontology and Latent Semantic Indexing |
|
|
Qin Chunxiu Liu Huailiang Zhao Pengwei
|
|
|
(School of Economics and Management, Xidian University, Xi’an 710071,China)
|
|
|
Abstract:
This paper presents a method for text semantic information processing based on Ontology and latent semantic indexing. Firstly, virtual standard text characteristic vectors are constructed; then, the texts are semantically classified into document sets according to virtual standard text characteristic vectors by using latent semantic indexing method; finally, semantically explicit annotations to the document sets are abtained from Ontology-base by guidance of virtual standard text characteristic vectors. Experiments show that method can achieve good text clustering of semantic level, and the clustering can explicitly indicate categories of the clustered documents. |
|
|
Keywords:
Latent semantic indexing
Ontology
Clustering
Semantics
Annotation
|
|
|
收稿日期 2006-06-20 修回日期 2006-07-06 网络版发布日期 2006-09-25 |
|
|
分类号: G354.2 |
|
|
基金项目:
*本文系国家自然科学基金项目“基于语义网的多媒体知识元发现与挖掘”(项目编号:70503022)的研究成果之一。 |
|
|
通讯作者: 秦春秀 通讯作者E_mail: qinchx@126.com |
|
|
|
|
|
| 参考文献: |
1张晓林.Semantic Web与基于语义的网络信息检索.情报学报,2002,21(4):413-420
2Berry M W, Dumais S T, O. brien G W. Using linear algebra for intelligent information retrieval, SIAM Review, 1995, 37(4):573-595
3Deerwester S, Dumais S T, Furnas G W et al.Indexing by Latent Semantic Analysis, Journal of the American Society for Information Science, 1990, 41(6):391-407
4Neches R, Fikes R E, Gruber T R, et al. Enabling Technology for Knowledge Sharing.AI Magazine, 1991, 12(3):36-56
5W. N. Borst. Construction of Engineering Ontologies for Knowledge Sharing and Reuse. PhD thesis, University of Twente, Enschede, 1997
6林鸿飞,姚天顺.基于潜在语义索引的文本浏览机制.中文信息学报, 2000, 14(5):49-56
7杨梁彬.文本检索的潜在语义索引法初探.大学图书馆学报,2003(6):68-74,84 |
| 本刊中的类似文章 |
| 1.于娟,王贱珍,马金平,李永 .基于学科体系的OWL知识表示[J]. 现代图书情报技术, 2006,1(5): 18-21 |
| 2.吴笑凡,丁秋林,张磊,周良.主题地图约束的合法性验证*[J]. 现代图书情报技术, 2006,1(3): 36-41 |
| 3.贾君枝,刘焘,李景峰 .基于Web保险信息的语义分析初探[J]. 现代图书情报技术, 2006,1(3): 42-46 |
| 4.于娟,王贱珍,马金平,李永.基于课程体系的OWL知识表示方法研究[J]. 现代图书情报技术, 2006,1(3): 51-54 |
| 5.陈谷川,陈豫 .语义网知识组织系统的研究与构架[J]. 现代图书情报技术, 2006,1(4): 24-28 |
| 6.毛军.元数据、自由分类法(Folksonomy)和大众的因特[J]. 现代图书情报技术, 2006,1(2): 1-4 |
| 7.王子熙,马蕾 .《汉语主题词表》词间关系的可视化[J]. 现代图书情报技术, 2006,1(3): 86-88 |
| 8.张秀秀,马建霞.PDF科技论文语义元数据的自动抽取研究*[J]. 现代图书情报技术, 2009,3(2): 102-106 |
| 9.王伟,许鑫.基于聚类的网络舆情热点发现及分析*[J]. 现代图书情报技术, 2009,3(3): 74-79 |
| 10.阴晋岭,王惠临.词性标注的方法研究*——结合条件随机场和基于转换学习的方法进行词性标注[J]. 现代图书情报技术, 2009,3(3): 46-51 |
| 11.Ed Summers,Antoine Isaac,Clay Redding,Dan Krech.LCSH,SKOS 和关联数据[J]. 现代图书情报技术, 2009,3(3): 8-14 |
| 12.Carol Jean Godby,Devon Smith,Eric Childress.基于一种映射计算模型的应用纲要编码方式[J]. 现代图书情报技术, 2009,3(3): 15-22 |
| 13.Miao Chen,Xiaozhong Liu,Jian Qin .从社会性标签中进行语义关系抽取——一种元数据生成方法[J]. 现代图书情报技术, 2009,3(3): 38-45 |
| 14.Hak Lae Kim, Simon Scerri, John G.Breslin, Stefan Decker, Hong Gee Kim.最新标签本体:标签和民俗分类法语义模型[J]. 现代图书情报技术, 2009,3(3): 30-37 |
| 15.王欣,张晓林.应用OWL-S实现 Web服务的语义描述[J]. 现代图书情报技术, 2005,21(2): 15-19 |
| 16.聂卉,龙朝晖 .描述逻辑语义推理机制的应用研究[J]. 现代图书情报技术, 2006,1(11): 61-64 |
| 17.薛建武,陈尧清,崔璇.基于Ajax的异步语义检索实验模型研究[J]. 现代图书情报技术, 2009,25(5): 6-10 |
| 18.王曰芬,宋爽,苗露 .共现分析在知识服务中的应用研究[J]. 现代图书情报技术, 2006,1(4): 29-34 |
| 19.章成志,王惠临.多语言文本聚类研究综述*[J]. 现代图书情报技术, 2009,25(6): 31-36 |
| 20.Alistair Miles,Brian Matthews,Michael Wilson,Dan Brickley.SKOS Core: 简约知识组织网络表述语言[J]. 现代图书情报技术, 2006,22(1): 3-9 |
| 21.Martin Malmsten.将图书馆目录纳入语义万维网[J]. 现代图书情报技术, 2009,3(3): 3-7 |
| 22.吴鹏飞,孟祥增,马凤娟,鹿文鹏.Web多媒体相关文本提取研究[J]. 现代图书情报技术, 2007,2(9): 62-65 |
| 23.赖茂生,屈鹏.搜索引擎查询日志的词性标注和挖掘研究[J]. 现代图书情报技术, 2009,25(4): 50-56 |
| 24.刘建华,张智雄.基于Stanford Parser的实体间关系识别[J]. 现代图书情报技术, 2009,25(5): 1-5 |
| 25.刘焘,贾君枝 .中文信息处理中的语义关系表示探析[J]. 现代图书情报技术, 2006,1(10): 25-29 |
| 26.司徒俊峰 .一种基于本体的XML文档语义提取方法[J]. 现代图书情报技术, 2006,1(11): 55-60 |
| 27.武兴龙,刘新旺 .二元语义信息检索模型*[J]. 现代图书情报技术, 2006,1(6): 43-46 |
| 28.黄崑,赖茂生 .感性工学及其在图像检索中的应用[J]. 现代图书情报技术, 2006,1(5): 31-35 |
| 29.张晓孪,王西锋 .FCA中的概念语义相似度计算[J]. 现代图书情报技术, 2007,2(3): 51-54 |
| 30.张会平,吕学强,施水才,李渝勤 .基于WordNet的语义分布词典建设*[J]. 现代图书情报技术, 2007,2(3): 55-59 |
| 31.丁晟春,成晓 .基于用户提问的领域本体知识库的知识检索*[J]. 现代图书情报技术, 2007,2(1): 62-64 |
| 32.徐德智,郭臻 .基于本体的Web用户行为语义分析[J]. 现代图书情报技术, 2007,2(1): 65-68 |
| 33.刘佳佳,董茗,方曙 .国外专利分析工具的比较研究[J]. 现代图书情报技术, 2007,2(2): 67-74 |
| 34.张晗,路振宇,崔雷 .利用关联规则对医学文本数据库进行知识抽取的尝试*——以四种抗肿瘤药为例[J]. 现代图书情报技术, 2006,1(9): 49-52 |
| 35.刘松 .网络环境中个性化推荐系统研究*[J]. 现代图书情报技术, 2007,2(4): 35-38 |
| 36.韩亚洪,刘永革 .基于本体的Web服务合成研究*[J]. 现代图书情报技术, 2007,2(5): 36-40 |
| 37.李亚子.数据起源标注模式与描述模型[J]. 现代图书情报技术, 2007,2(7): 10-13 |
| 38.罗晨光,山川,王珊 .基于本体的古籍知识库建设初探[J]. 现代图书情报技术, 2007,2(4): 8-11 |
| 39.马静,谢娟娜,侯俊杰.基于OWL的国防工业机构与产品领域本体构建*[J]. 现代图书情报技术, 2007,2(7): 14-17 |
| 40.张志娟,刘新旺.基于多粒度二元语义的SGML文件信息检索模型*[J]. 现代图书情报技术, 2007,2(7): 27-31 |
| 41.徐德智,汪智勇,王斌 .当前主要本体推理工具的比较分析与研究*[J]. 现代图书情报技术, 2006,1(12): 12-15 |
| 42.章成志,苏新宁 .基于知识空间的智能信息检索模型研究[J]. 现代图书情报技术, 2006,1(12): 29-33 |
| 43.何琳,曹玲 .农业古籍本体的构建及其检索机制研究*[J]. 现代图书情报技术, 2006,1(12): 37-39 |
| 44.花舒宇,吴静,王娟娟.互补结构网络智能代理机制研究*[J]. 现代图书情报技术, 2007,2(7): 68-71 |
| 45.沈磊 .基于本体的论文检索系统的设计与实现[J]. 现代图书情报技术, 2007,2(2): 24-27 |
| 46.焦玉英,成全.基于本体的知识网格集成服务研究*[J]. 现代图书情报技术, 2007,2(8): 6-11 |
| 47.全立新.基于不动点语义的Web服务发现[J]. 现代图书情报技术, 2007,2(6): 29-32 |
| 48.高巾,姜赢,郭立帆.语义Web服务异构性解决方法——WSMO中介器深入探讨[J]. 现代图书情报技术, 2007,2(6): 47-51 |
| 49.孙海霞,成颖.潜在语义标引(LSI)研究综述*[J]. 现代图书情报技术, 2007,2(9): 49-53 |
| 50.王南,赵捧未,窦永香,秦春秀,赵飞.图像语义检索中的反馈噪声及其抑制算法研究[J]. 现代图书情报技术, 2007,2(10): 42-46 |
| 51.李媛媛,马永强.基于潜在语义索引的特征选择与权重改进若干关键问题的研究与实现[J]. 现代图书情报技术, 2007,2(10): 80-84 |
| 52.窦永香,赵捧未,秦春秀.基于本体的对等网语义检索系统[J]. 现代图书情报技术, 2007,2(12): 25-29 |
| 53.刘丹,包平.国外主题图研究综述[J]. 现代图书情报技术, 2007,2(12): 39-44 |
| 54.卢胜军,真溱.本体匹配基本理论框架研究[J]. 现代图书情报技术, 2007,2(11): 28-32 |
| 55.彭薇.一种改进的语义Web服务匹配算法*[J]. 现代图书情报技术, 2007,2(10): 76-79 |
| 56.王昊,邓三鸿.HMM和CRFs在信息抽取应用中的比较研究[J]. 现代图书情报技术, 2007,2(12): 57-63 |
| 57.申春艳,王惠临.基于规则的英语复句关联词自动标注技术*[J]. 现代图书情报技术, 2008,24(3): 40-44 |
| 58.田光明,刘艳玲.FrameNet框架之间的关系分析*[J]. 现代图书情报技术, 2008,24(6): 1-5 |
| 59.贾君枝,董刚.汉语框架网络本体与VerbNet、WordNet集成研究*[J]. 现代图书情报技术, 2008,24(6): 6-10 |
| 60.贾君枝,邰杨芳.汉语框架网络问答系统的问句分析设计与实现*[J]. 现代图书情报技术, 2008,24(6): 11-15 |
| 61.周鑫,王军.基于概念外延的Folksonomy语义关系挖掘方法[J]. 现代图书情报技术, 2008,24(10): 6-10 |
| 62.孙丰满.电子文件管理元数据值语义结构化分析*[J]. 现代图书情报技术, 2008,24(10): 16-21 |
| 63.石晶,戴国忠.基于知网的词汇集聚分析[J]. 现代图书情报技术, 2008,24(9): 41-46 |
| 64.陆国丽,王小华,王荣波.最大词重降维算法与模拟退火算法相结合的文本聚类方法研究[J]. 现代图书情报技术, 2008,24(12): 43-47 |
| 65.吕聚旺,都云程,王弘蔚,施水才.基于新型主题信息量化方法的Web主题信息提取研究*[J]. 现代图书情报技术, 2008,24(12): 48-53 |
| 66.高文利,高元先.学位论文参考文献的自动抽取及标注[J]. 现代图书情报技术, 2008,24(11): 72-75 |
| 67.苏明明,宋文.基于本体的语义搜索引擎解决方案研究新进展[J]. 现代图书情报技术, 2008,24(11): 24-28 |
| 68.许德山,乔晓东,朱礼军,姜彩虹,宫丽环.本体推理在知识检索中的应用*[J]. 现代图书情报技术, 2009,3(1): 58-63 |
| 69.王昊,刘建华,苏新宁,杨建林.面向语义网的本体学习技术和系统研究*[J]. 现代图书情报技术, 2009,3(1): 64-72 |
| 70.章成志.文本聚类结果描述研究综述*[J]. 现代图书情报技术, 2009,3(2): 1-8 |
| 71.窦玉萌,赵丹群.协作标注系统研究综述[J]. 现代图书情报技术, 2009,3(2): 9-17 |
| 72.陈欣,李晓菲.基于领域本体的专业文献信息检索研究[J]. 现代图书情报技术, 2009,25(7-8): 59-64 |
| 73.黄炜,张李义.基于语义爬虫的商品信息主题采集研究*[J]. 现代图书情报技术, 2010,26(1): 3-8 |
| 74.曾子明,张李义.一种基于语义相似度和多属性决策方法的商品信息智能检索模型*[J]. 现代图书情报技术, 2010,26(1): 22-27 |
| 75.李峰.语义Mashup技术研究*[J]. 现代图书情报技术, 2010,26(1): 46-50 |
| 76.孙海霞,钱庆,成颖.基于本体的语义相似度计算方法研究综述*[J]. 现代图书情报技术, 2010,26(1): 51-56 |
| 77.王欣 .Web服务语义描述方法进展评述[J]. 现代图书情报技术, 2010,26(1): 66-70 |
| 78.金燕,艾丹祥 .基于情景的Web动态导航研究*[J]. 现代图书情报技术, 2007,2(5): 49-52 |
| 79.徐德智,王庆涛,王斌 .基于本体的Web信息采集*[J]. 现代图书情报技术, 2007,2(2): 53-55 |
| 80.黄亚明,李国胜 .面向Web文本语义挖掘的SKR/MetaMap输出概念共现分析系统的开发尝试[J]. 现代图书情报技术, 2007,2(1): 72-76 |
| 81.姜华.基于本体的语义检索技术研究与实现[J]. 现代图书情报技术, 2008,24(4): 39-43 |
| 82.白海燕,朱礼军.关联数据的自动关联构建研究*[J]. 现代图书情报技术, 2010,26(2): 44-49 |
| 83.窦永香,苏山佳,杨美姣,陈丽霞.基于大众标注的P2P语义检索系统模型研究*[J]. 现代图书情报技术, 2010,26(2): 50-55 |
| 84.王兰成,曾琼,陈雪强,王京 .本体论方法在文献型信息检索系统中的应用研究[J]. 现代图书情报技术, 2007,2(1): 15-19 |
| 85.常春.Ontology在信息管理领域的研究背景[J]. 现代图书情报技术, 2003,19(6): 4-7 |
| 86.陈文彬.Ontology在图书服务网络中的应用[J]. 现代图书情报技术, 2003,19(6): 8-12 |
| 87.陈兵,邰晓英.基于本体和文档重构的语义检索方法*[J]. 现代图书情报技术, 2009,25(12): 42-46 |
| 88.陈金星,祝忠明.责任者名称规范控制研究及进展*[J]. 现代图书情报技术, 2009,25(12): 12-17 |
| 89.石晶,张丽娟.利用知网扩展内部-外部算法[J]. 现代图书情报技术, 2009,25(7-8): 54-58 |
| 90.饶洋辉,叶良,程洁.WordNet在文本聚类中的应用研究*[J]. 现代图书情报技术, 2009,(10): 67-70 |
| 91.窦永香,苏山佳,赵捧未.基于Porter算法的英文标签聚类方法研究*[J]. 现代图书情报技术, 2009,(9): 40-44 |
| 92.陶跃华,孙茂松.基于潜语义标引的自然语言检索[J]. 现代图书情报技术, 2001,17(5): 40-41 |
| 93.陈越,郭力.隐含语义检索及其应用[J]. 现代图书情报技术, 2001,17(6): 27-29 |
| 94.常春.Google应用技巧[J]. 现代图书情报技术, 2004,20(6): 53-55 |
| 95.王霞俊,江士方.基于结构语义的Web页面中超链接的分类[J]. 现代图书情报技术, 2004,20(6): 16-19 |
| 96.王连军 .Web文本挖掘浅析[J]. 现代图书情报技术, 2002,18(6): 38-40 |
| 97.孔桃,赖茂生.基于语义联想的中文图像搜索引擎——构想与实验*[J]. 现代图书情报技术, 2002,18(3): 63-65 |
| 98.王知津,周海英.语义学理论与信息检索[J]. 现代图书情报技术, 2003,19(2): 1-5 |
| 99.熊回香.基于内容的图像检索技术的发展方向[J]. 现代图书情报技术, 2004,20(12): 32-35 |
| 100.常春.大型Ontology构建工具KAON的使用和评价[J]. 现代图书情报技术, 2004,20(8): 14-17 |
| 101.孟祥增,钟义信.基于语义的WWW图像检索*[J]. 现代图书情报技术, 2004,20(3): 35-37 |
| 102.秦健.实用分类系统与语义网:发展现状和研究课题[J]. 现代图书情报技术, 2004,20(1): 16-23 |
| 103.甘利人,李岳蒙.主题法、分类法与Ontology的比较研究[J]. 现代图书情报技术, 2005,21(12): 1-6 |
| 104.黄永文.基于数据库联邦方式的多数据源集成检索系统[J]. 现代图书情报技术, 2005,21(11): 57-60 |
| 105.柴晓娟.《大清邮政舆图》的数字化研究与实现*[J]. 现代图书情报技术, 2005,21(10): 51-55 |
| 106.丁晟春,顾德访.Jena在实现基于Ontology的语义检索中的应用研究*[J]. 现代图书情报技术, 2005,21(10): 5-9 |
| 107.王知津,郑红军.基于代数理论的信息检索模型及其推广[J]. 现代图书情报技术, 2005,21(7): 30-33 |
| 108.赵林静,庄夏.基于语义的馆藏信息检索模型研究[J]. 现代图书情报技术, 2005,21(7): 15-17 |
| 109.秦春秀,赵捧未,窦永香.基于Ontology的个性化检索[J]. 现代图书情报技术, 2005,21(4): 45-47 |
| 110.金燕,李敏,张玉峰.基于Ontology的语义导航研究*[J]. 现代图书情报技术, 2005,21(5): 37-40 |
|
| Copyright 2008 by 现代图书情报技术 |