首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到13条相似文献,搜索用时 46 毫秒
1.
文本知识发现:基于信息抽取的文本挖掘   总被引:11,自引:0,他引:11  
1.引言大家熟知,所谓“数据丰富但知识缺乏“的现状导致了数据挖掘(Data Mining)技术研究的兴起,数据挖掘又称数据库知识发现(Knowledge Discovery in Databases)是从海量的结构化信息中抽取或挖掘隐含信息和知识的重要方法和途径。数据挖掘技术已相当成熟。因为除了结构化的数据之外,在数字化信息中更多地存在大量自由、非结构化或半结构化的文本信息如新闻文章、电子书本、电子图书馆藏、Web页面内容、Email、文档数据库等,显然手工处理需要花费大量的人力物力,并且具有不确定性。所以出现了从文本中发现知  相似文献   

2.
Web文本主题挖掘技术研究   总被引:2,自引:0,他引:2  
目前,如何快速、准确、全面、及时地检索到自己感兴趣的信息已成为人们关注的焦点。本文针对目前搜索引擎精度不高的问题,讨论了Web文本主题挖掘涉及到的相关核心技术,重点讨论自动分词技术和Web文本的特征表示。  相似文献   

3.
生物医学文本挖掘技术的研究与进展   总被引:1,自引:0,他引:1  
生物医学研究是二十一世纪最受关注的研究领域之一,该领域发表了巨量的研究论文,已经达到年平均60万篇以上。如何在规模巨大的研究文献中有效地获取相关知识,是该领域研究者所面临的挑战。作为生物信息学分支之一的生物医学文本挖掘技术就是一项高效自动地获取相关知识的新探索,近年来取得了较大进展。这篇综述介绍了生物医学文本挖掘的主要研究方法和成果,即基于机器学习方法的生物医学命名实体识别、缩写词和同义词的识别、命名实体关系抽取,以及相关资源建设、相关评测会议和学术会议等。此外还简要介绍了国内研究现状,最后对该领域近期发展作了展望。  相似文献   

4.
文本挖掘技术研究及其在信息检索中的应用   总被引:1,自引:0,他引:1  
文本挖掘是一个对具有丰富语义的文本进行分析从而理解其所包含的内容和意义的过程,已经成为数据挖掘中一个日益流行而重要的研究领域。给出了文本挖掘的定义和框架,对文本挖掘中预处理、文本摘要、文本分类、聚类、关联分析及可视化技术进行了详尽的分析,并归纳了最新的研究进展,指出了文本挖掘在信息检索中的作用。  相似文献   

5.
文章详细研究了Web文本挖掘的定义及类型,重点分析了Web文本挖掘算法,总结了文本挖掘的应用,提出了今后工作的重点。  相似文献   

6.
7.
利用关联规则挖掘文本主题词的方法   总被引:3,自引:1,他引:2       下载免费PDF全文
主题词抽取是目前信息检索领域研究的热点,与一系列数据挖掘相关的任务密切相关。该文提出一种新的利用关联规则挖掘中文文本主题词的方法,该方法抽取的主题词包括关键词和相关检索词两部分。在关键词抽取的基础上,采用数据挖掘中的关联规则挖掘算法抽取相关检索词,用于扩展检索或相关检索,提高了用户对于文档的理解。实验表明该方法取得了较好的效果。  相似文献   

8.
文本挖掘是从非结构化的文本中发现潜在的概念以及概念间的相互关系。作为从浩瀚的Web信息资源中发现潜在的、有价值知识的有效技术,Web文本挖掘已倍受关注。文中提出了利用概念格来抽取隐含在文本中潜在的概念关系,将文本挖掘中文档与关键词之间的关系通过概念格结构呈现出来。  相似文献   

9.
针对贸易文本区别于普通文本的不同特性,提出了基于贸易政策文本的主题挖掘模型,对世界贸易组织的贸易政策审议报告进行研究,归纳出文本的主要内容和主题变化趋势,为商务部和中国驻世贸组织使团提供有价值的信息辅助,从而使得快速有效的处理大量的文本成为可能。通过大量的实验,表明了主题挖掘模型的有效性。  相似文献   

10.
王娜  李云松 《微机发展》2006,16(1):114-116
文本挖掘是从非结构化的文本中发现潜在的概念以及概念间的相互关系。作为从浩瀚的Web信息资源中发现潜在的、有价值知识的有效技术,Web文本挖掘已倍受关注。文中提出了利用概念格来抽取隐含在文本中潜在的概念关系,将文本挖掘中文档与关键词之间的关系通过概念格结构呈现出来。  相似文献   

11.
利用文本挖掘实现Web智能服务   总被引:5,自引:0,他引:5  
目前网络服务个人化成为人们关注的焦点,虽然各大型网站已推出个人化主页服务,但是仍存在需要改进的问题,首先是个人化网页的自动维护,其次是用户的需求信息存在不完全性。本文通过一个具体应用-实现了Web智能服务的技术文档检索系统,提出将文本挖掘与情报检索技术相结合解决上述问题,该系统能够根据用户兴趣自动生成及维护个人化网页。  相似文献   

12.
基于文本挖掘的可视化竞争情报提取   总被引:6,自引:0,他引:6  
竞争情报的提取需要更自动而高效的工具。本文根据竞争情报的特点,并借助于迅速发展的文本挖掘和信息可视化思想和技术,提出了基于文本挖掘的可视化竞争情报提取系统,并对其中所涉及到的文档收集、文档预处理、文本挖掘和信息可视化等关键技术进行了较为详细的讨论。  相似文献   

13.
为了提高电力系统对运维服务项目的计划申报和管理效率,设计并实现基于文本挖掘技术的电力系统运维服务项目的智能辅助管理系统.构建一个适用于电力系统运维项目计划的智能管理框架,在该框架下基于智能分词和文本特征表示设计一种层级融合分类方法,有效提高申报项目分类准确率,稽查分类错误.该辅助系统有效解决了电力运维服务项目的分类错误...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号