首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
杨宁  唐常杰  王悦  陈瑜  郑皎凌  李红军 《软件学报》2011,22(8):1761-1770
把文本流中的热点区分为局部热点和全局热点,分析了二者的相关性,并将Kolmogorov复杂度应用于多文本流中的热点挖掘,首先,定义了基于Kolmogorov复杂度的冗余信息的概念,并论证了文本流存在局部热点的必要条件是冗余信息超过某个阈值;其次,基于条件Kolmogorov复杂度提出了一个相似性度量指标——流信息距离(...  相似文献   

2.
Web文本挖掘系统及聚类分析算法   总被引:2,自引:0,他引:2  
朱克斌  唐菁  杨炳儒 《计算机工程》2004,30(13):138-139,183
给出了Web文本挖掘系统WTMS的系统总体结构图,开发并实现了基于SOM的Web文档层次聚类算法。同时结合现代远程教育背景实现了Web文本挖掘的原型系统。该系统可以对各类远程教育站点上收集的文本资料信息自动进行聚类挖掘,从而帮助人们快速进行文本信息导航,获取重要的知识。  相似文献   

3.
随着Internet的深入发展及普及应用,网络中可获取的大部分文本信息由来自各种数据源的文档组成.由于电子形式的文本信息飞速增涨,可以获知的文本信息已成海量之势,文本挖掘已经成为信息领域的研究热点,快速得到目标文本成为互联网发展的瓶颈.在动态聚类方法和基于特征属性分类法的基础上提出基于混合模糊聚类理论的文本数据分类系统新模型,在模型基础上探究了一种模糊聚类仿真算法,通过实验验证算法能有效提高文本分类效率及文本分类准确率,从而在实际网络文本挖掘应用中快速得到目标文本,实现因特网文本智能挖掘.  相似文献   

4.
Web文本挖掘系统及其分类算法的研究与实现   总被引:9,自引:0,他引:9  
介绍了Web文本挖掘系统WTMS的系统总体结构图,实现了其核心算法——基于距离测度函数的分类算法。同时结合现代远程教育背景实现了Web文本挖掘的原型系统。该系统可以对各类远程教育站点上收集的文本资料信息自动进行分类挖掘,从而帮助人们快速进行文本信息导航,获取重要的知识。  相似文献   

5.
为深层挖掘电力数据文本蕴藏的信息,本文基于自然语言处理技术分析了电力文本挖掘与分类流程,通过分词技术分析文本内容,提取文本特征,并构建分类器模型以自动分类文本,最后以实例分析了电力文本挖掘与分类的实际效果.结果表明,中文电力数据文本挖掘准确度较高,适用范围广泛,方式方法灵活,可及时准确挖掘隐藏的关键信息,为分析客户用电诉求与投诉要求提供了完善的数据依据;以文本自动分类分析,构建的分类器模型查准率与准确率相对较高,且调优之后分类器模型可更加准确地识别出热点事件投诉工单.  相似文献   

6.
文本挖掘是一个从非结构化文本信息中获取用户关心或感兴趣模式的过程。对文本挖掘进行深入的研究将大大提高从海量的文本数据中获取有用知识的效率。本文首先介绍了文本数据挖掘的研究概况,之后着力对当前基于Web文本挖掘的一般处理过程进行了详细的描述,同时总结了文本分类和文本聚类的一些主要算法,在文章的最后对文本挖掘在信息技术中的发展前景做了合理的预测和展望。  相似文献   

7.
研究了科研期刊文献文本数据的特点,将文本挖掘技术用于对科研期刊文本数据的分析和处理中,提出了基于文本挖掘技术的科研信息自动建议系统。结合国内信息领域较有影响的3种期刊2007全年的期刊文章,进行了实例仿真。  相似文献   

8.
面向Web的文本信息挖掘研究   总被引:2,自引:0,他引:2       下载免费PDF全文
万维网是一个巨大的、分布广泛的、全球性的信息服务中心,它包含了丰富的信息资源。Web挖掘可以快速有效地获取所需要的信息。基于Web的文本挖掘是数据挖掘的重要组成部分,探讨了Web文本特征提取、文本分类、文本聚类等Web文本挖掘关键实现技术,最后讨论了Web文本挖掘的价值及其对Web发展的重要性。  相似文献   

9.
许高建 《微机发展》2007,17(6):187-190
Internet上大多数信息的表现形式为文本,如何在浩瀚的文本信息中挖掘到潜在的知识是一个有待解决的问题。文本挖掘的目的是从不同格式的文本中发现有用的知识,这是一个分析文本并从中抽取特定信息的过程。系统地介绍了文本挖掘的含义,并对文本挖掘过程的各个方面进行了进一步的探讨,包括文本特征的建立、特征的提取技术、文本的分类、文本的聚类等相关技术。同时提出了一种基于Web的文本信息挖掘的模型,将以高校BBS论坛为信息源,利用高级语言开发技术来构建一个自动的文本分类器。  相似文献   

10.
基于Web的文本挖掘技术研究   总被引:2,自引:0,他引:2  
Internet上大多数信息的表现形式为文本,如何在浩瀚的文本信息中挖掘到潜在的知识是一个有待解决的问题。文本挖掘的目的是从不同格式的文本中发现有用的知识,这是一个分析文本并从中抽取特定信息的过程。系统地介绍了文本挖掘的含义,并对文本挖掘过程的各个方面进行了进一步的探讨,包括文本特征的建立、特征的提取技术、文本的分类、文本的聚类等相关技术。同时提出了一种基于Web的文本信息挖掘的模型,将以高校BBS论坛为信息源,利用高级语言开发技术来构建一个自动的文本分类器。  相似文献   

11.
源于信息挖掘的新型智能化决策支持系统   总被引:2,自引:0,他引:2  
阐述了以结构化数据和复杂类型数据挖掘为主要内容的信息挖掘技术。采用7库(模型库、综合知识库、数据库、方法库、文本库、日志库、多媒体库)与双网(Internet、Intranet)相结合的体系结构,以信息挖掘技术为核心,提出源于信息挖掘的新型智能化决策支持系统(IDSSIM)。旨在解决决策支持系统对半结构化数据、非结构化数据的挖掘处理能力,使之适应目前信息源的多样型和动态变化性的特点,提供更加丰富的决策信息。  相似文献   

12.
本文的研究工作主要围绕在医院信息系统(HIS)中使用数据挖掘技术展开。将数据挖掘理论应用于实际的医院信息系统(HIS)系统中,实现医院信息系统(HIS)系统与数据挖掘技术的结合。本文对数据挖掘的概念及国内外应用现状,以及数据挖掘在医院信息系统中的应用和展望进行了阐述。  相似文献   

13.
一种元规则指导的股票联动关联规则挖掘算法   总被引:1,自引:0,他引:1  
在经典Apriori算法的基础上,提出了一种考虑了时间因素的股票联动关联规则挖掘算法。该算法首先对股票原始数据采用滑动时间窗口技术进行了预处理,得到了适合挖掘的事务集;然后使用SQL语言详细描述了关联规则的生成过程。根据证券行业的实际情况,采用了元规则指导的挖掘方法,从而使挖掘结果聚焦于投资者感兴趣的规则形式上,并且也提高了挖掘过程的效率。  相似文献   

14.
基于信息过滤后的Web内容挖掘   总被引:4,自引:0,他引:4  
Internet的迅速发展,使得worldwideweb已经成为一个巨大的、蕴含着具有潜在价值知识的分布式信息空间,为Web挖掘研究提供了丰富的资源的同时也提出了新的挑战。该文首先论述了Web内容挖掘技术的挖掘原理和所面对的困难,然后介绍了信息过滤技术的规则以及过程。最后提出了基于信息过滤的Web内容挖掘的系统方案,较好地解决了当前Web内容挖掘中准确度不高、冗余性大的缺陷。  相似文献   

15.
根据当前信息领域内普遍存在的"知识发现"问题的迫切需要,文章以SPSS Clementine环境提供的功能为基础,研究了构架医院信息系统中的在线数据挖掘平台的方法,并通过实际构建该系统,对基于医院信息系统现状实现在线数据挖掘进行了有益的尝试。  相似文献   

16.
随着医疗检验手段的飞速发展,检验信息系统(LIS)由此被开发和运用。为了能在该系统中充分利用医学数据和医生诊断经验,发现隐藏在这些数据背后的新的有学术价值的医学信息,介绍了关联规则挖掘方法在当前检验信息系统中的应用模式。其中详细说明了数据挖掘步骤和在对检验数据进行挖掘时关联规则挖掘算法的选用。  相似文献   

17.
数据挖掘在医学信息系统中的应用   总被引:2,自引:0,他引:2  
在介绍了数据挖掘技术的定义、功能和方法的基础上,结合医学数据的特点,归纳总结了数据挖掘技术在医学信息系统中的应用,为建设智能化信息系统提供了思路。  相似文献   

18.
秦国锋  李启炎 《计算机工程》2003,29(15):37-39,97
对CIMS工程的现状进行了分析,明确了形成CIMS系统信息孤岛的原因,提出一种基于数据挖掘技术进行CIMS系统信息集成的方法,以原有的数据库为基础,利用网络技术和数据挖掘技术,建立数据挖掘系统,通过数据挖掘的下钻处理、上卷递交与数据信息的析取和融合,建立了相关的模糊理论模型和实现的算法,较好地解决了CIMS系统的资金流、物流与信息流的集成问题。  相似文献   

19.
在动脉矿业基础上发展静脉矿业,形成配套完整的良性循环体系,需要利用先进的地理信息系统(GIS)技术对动静脉矿业进行一体化管理。针对传统软件开发模式设计矿业管理信息系统普遍存在的一些问题,本文提出采用面向服务架构(SOA)的数据中心集成开发技术设计动静脉矿业信息系统的新构想,在分析了数据中心集成开发技术和搭建式、配置式、插件式三种开发模式的基础上,形成了以原型法设计系统,以数据中心集成开发技术进行动静脉矿业信息系统开发的思想,并在此思想指导下,设计了动静脉矿业信息系统的悬浮倒挂式体系架构和数据管理、三维显示、空间分析、决策支持等松散耦合的功能模块。  相似文献   

20.
网络通信技术、多媒体处理技术、数据分布处理和管理技术的成熟和发展为人才市场信息化建设提供技术支持,同时人才市场面临的新形势、新发展、新需求也急需行业走信息化道路奔向产业化。该文对人才市场服务种类展开比较和归纳,分析其信息化技术需求,借助现有多媒体网络和信息管理处理技术对人才市场服务信息化建设进行可行性研究,详细描述了新一代人才市场多媒体信息服务系统的设计框架及其关键技术的实现,研究成果对该行业的信息化建设有重大意义。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号