首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 485 毫秒
1.
摘要:数据网格是在计算网格的基础上发展起来的网格技术,具有资源共享、协同工作、虚拟组织以及对分布式数据库群进行处理和分析的特点,在知识发现领域具有重要的研究价值。因此,本文提出了一种基于数据网格进行知识关联规则挖掘的方法。该方法采用数据网格树对动态数据网格进行全局控制和管理,采用挖掘作业命令的形式触发域挖掘作业,采用素数存储的方法进行了关联规则挖掘。通过仿真实验表明该挖掘方法在数据库群和数据网格关联规则挖掘方面具有优势。  相似文献   

2.
鉴于现行数据隐私问题日益严重,如何防止数据挖掘过程中隐私信息的泄漏,将是一个重要的研究议题。该文主要针对关联规则挖掘技术,从安全多方计算方面探讨隐私信息的保护,提出适用于挖掘水平分割数据的保护机制。方法设计采用集中式挖掘,过程中加入信息安全技术以确保参与单位的数据隐私,以求在隐私保护和知识获取间取得一个平衡。  相似文献   

3.
Apriori算法在红外光谱数据挖掘中的应用   总被引:1,自引:0,他引:1  
简要地介绍了在大规模数据库中挖掘关联规则的Apriori算法 ,给出了红外光谱数据库知识发现的空间表示方法 ,并根据红外光谱数据挖掘的特点改进了Apriori算法中支持度的计算与频繁集的确定过程 ,运用统计方法把挖掘结果形成可视的特征谱带 -化学基团规则式 ,通过具体的挖掘事例对挖掘结果进行分析与评价。挖掘出的规则式和波谱分析理论比较结果证明了挖掘结果的正确性 ,说明改进过的Apriori算法挖掘红外光谱数据库的有效性  相似文献   

4.
为有效从网络中挖掘出民众关注的热点事件和话题,提高数据分类能力、热点追踪和检测正确率,在分析目前采用非结构化传统挖掘算法所存在问题的基础上,提出一种基于结构化分割的挖掘算法。首先通过分析热点事件挖掘处理流程,设计一种对热点事件数据挖掘的半结构化特征提取算法,对半结构化数据进行特征分割,生成大量请求,进而得到热点事件数据的分配因子,从而提高挖掘性能。仿真结果表明,该算法运行效率较高,精度较好,具有较高的稳健性。  相似文献   

5.
姚琨  李伶俐 《计算机仿真》2020,(1):456-459,483
采用当前方法对可生存数据库进行安全保护时,存在对数据加密所用的时间较长、数据在数据库中的可用度较低、加密效率低和有效性差的问题,为此提出移动终端网络可生存数据库安全防篡改方法。在流控思想的基础上计算用户在可生存数据库中的可信度,通过令牌漏桶算法对用户请求进行排序,降低请求队列在数据库中的拥塞程度,在请求队列排序和用户可信度的基础上确定数据库中请求的转发总数,通过可信度管理、队列管理和请求转发管理构成可生存数据库的第一道防线。在集中式认证机制的基础上引入时间戳动态因子,采用混合动态数据加密算法对数据库中的数据进行加密,实现移动终端网络可生存数据库的安全防篡改保护。仿真结果表明,所提方法的加密效率高、有效性好。  相似文献   

6.
Apriori算法在红外光谱数据挖掘中的应用   总被引:2,自引:0,他引:2  
简要地介绍了在大规模数据库中挖掘关联规则的Apriori算法,给出了红外光谱数据库知识发现的空间表示方法,并根据红外光谱数据挖掘的特点改进了Apriori算法中支持度的计算与频繁集的确定过程,运用统计方法把挖掘结果形成可视的特征谱带-化学基团规则式,通过具体的挖掘事例对挖掘结果进行分析与评价。挖掘出的规则式和波谱分析理论比较结果证明了挖掘结果的正确性,说明改进过的Apriori算法挖掘红外光谱数据库的有效性。  相似文献   

7.
基于Web-Log Mining的N元预测模型   总被引:11,自引:0,他引:11  
苏中  马少平  杨强  张宏江 《软件学报》2002,13(1):136-141
随着Web上用户访问信息的不断增加,特别是Web服务器可提供大量的日志文件,使得有可能对这些大数据集进行知识挖掘,例如,对用户未来的访问进行预测.提出了一种利用服务器日志文件,运用N元(N-gram)预测模型对用户未来可能进行的Web访问请求进行预测.这种模型会选择性地对用户可预测的请求进行预测,从而大大提高了预测精度.实验证明,在自然语言中普遍适用的N元预测模型同样适用于网页预测.同时,采用了一种有效的简化手段,大大压缩了模型的大小,使得5元模型和传统的2元模型大小基本相同,而预测精度提高了1倍.该结果可以广泛地运用到Web上,包括网页的预发送、预取、推荐以及Web上的caching机制.试验是建立在真实的Web日志上的,该算法无论在预测精度上还是在可适用度上都优于以往的算法.  相似文献   

8.
车祸事故再现过程中,由于行人、风力等因素使得现场遗留痕迹中掺杂大量的与之不相干的数据信息,对车祸痕迹潜在挖掘信息形成了干扰.传统方法主要根据事故勘察报告和现场拍摄照片提取遗留痕迹信息进行事故再现,由于车祸事故的特殊性,不能有效地去除外部干扰数据信息,会导致车祸事故再现仿真真实度不高.提出考虑不确定性分析的车祸事故再现仿真挖掘方法.对车祸事故现场数据进行沃尔什离散化处理,并对其进行贝叶斯计算,针对获取的结果进行修正分析,完成车祸事故现场的特征提取.通过概率决策计算车祸事故现场数据关联度,计算不同车祸事故现场特征关联概率值,能有效去除现场遗留痕迹中干扰数据信息完成车祸事故再现仿真中挖掘结果不确定性分析.实验结果表明,利用改进算法进行车祸事故再现仿真中的挖掘结果的不确定性分析,能够提高车祸事故现场遗留痕迹挖掘准确性,提高了车祸事故再现仿真度.  相似文献   

9.
崔贤岳  李际军 《计算机工程》2007,33(14):283-285
基于FAS算法,设计并实现了一个基于最近挖掘结果的数据挖掘系统AR_Miner,包括数据预处理、频繁集初始计算、频繁集更新计算、频繁集选择、关联规则生成5个部分,实现了关联规则挖掘的可视化和生成结果按“支持度-可信度”形式的可视化,为基于频繁集的交互式挖掘提供了方便、友好的界面。对历史的稽查数据中纳税人采用的主要违法违章手段之间的关联关系进行了数据挖掘,得到了一些合理的知识,提高了对稽查历史数据的管理水平,为税务稽查提供了有力的决策支持。  相似文献   

10.
多尺度科学在数据挖掘领域的研究多见于图像和空间数据挖掘,对一般数据的多尺度特性研究较少。传统聚类算法只在单一尺度上进行,无法充分挖掘蕴藏在数据中的知识。引入粒计算思想,进行普适的多尺度聚类方法研究,对数据进行多层次、多角度分析,实现一次挖掘,多次应用。首先,介绍粒计算相关知识;然后,提出多尺度聚类尺度上推算法UAMC(Upscaling Algorithm of Multi-scale Clustering),以簇为粒子,簇心为粒子特征进行尺度转换,利用斑块模型得到大尺度知识,避免二次挖掘带来的资源浪费;最后,利用UCI公用数据集和H省全员人口真实数据集对算法性能进行实验验证,结果表明算法在准确性上优于K-Means等基准算法,是有效可行的。  相似文献   

11.
CRM是一种整合了知识管理、数据挖掘及数据仓库技术的商业策略,旨在支持制定决策来保留长期有利的客户关系。分析了CRM中数据仓库的设计问题,提出一种支持CRM分析的强劲的多维启动模型。为验证此模型,用一些CRM的查询进行测试,并定义两个量:成功率和适配率来评估。实验结果表明,此启动模型具有很高的成功率和适配率,可用于客户收益分析、市场收益分析、产品收益分析、渠道收益分析等多种收益分析。  相似文献   

12.
基于用户搜索行为的query-doc关联挖掘   总被引:1,自引:0,他引:1  
朱亮  陆静雅  左万利 《自动化学报》2014,40(8):1654-1666
query和doc之间的关联关系是搜索引擎期望获取的一类有价值的信息. query和doc间准确的关联分析不仅可以帮助搜索结果排序,也在query和doc之间的桥接中起到重要作用,以实现相关query和doc之间的信息传递,有利于更深入的query理解和doc理解,并在此基础上开展相关应用.本文提出了一种基于用户搜索行为的query和doc关联关系挖掘算法,该方法首先对用户搜索点击日志中的数据进行整理与分析,构建query与doc间的二部图,再通过采用马尔可夫随机游走模型对二部图数据进行建模,挖掘二部图中的点击数据和session数据,最终挖掘出点击日志中用户没有点击到的doc数据,从而预测出query和doc间的隐含关联关系,同时也可以利用该算法得到query和query潜在的关联关系.基于以上理论基础,我们实现了一套完整的日志挖掘系统,通过大量的实验对比,该系统在各方面均取得了优异的表现,其中对检索结果相关性的性能提升可以达到71.23%,这充分表明,本文所提出的理论和算法能够很好地解决query和doc之间的隐含关系挖掘问题,为提高搜索结果的召回率、实现查询推荐和检索结果聚类奠定了良好的前提基础.  相似文献   

13.
数据挖掘技术是一种新的信息处理技术。其目的是从海量数据中抽取潜在的,有价值的数据规律或数据模型。通过数据挖掘技术对高校教学数据的分析处理,能够形成真正有价值的知识,向决策者提供信息支持,有利于推动学校教学改革和建设的全面发展。本文主要针对现行高校实际运作的学分选课数据库系统,以关联规则挖掘为例,提出简单而可行的数据挖掘应用实施办法。  相似文献   

14.
基因调控信息集成数据库及查询   总被引:1,自引:0,他引:1  
随着基因组研究的深入和生物信息学的发展,对基因调控信息的分析和应用引起人们越来越多的重视。客观要求我们建立起一套能够广泛搜集信息并实现信息共享,同时利用分析工具对基因调控信息进行分析的研究机制,进而能从现有信息中进一步获得更深层次的基因知识。GRI是一套建立在后台Oracle关系型数据库及前台Web技术的基础上、以基因调控信息为主的集成数据库系统,它具有搜集各类基因调控信息、进行数据动态更新、为用户提供信息查询的功能,同时具有基因调控信息分析和数据挖掘等功能。  相似文献   

15.
电子商务与Web数据挖掘   总被引:1,自引:0,他引:1  
在电子商务中,运用数据挖掘技术对服务器上的日志文件等Web数据进行客户访问信息的Web数据挖掘。了解客户的访问行为,从而调整站点结构、市场策略等,使电子商务更具个性化和针对性。  相似文献   

16.
电子商务与Web数据挖掘   总被引:1,自引:0,他引:1  
在电子商务中,运用数据挖掘技术对服务器上的日志文件等Web数据进行客户访问信息的Web数据挖掘,了解客户的访问行为,从而调整站点结构、市场策略等,使电子商务更具个性化和针对性。  相似文献   

17.
数据挖掘技术是现代社会信息化发展的产物,主要是利用各类数据渠道,挖掘潜在的知识、信息,数据挖掘技术的利用更加偏重于过程,目前越来越多的隐含知识迫切需要被开采,以便发现更多有用的信息。因此,通过SAS时间序列分析校园网络社群,探讨校园网络社群的情况,为提高校园网管理水平提供理论依据和决策支持。为高校信息化建设提供借鉴和参考.  相似文献   

18.
与在普通事务数据库中进行数据挖掘相比,时态数据挖掘能更好地反映数据中所隐藏的与时间有关的知识。本文提出了一个基于时态数据库的挖掘框架,并通过实例研究,表明基于此框架所建立的系统能够有效率地挖掘到用户感兴趣的时态知识。  相似文献   

19.
传统的入侵检测系统在网络上存在自适应差、缺乏扩展性、数据过载等问题,而基于数据挖掘的入侵检测技术通过数据挖掘的方法,自动地从训练数据中提取出入侵检测的知识和模式,很好地解决了传统入侵检测系统中存在的问题.本文提出了一种基于数据挖掘的入侵检测系统模型,分析了几种入侵检测技术的数据挖掘方法.  相似文献   

20.
Medical data mining is currently actively pursued in computer science and statistical research but not in medical practice. The reasons therefore lie in the difficulties of handling and statistically analyzing medical data. We have developed a system that allows practitioners in the field to interactively analyze their data without assistance of statisticians or data mining experts. In the course of this paper we will introduce data mining of medical data and show how this can be achieved for survival data. We will demonstrate how to solve common problems of interactive survival analysis by presenting the Online Clinical Data Mining (OCDM) system. Thereby the main focus is on similarity based queries, a new method to select similar cases based on their covariables and the influence of these on their survival.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号