共查询到20条相似文献,搜索用时 0 毫秒
1.
2.
Identifying protein-protein interactions is a key problem in molecular biology. Currently, interactions cannot be reliably
predicted on a proteome-wide scale but direct and indirect evidence for interactions is increasingly available from high-throughput
interaction detection methods, gene expression microarrays, and protein annotation projects. In this paper we propose an association
mining approach to integrating these diverse types of evidence. We apply this approach to a number of datasets consisting
of interacting and non-interacting protein pairs annotated with different types of evidence. We identify patterns that distinguish
interacting and non-interacting protein pairs, and use these patterns to assign a confidence level to proposed interactions. 相似文献
3.
在多维时态近似周期模型的基础上,提出了一种基于时态数据库技术和层次聚类技术的多维时态近似周期挖掘算法,并应用于股票数据。实验表明此算法是有效的。 相似文献
4.
为了提高网站的利用率及优化网站,构建了Web数据流挖掘系统,介绍了该系统的框架结构,并以商丘师范学院校园网为挖掘对象,说明了Web数据流挖掘的工作流程以及Web资源服务的具体实现流程。实践证明,基于Web数据流挖掘技术实现Web资源服务,可充分利用Web网站的信息和网络资源,实时、高效地为用户提供个性化的Web资源服务。 相似文献
5.
6.
通过挖掘Web日志改进站点结构 总被引:8,自引:0,他引:8
在一些商业站点中Web页面的结构有时与用户的浏览习惯不相一致,即用户在某个位置去寻找某个特定的页面,而这个页面却买际在另一个位置。该文提出一种算法找出站点中那些实际位置与用户期望位置不相一致的页面。算法的主要思想是如果访问者没有在特定的位置找到所需的页面就会回退,把这个产生回退的位置作为访问者希望相应的页面内容出现的可能的候选期望位置。然后站点管理者可以改进站点的结构,在用户的期望位置增加相应的页面的连接,这样可以使用户能够较为方便地找到所期望的页面。 相似文献
7.
8.
用户行为模式挖掘问题的研究 总被引:1,自引:0,他引:1
在软件可用性测试中,分析用户行为模式是一个关键的问题。为解决具有序列长度长、以序列片断为支持度计算依据等特点的用户行为模式挖掘问题,提出了一种有效的基于前缀树的频繁事件序列扩展方法,给出了比特图索引表的构造、事件扩展、事务扩展以及支持度计算的算法。使频繁事件序列能够简单快速地被确定。 相似文献
9.
数据挖掘系统结构的研究 总被引:1,自引:2,他引:1
介绍了典型的数据挖掘体系结构,然后分析其中存在的一些不足和主要问题.针对这些问题,主要选定存储数据挖掘结果的方向进行研究,提出了改进的数据挖掘体系结构,并对它的特点进行了分析.这种新结构为数据挖掘结果的共享及数据挖掘效率的提高提供了一种新的途径. 相似文献
10.
用户访问兴趣路径挖掘方法 总被引:1,自引:1,他引:1
针对当前挖掘用户访问模式算法仅将频繁访问路径作为用户浏览兴趣路径的问题,依据使用Web日志挖掘用户兴趣页面时,通过引入页面信息量参数,综合考虑页面访问次数、浏览时间和页面信息量大小来定义用户兴趣度,提出了基于兴趣度的用户访问模式挖掘算法。实验证明该算法是有效的,在用户浏览兴趣度量方面比当前的频繁访问路径挖掘算法更准确。 相似文献
11.
一种挖掘压缩序列模式的有效算法 总被引:1,自引:0,他引:1
从序列数据库中挖掘频繁序列模式是数据挖掘领域的一个中心研究主题,而且该领域已经提出和研究了各种有效的序列模式挖掘算法.由于在挖掘过程中会产生大量的频繁序列模式,最近许多研究者已经不再聚焦于序列模式挖掘算法的效率,而更关注于如何让用户更容易地理解序列模式的结果集.受压缩频繁项集思想的启发,提出了一种CFSP(compressing frequent sequential patterns)算法,其可挖掘出少量有代表性的序列模式来表达全部频繁序列模式的信息,并且清除了大量的冗余序列模式.CFSP是一种two-steps的算法:在第1步,其获得了全部闭序列模式作为有代表性序列模式的候选集,与此同时还得到大多数的有代表性模式;在第2步,该算法只花费了少量的时间去发现剩余的有代表性序列模式.一个采用真实数据集与模拟数据集的实验研究也证明了CFSP算法具有高效性. 相似文献
12.
13.
时空轨迹数据的获取变得越来越容易,轨迹数据刻画了移动对象的行为模式与活动规律,是对移动对象在时空环境下的移动模式和行为特征的真实写照,在城市规划、交通管理、服务推荐、位置预测等领域具有重要的应用价值.这些过程通常需要通过对时空轨迹数据进行模式挖掘才能得以实现.简述了轨迹数据挖掘的预处理和基本步骤,归纳了异常轨迹检测方法... 相似文献
14.
序列模式挖掘研究与发展 总被引:1,自引:1,他引:0
序列模式挖掘是数据挖掘的一个重要研究课题,它在很多领域中都有着广泛的应用.首先讨论了序列模式挖掘的相关背景,然后对序列模式挖掘进行分类,并在此基础上对每一类序列模式挖掘算法的特点进行了介绍和比较;最后,对序列模式挖掘未来的研究重点进行展望,以便研究者对序列模式挖掘做进一步的研究. 相似文献
15.
16.
频繁模式挖掘是数据挖掘中的一个重要部分,现有的模型具有各自的优点,但在智能性方面表现较差。对于已经存在的Agent系统,多数都是以语言的形式进行描述,本文对Agent进行形式上的描述,并应用到数据挖掘的模型中,使其智能性得到提高,并有很高的可移植性。 相似文献
17.
This paper presents the PlanMine sequence mining algorithm to extract patterns of events that predict failures in databases of plan executions. New techniques were needed because previous data miningalgorithms were overwhelmed by the staggering number of very frequent,but entirely unpredictive patterns that exist in the plan database.This paper combines several techniques for pruning out unpredictiveand redundant patterns which reduce the size of the returned rule setby more than three orders of magnitude. PlanMine has also beenfully integrated into two real-world planning systems. We experimentally evaluate the rules discovered by PlanMine, and show that theyare extremely useful for understanding and improving plans, as wellas for building monitors that raise alarms before failures happen. 相似文献
18.
需求收集和挖掘真正的体现了需求的市场和用户驱动.用户访谈,问卷调查,头脑风暴,竞品分析等都是需求收集和挖掘的方法.有效的需求收集和需求挖掘需要我们搞清楚用户真正的需求和问题背后的深层次问题,这样才有可能使得我们的产品解决方案真正的满足客户的需要. 相似文献
19.
频繁模式挖掘在数据挖掘领域已经有广泛的应用.然而,对于增量更新频繁模式挖掘研究得不是很多.本文提出了一种新颖的增量更新频繁模式树结构(IUNP_Tree),构建它只需要对数据库扫描一次.此外,提出了基于条件矩阵(conditional matrix)的频繁模式挖掘算法(FPBM_Mine)和增量更新算法INUPA,可以有效地处理数据库的增量更新问题.实验表明,该算法是有效的,并且运行效率高于FP-growth算法. 相似文献