共查询到19条相似文献,搜索用时 171 毫秒
1.
社交网络数据的高度复杂性给数据挖掘研究带来了巨大的挑战,而社交网络数据挖掘更注重实体之间相互关联的特点,使得图数据挖掘技术的研究与应用逐渐成为该领域的热点。传统数据挖掘,如聚类、分类、频繁模式挖掘等技术逐渐拓展到图数据挖掘领域。文中首先介绍了现阶段图数据挖掘算法(其中包括图查询、图聚类、图分类和图的频繁子图挖掘)的研究内容和存在的问题;其次介绍了图形数据库研究现状,以及对比了主流图形数据库管理系统的优劣;最后介绍了图挖掘技术在社交网络中的应用。 相似文献
2.
黄鑫 《计算机光盘软件与应用》2012,(17):63-64
化学信息学、生物信息学、医学和社会科学等领域的科学研究的迅速发展积累了大量的图数据,如何从复杂和庞大的图数据中挖掘出有效信息成为数据挖掘领域的热点。通过介绍现阶段图数据挖掘技术的进展,特别是确定图挖掘技术中有代表性的频繁子图挖掘技术研究,讨论并预测了频繁子图挖掘研究的发展趋势。 相似文献
3.
由于大部分图挖掘算法都需要利用频繁子图,频繁子图挖掘逐渐成为了数据挖掘领域中的热点研究内容。目前,很多高效的频繁子图挖掘算法已经被提出。其中,gSpan算法是目前公认的最好的频繁子图挖掘算法。然而,在化合物数据集上,还可以利用化合物的特殊结构进一步优化gSpan算法的性能。文献利用了化合物分子结构的对称性和原子类型分布的不均衡性,提出了一些新的优化策略,进一步改进了gSpan的性能。鉴于gSpan算法在图挖掘领域乃至整个数据挖掘领域的重要性,设计并实现gSpan算法。同时,采用文献[4]中的优化策略,进一步提高gSpan算法在化合物数据集上的运行效率。 相似文献
4.
由于大部分图挖掘算法都需要利用频繁子图,频繁子图挖掘逐渐成为了数据挖掘领域中的热点研究内容。目前,很多高效的频繁子图挖掘算法已经被提出。其中,gSpan算法是目前公认的最好的频繁子图挖掘算法。然而,在化合物数据集上,还可以利用化合物的特殊结构进一步优化gSpan算法的性能。文献利用了化合物分子结构的对称性和原子类型分布的不均衡性,提出了一些新的优化策略,进一步改进了gSpan的性能。鉴于gSpan算法在图挖掘领域乃至整个数据挖掘领域的重要性,设计并实现gSpan算法。同时,采用文献[4]中的优化策略,进一步提高gSpan算法在化合物数据集上的运行效率。 相似文献
5.
Web数据挖掘及其在电子商务中的应用 总被引:1,自引:0,他引:1
随着互联网信息的增长,Web数据挖掘已经成为数据挖掘研究的热点之一,尤其是应用于电子商务领域.阐述了电子商务中的Web数据挖掘资源、Web日志挖掘的处理流程和几种技术,最后分析了Web数据挖掘在电子商务中的应用. 相似文献
6.
在对Web应用挖掘的基本步骤作系统性研究的基础上,设计了一个Web应用挖掘可视化系统.该系统能够对用户访问Web时服务器方留下的访问记录进行挖掘,从中得出用户的访问模式和访问兴趣,并对所得出的结果进行可视化的处理.为了识别用户浏览模式利用Apriori算法对Web应用挖掘过程中预处理阶段所产生的用户会话文件进行了挖掘.采用Web图可视化了Web站点的拓扑结构以及各节点访问计数和登录计数信息.Web图的新颖之处在于两点:首先,为了将Web拓扑结构映射到Web图上,利用了站点拓扑结构数据和站点应用数据;其次,在绘制表示用户登录计数的信息层时允许通过使用动态布局的方法,以及为每一层的节点重新分配360度周长的方法来解决节点之间的冲突问题.文中较详细地阐述了该系统对Web应用数据挖掘可视化界面布局的具体措施. 相似文献
7.
关冰核 《数字社区&智能家居》2004,(23)
互联网的广泛应用使Web数据挖掘成为当前数据挖掘技术研究的热点。但由于Web数据存在方式的特殊性使Web数据控制变得十分复杂,而XML的出现为Web数据挖掘技术带来了巨大的发展契机。XML正逐渐成为新一代互联网数据组织和交换的事实标准,两者的结合——基于XML的Web数据挖掘技术成为Web数据挖掘中一个重要的研究课题。文章分析了Web数据挖掘技术的难点,提出了一个基于XML的Web内容数据挖掘系统框架。 相似文献
8.
9.
关冰 《数字社区&智能家居》2004,(8):66-68
互联网的广泛应用使Web数据挖掘成为当前数据挖掘技术研究的热点.但由于Web数据存在方式的特殊性使Web数据控制变得十分复杂,而XML的出现为Web数据挖掘技术带来了巨大的发展契机.XML正逐渐成为新一代互联网数据组织和交换的事实标准,两者的结合--基于XML的Web数据挖掘技术成为Web数据挖掘中一个重要的研究课题.文章分析了Web数据挖掘技术的难点,提出了一个基于XML的Web内容数据挖掘系统框架. 相似文献
10.
数据挖掘技术是当前数据库和人工智能领域研究的热点。文章从云计算的概念及关键技术出发,详细阐述了在云计算下的Web数据挖掘的各种技术方法,分析了Web数据挖掘技术,并对云计算基础上的Web数据挖掘进行了探讨。 相似文献
11.
12.
13.
由于图模型能够准确地表示科学与工程领域中数据的关键特征,图挖掘逐渐成为了数据挖掘领域的热点研究内容.图分类是图挖掘的一个重要研究分支.提出了一种新的基于频繁闭显露模式的图分类方法CEP,其基本思想是首先挖掘频繁闭图模式,然后从闭图模式中得到显露模式,最后根据显露模式构造一系列分类规则.实验结果显示:在对化合物数据分类时,CEP在分类性能上优于目前最好的图分类方法.而且,领域专家容易理解和利用CEP产生的分类规则. 相似文献
14.
15.
基于图论的频繁模式挖掘 总被引:9,自引:1,他引:8
对图数据频繁模式的挖掘是近年的研究热点.选择了惟一标号图进行分析,结合图论和频集生成的算法,提出了基于Aproiri思想、运用矩阵乘法的AMGM算法和基于SFP树的SFP算法.它们可有效地挖掘简单图中连通频繁子图.实验表明,这两个算法是十分有效的,其中SFP算法的性能优于AMGM.该算法还被运用于发现Web上的权威页面和社团,具有良好的效果. 相似文献
16.
17.
数据抽取及语义分析在Web数据挖掘中的应用 总被引:4,自引:1,他引:3
把复杂的网络站点作为多个业务数据源,采用数据仓库及数据挖掘技术,从中抽取并净化数据到挖掘数据库,从而将数据抽取及语义分析应用于Web数据挖掘中。在此基础上又提出了运用数据抽取进行数据结构转换并把语义分析技术应用到数据抽取的过程中的思想,使数据提取更加准确。 相似文献
18.
Complete Mining of Frequent Patterns from Graphs: Mining Graph Data 总被引:16,自引:0,他引:16
Basket Analysis, which is a standard method for data mining, derives frequent itemsets from database. However, its mining ability is limited to transaction data consisting of items. In reality, there are many applications where data are described in a more structural way, e.g. chemical compounds and Web browsing history. There are a few approaches that can discover characteristic patterns from graph-structured data in the field of machine learning. However, almost all of them are not suitable for such applications that require a complete search for all frequent subgraph patterns in the data. In this paper, we propose a novel principle and its algorithm that derive the characteristic patterns which frequently appear in graph-structured data. Our algorithm can derive all frequent induced subgraphs from both directed and undirected graph structured data having loops (including self-loops) with labeled or unlabeled nodes and links. Its performance is evaluated through the applications to Web browsing pattern analysis and chemical carcinogenesis analysis. 相似文献
19.
大图的存储方式直接影响大图的访问效率以及查询与挖掘的效率。随着大图应用的不断发展,大图分布式存储技术所面临的挑战更加严峻,需要解决的问题日益迫切。首先阐述大图产生的背景以及大图分布式存储所面临的主要挑战,然后分析大图分布式存储技术的国内外研究现状,最后总结现有研究存在的问题并指明未来可能的研究方向。 相似文献