首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
社交网络数据的高度复杂性给数据挖掘研究带来了巨大的挑战,而社交网络数据挖掘更注重实体之间相互关联的特点,使得图数据挖掘技术的研究与应用逐渐成为该领域的热点。传统数据挖掘,如聚类、分类、频繁模式挖掘等技术逐渐拓展到图数据挖掘领域。文中首先介绍了现阶段图数据挖掘算法(其中包括图查询、图聚类、图分类和图的频繁子图挖掘)的研究内容和存在的问题;其次介绍了图形数据库研究现状,以及对比了主流图形数据库管理系统的优劣;最后介绍了图挖掘技术在社交网络中的应用。  相似文献   

2.
化学信息学、生物信息学、医学和社会科学等领域的科学研究的迅速发展积累了大量的图数据,如何从复杂和庞大的图数据中挖掘出有效信息成为数据挖掘领域的热点。通过介绍现阶段图数据挖掘技术的进展,特别是确定图挖掘技术中有代表性的频繁子图挖掘技术研究,讨论并预测了频繁子图挖掘研究的发展趋势。  相似文献   

3.
由于大部分图挖掘算法都需要利用频繁子图,频繁子图挖掘逐渐成为了数据挖掘领域中的热点研究内容。目前,很多高效的频繁子图挖掘算法已经被提出。其中,gSpan算法是目前公认的最好的频繁子图挖掘算法。然而,在化合物数据集上,还可以利用化合物的特殊结构进一步优化gSpan算法的性能。文献利用了化合物分子结构的对称性和原子类型分布的不均衡性,提出了一些新的优化策略,进一步改进了gSpan的性能。鉴于gSpan算法在图挖掘领域乃至整个数据挖掘领域的重要性,设计并实现gSpan算法。同时,采用文献[4]中的优化策略,进一步提高gSpan算法在化合物数据集上的运行效率。  相似文献   

4.
由于大部分图挖掘算法都需要利用频繁子图,频繁子图挖掘逐渐成为了数据挖掘领域中的热点研究内容。目前,很多高效的频繁子图挖掘算法已经被提出。其中,gSpan算法是目前公认的最好的频繁子图挖掘算法。然而,在化合物数据集上,还可以利用化合物的特殊结构进一步优化gSpan算法的性能。文献利用了化合物分子结构的对称性和原子类型分布的不均衡性,提出了一些新的优化策略,进一步改进了gSpan的性能。鉴于gSpan算法在图挖掘领域乃至整个数据挖掘领域的重要性,设计并实现gSpan算法。同时,采用文献[4]中的优化策略,进一步提高gSpan算法在化合物数据集上的运行效率。  相似文献   

5.
Web数据挖掘及其在电子商务中的应用   总被引:1,自引:0,他引:1  
随着互联网信息的增长,Web数据挖掘已经成为数据挖掘研究的热点之一,尤其是应用于电子商务领域.阐述了电子商务中的Web数据挖掘资源、Web日志挖掘的处理流程和几种技术,最后分析了Web数据挖掘在电子商务中的应用.  相似文献   

6.
在对Web应用挖掘的基本步骤作系统性研究的基础上,设计了一个Web应用挖掘可视化系统.该系统能够对用户访问Web时服务器方留下的访问记录进行挖掘,从中得出用户的访问模式和访问兴趣,并对所得出的结果进行可视化的处理.为了识别用户浏览模式利用Apriori算法对Web应用挖掘过程中预处理阶段所产生的用户会话文件进行了挖掘.采用Web图可视化了Web站点的拓扑结构以及各节点访问计数和登录计数信息.Web图的新颖之处在于两点:首先,为了将Web拓扑结构映射到Web图上,利用了站点拓扑结构数据和站点应用数据;其次,在绘制表示用户登录计数的信息层时允许通过使用动态布局的方法,以及为每一层的节点重新分配360度周长的方法来解决节点之间的冲突问题.文中较详细地阐述了该系统对Web应用数据挖掘可视化界面布局的具体措施.  相似文献   

7.
互联网的广泛应用使Web数据挖掘成为当前数据挖掘技术研究的热点。但由于Web数据存在方式的特殊性使Web数据控制变得十分复杂,而XML的出现为Web数据挖掘技术带来了巨大的发展契机。XML正逐渐成为新一代互联网数据组织和交换的事实标准,两者的结合——基于XML的Web数据挖掘技术成为Web数据挖掘中一个重要的研究课题。文章分析了Web数据挖掘技术的难点,提出了一个基于XML的Web内容数据挖掘系统框架。  相似文献   

8.
互联网上的数据挖掘   总被引:2,自引:0,他引:2  
1 引言 Web挖掘是从WWW资源上抽取信息(或知识)的过程,它是将数据挖掘技术和理论应用于对WWW资源进行挖掘的一个新兴的研究领域。目前在该研究领域中,根据挖掘对象的不同大致可分为三个方面的挖掘研究:Web内容挖掘、Web结构挖掘、Web使用挖掘(图1)。  相似文献   

9.
互联网的广泛应用使Web数据挖掘成为当前数据挖掘技术研究的热点.但由于Web数据存在方式的特殊性使Web数据控制变得十分复杂,而XML的出现为Web数据挖掘技术带来了巨大的发展契机.XML正逐渐成为新一代互联网数据组织和交换的事实标准,两者的结合--基于XML的Web数据挖掘技术成为Web数据挖掘中一个重要的研究课题.文章分析了Web数据挖掘技术的难点,提出了一个基于XML的Web内容数据挖掘系统框架.  相似文献   

10.
数据挖掘技术是当前数据库和人工智能领域研究的热点。文章从云计算的概念及关键技术出发,详细阐述了在云计算下的Web数据挖掘的各种技术方法,分析了Web数据挖掘技术,并对云计算基础上的Web数据挖掘进行了探讨。  相似文献   

11.
利用图片类日志信息改进会话识别质量   总被引:2,自引:0,他引:2  
范纯龙  姜宏飞  李华 《计算机应用》2010,30(4):1056-1058
数据预处理是Web日志挖掘的基础,而会话识别则是数据预处理的关键步骤,其质量严重影响Web日志挖掘的结果。在分析现有会话识别方法的基础上,提出了利用数据预处理中废弃的图片等日志数据,并结合扩展Web图结构,从页面分组规则和路径补全算法两个方面改进会话识别质量,并通过实验证实该方法对改善会话识别质量是有效的。  相似文献   

12.
在自然语言处理的基础上,将中医领域本体与图的基本性质相结合,提出了构造中医诊疗知识语义网络算法。给出了图的基本性质、语义网络的图定义,并为知识的网络表示建立了相应的数据结构。将算法用于中医领域语义网络和语义场构建。试验结果表明,该算法具有较好的实用性。提出的基于图的语义网络构造算法,对于文本挖掘、知识获取技术研究有重要意义,也是中医专家知识获取的有效方法。  相似文献   

13.
由于图模型能够准确地表示科学与工程领域中数据的关键特征,图挖掘逐渐成为了数据挖掘领域的热点研究内容.图分类是图挖掘的一个重要研究分支.提出了一种新的基于频繁闭显露模式的图分类方法CEP,其基本思想是首先挖掘频繁闭图模式,然后从闭图模式中得到显露模式,最后根据显露模式构造一系列分类规则.实验结果显示:在对化合物数据分类时,CEP在分类性能上优于目前最好的图分类方法.而且,领域专家容易理解和利用CEP产生的分类规则.  相似文献   

14.
Web使用挖掘研究   总被引:5,自引:1,他引:5  
Web数据挖掘是数据挖掘技术在Web信息仓库中的应用与研究。Web数据挖掘包括Web内容挖掘、Web结构挖掘和Web使用挖掘三个研究方向,文中研究的重点是Web使用挖掘。Web使用挖掘研究的主要对象是用户的使用记录,研究的主要过程包括数据预处理、模式发现和模式分析。文中详细介绍了Web使用挖掘的最新研究成果,并对将来技术的研究方向和发展趋势进行了探讨性的预测与分析,为进一步的理论研究和实际应用工作提供了指导性的建议。  相似文献   

15.
基于图论的频繁模式挖掘   总被引:9,自引:1,他引:8  
对图数据频繁模式的挖掘是近年的研究热点.选择了惟一标号图进行分析,结合图论和频集生成的算法,提出了基于Aproiri思想、运用矩阵乘法的AMGM算法和基于SFP树的SFP算法.它们可有效地挖掘简单图中连通频繁子图.实验表明,这两个算法是十分有效的,其中SFP算法的性能优于AMGM.该算法还被运用于发现Web上的权威页面和社团,具有良好的效果.  相似文献   

16.
张宇  刘燕兵  熊刚  贾焰  刘萍  郭莉 《软件学报》2014,25(9):1937-1952
对包含亿万个节点和边的图数据进行高效、紧凑的表示和压缩,是大规模图数据分析处理的基础.图数据压缩技术可以有效地降低图数据的存储空间,同时支持在压缩形式的图数据上进行快速访问.通过深入分析该技术的发展现状,将该技术分为基于传统存储结构的压缩技术、网页图压缩技术、社交网络图压缩技术、面向特定查询的图压缩技术4类.分别对每类技术详细分析了其代表方法并比较了它们之间的性能差异.最后对该技术进行了总结和展望.  相似文献   

17.
数据抽取及语义分析在Web数据挖掘中的应用   总被引:4,自引:1,他引:3  
袁占亭  张秋余  李威 《计算机工程与设计》2005,26(6):1425-1427,1437
把复杂的网络站点作为多个业务数据源,采用数据仓库及数据挖掘技术,从中抽取并净化数据到挖掘数据库,从而将数据抽取及语义分析应用于Web数据挖掘中。在此基础上又提出了运用数据抽取进行数据结构转换并把语义分析技术应用到数据抽取的过程中的思想,使数据提取更加准确。  相似文献   

18.
Complete Mining of Frequent Patterns from Graphs: Mining Graph Data   总被引:16,自引:0,他引:16  
Basket Analysis, which is a standard method for data mining, derives frequent itemsets from database. However, its mining ability is limited to transaction data consisting of items. In reality, there are many applications where data are described in a more structural way, e.g. chemical compounds and Web browsing history. There are a few approaches that can discover characteristic patterns from graph-structured data in the field of machine learning. However, almost all of them are not suitable for such applications that require a complete search for all frequent subgraph patterns in the data. In this paper, we propose a novel principle and its algorithm that derive the characteristic patterns which frequently appear in graph-structured data. Our algorithm can derive all frequent induced subgraphs from both directed and undirected graph structured data having loops (including self-loops) with labeled or unlabeled nodes and links. Its performance is evaluated through the applications to Web browsing pattern analysis and chemical carcinogenesis analysis.  相似文献   

19.
大图的存储方式直接影响大图的访问效率以及查询与挖掘的效率。随着大图应用的不断发展,大图分布式存储技术所面临的挑战更加严峻,需要解决的问题日益迫切。首先阐述大图产生的背景以及大图分布式存储所面临的主要挑战,然后分析大图分布式存储技术的国内外研究现状,最后总结现有研究存在的问题并指明未来可能的研究方向。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号