共查询到16条相似文献,搜索用时 100 毫秒
1.
由于大部分图挖掘算法都需要利用频繁子图,频繁子图挖掘逐渐成为了数据挖掘领域中的热点研究内容。目前,很多高效的频繁子图挖掘算法已经被提出。其中,gSpan算法是目前公认的最好的频繁子图挖掘算法。然而,在化合物数据集上,还可以利用化合物的特殊结构进一步优化gSpan算法的性能。文献利用了化合物分子结构的对称性和原子类型分布的不均衡性,提出了一些新的优化策略,进一步改进了gSpan的性能。鉴于gSpan算法在图挖掘领域乃至整个数据挖掘领域的重要性,设计并实现gSpan算法。同时,采用文献[4]中的优化策略,进一步提高gSpan算法在化合物数据集上的运行效率。 相似文献
2.
由于大部分图挖掘算法都需要利用频繁子图,频繁子图挖掘逐渐成为了数据挖掘领域中的热点研究内容。目前,很多高效的频繁子图挖掘算法已经被提出。其中,gSpan算法是目前公认的最好的频繁子图挖掘算法。然而,在化合物数据集上,还可以利用化合物的特殊结构进一步优化gSpan算法的性能。文献利用了化合物分子结构的对称性和原子类型分布的不均衡性,提出了一些新的优化策略,进一步改进了gSpan的性能。鉴于gSpan算法在图挖掘领域乃至整个数据挖掘领域的重要性,设计并实现gSpan算法。同时,采用文献[4]中的优化策略,进一步提高gSpan算法在化合物数据集上的运行效率。 相似文献
3.
gSpan算法是一种基于频繁图的数据挖掘算法。该算法基于无候选人产生的频繁子图,采用深度优先搜索策略挖掘频繁连接子图。由于其设计结构具有连续性以及无候选人产生,算法的性能得以提高,在执行速度上可以达到前人算法如FSG算法的15~100倍。基于化合物库Chemical-340测试发现,该算法能够以卓越性能有效挖掘频繁子图。该算法可以应用在搜索具有相同子结构的化合物研究中,对相关领域研究发展具有重要意义。 相似文献
4.
5.
一个基于DFS编码的图形匹配算法 总被引:1,自引:0,他引:1
快速有效的图形查询是图形数据库成功应用的关键。文章利用图的词典顺序,用唯一的最小DFS(深度优先搜索)编码表示每个图。根据两个图同构当且仅当它们的最小DFS编码相同这一性质,将图形匹配转化为图的最小DFS编码的比较:在判断两个标记图形是否同构时,可以先求出图的最小DFS编码,再用有效的匹配算法进行比较。 相似文献
7.
密度峰值聚类算法(density peaks clustering algorithm, DPC)是2014年提出的一种新型聚类分析算法,它基于聚类中心局部密度大以及与密度更大点之间的距离较远两大特点绘制决策图寻找聚类中心,从而得到任意形状的簇.但在寻找聚类中心的过程中,求解局部密度以及高密度距离属性都依赖于相似度矩阵的计算,计算复杂度较高,限制了密度峰值聚类算法在大规模数据集中的应用.针对此不足,提出基于网格筛选的密度峰值聚类算法(density peaks clustering algorithm based on grid screening, SDPC),根据数据的不均匀分布,使用网格化方法去除部分密度稀疏的点,然后再使用密度峰值聚类算法中决策图的方法选取聚类中心,可以在保证聚类准确性的基础上有效降低计算复杂度.理论分析和实验测试表明:基于网格筛选的密度峰值聚类算法不仅可以对大规模数据集进行正确的聚类,还极大地降低了计算复杂度. 相似文献
8.
频繁子图挖掘是图挖掘的一个重要研究课题.gSpan算法作为一种高效的子图挖掘算法具有较好的执行效率,它通过最右扩展生成频繁子图,但不能保证每次扩展得到的均为标准编码.针对此问题本文提出了一种改进的算法CSGM,它采用ADI++存储结构,能处理更大规模的图集,同时保证每次最右扩展均生成标准编码,既避免了对非标准编码图的支持度计算,也避免了对输入编码是否为标准编码的计算.在实际数据集上运行的实验结果表明它比原算法提高了挖掘效率. 相似文献
9.
gSpan算法是一种基于频繁图的数据挖掘算法。该算法基于无候选人产生的频繁子图,采用深度优先搜索策略挖掘频繁连接子图。由于其设计结构具有连续性以及无候选人产生,算法的性能得以提高,在执行速度上可以达到前人算法如FSG算法的15~100倍。基于化合物库Chemical_340测试发现,该算法能够以卓越性能有效挖掘频繁子图。该算法可以应用在搜索具有相同子结构的化合物研究中,对相关领域研究发展具有重要意义。 相似文献
10.
崔尚勇 《自动化技术与应用》2020,39(11):44-47
为有效满足规模和密度快速增长的图数据对可视化结果可读性的需求,本文主要对数据结构可视化的布局算法进行了研究,针对大规模图数据完成了基于模块分析的可视化方法的构建,首先对LPA(Label Propagation Algorithm,标签传播算法)社团发现算法进行改进,再据此完成对大规模图数据的划分,分析划分后各模块的结构模式并将其抽象为节点,最后通过力引导算法的使用完成对处理后模块的布局及模块结构模式信息的展示,有效实现了大规模图数据的可视化处理过程,为进一步处理加工数据提供支撑。 相似文献
11.
12.
提出了一种基于查询树匹配的查询重用算法.首先,系统中原有查询树与新生成的查询树进行匹配并计算对新查询树的重用收益;然后根据重用收益来实现重叠的查询操作的重用.实验结果表明,该算法能够有效地减少连续查询的执行代价总量. 相似文献
13.
提出了一种从海量高维数据中进行高效查询的算法,该算法基于小世界网络模型,并采用网络节点表示高维数据的特征向量。算法主要包含两个部分,基于K-Means的索引生成算法和随机逼近查询算法,两个算法均给出了具体的操作步骤。算法经大量实验仿真,得出通过合理设置小世界网络节点的近邻节点数量以及最大查询路径和最大迭代次数等参数,算法可以满足不同精度的用户查询请求。实验结果表明,实现的算法在高维度海量数据查询中具有良好的检索效果。 相似文献
14.
提出了基于模糊矩阵的数据聚类模型,其中引入了聚类过程的全局性控制模糊矩阵,描述了数据聚类的过程;提出了基于模糊矩阵的蚁群聚类算法,实验结果证明了算法的正确性和高效性。 相似文献
15.
基于知识智能查询的通用数据挖掘系统研究 总被引:3,自引:0,他引:3
介绍了一个通用的、可扩展的、开放的数据挖掘系统(data mining system,DMS)框架.该框架能不依赖于某个具体的DB软件,方便地与数据仓库集成;而且在此框架下,DMS的数据源可以是数据仓库、多维数据库或数据挖掘数据库;通过采用面向知识的智能查询语言,DMS可以屏蔽不同数据源的差异;用户也可以使用这种简单易操作的语言进行数据挖掘,并以此为基础进行决策分析,从而使DMS达到良好的通用性. 相似文献