首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
《现代电子技术》2019,(19):90-94
传统Apriori挖掘算法需多次扫描数据库、多次连接频繁项集,导致挖掘效率较低,为此对Apriori挖掘算法加以改进,设计一种新的Apriori挖掘算法用于音乐节目分类。改进的Apriori挖掘算法采用莱特准则对音频数据进行野值与噪声平滑处理,改进Apriori挖掘算法的音频数据库映射令两个线性表分别负责音频数据存储和对应项存储,音频数据库扫描次数降为一次;改进Apriori挖掘算法的连接次数无需对不具备交运算能力的元素进行交运算操作,减少频繁项集连接次数。基于改进频繁项集Apriori挖掘算法挖掘频繁项集、生成音频数据关联规则,基于关联规则集构建分类器,实现音乐节目分类。实验结果显示,改进Apriori挖掘算法用于音乐节目分类的效率优势突出,准确度高。  相似文献   

2.
为了进一步发掘金融信息系统中的信息的潜在价值,为金融决策者提供可靠的金融决策分析,文章通过研究和分析Apriori算法,结合金融信息系统的数据信息处理特点,对传统的Apriori算法进行了改进设计,并且基于Apriori数据挖掘算法实现了对金融管理系统的数据分析,对发掘金融信息系统中的信息之间的关联性,挖掘其潜在价值具有非常重要的意义。  相似文献   

3.
Apriori算法是一种经典的数据关联规则挖掘算法,本文借力云计算环境,根据MapReduce模型并行运行实现的特点,对Apriori算法进行优化,并行化改进后的MR-Apriori算法大大降低了时间消耗,其较强的扩展能力能更好地运用于大规模数据分析、处理和挖掘的需要.  相似文献   

4.
《信息技术》2016,(9):93-95
互联网+时代,信息交流和社交方式都发生了极大的变化,自媒体的数据产生方式让大数据时代加速到来。Hadoop云计算实现框架是大数据管理中最优的解决方案,使用最为广泛,效果最为明显。文中针对运用云计算和云平台Hadoop的知识,对现有数据挖掘技术中的关联规则进行分析,对经典Apriori算法进行梳理并提出了一种基于MapReduce的改进Apriori数据挖掘算法。最后,通过Hadoop平台进行仿真实验,算法用Java实现,通过对训练数据迸行挖掘,结果表明改进算法在处理大数据时空间复杂度更低,且挖掘时间随着数据规模的增大呈线性增长。实验结果表明,改进算法在进行大数据挖掘比经典算法有了性能的提升。  相似文献   

5.
为了满足对XML文档集合进行数据挖掘需求,本文提出了根据XML文档树的语义信息和结构信息来计算其结构相似度,通过结构相似度构造其结构相似度矩阵,在此基础上应用DBSCAN算法来对XML文档集合进行聚类.与其他聚类算法相比,其聚类的速度得到了很大的提高.  相似文献   

6.
Apriori算法是关联规则的经典算法之一。文中是基于对Apriori算法原理的研究从而完成电影标签推荐的应用,实现当用户给自己喜欢的电影打标签时,可通过关联规则进行电影推荐。实验采用Python语言实现Apriori算法,对数据集MovieLens采用One-hot编码进行处理,利用Apriori算法寻找到数据集中的频繁项集,根据找到的频繁项集生成关联规则。实验结果表明,基于Apriori算法的电影标签推荐得到的实验结果更准确、快速、高效,同时也取得了良好的电影标签推荐效果,从而提升用户体验。  相似文献   

7.
XML文档越来越多地被用于数据交换,其安全性也变得越来越重要.可通过创建结构不同但拥有相同数据或者语意值的XML文档.可通过改变一些元素、属性顺序、增加或去掉一些不重要的空白来改变XML文档的结构,但是在逻辑上没有改变XML文档所拥有的数据或者表示的语意值.基于此提出一种新的XML文档数字水印算法,通过改变XML文档的结构,实现嵌入水印信息,以达到保护版权的目的.实验证明,该算法具有较大的水印容量,较好的隐藏性和鲁棒性.  相似文献   

8.
XML作为数据表示和交换的标准在信息系统的建设中得到了广泛的应用,如何使XML文档导入数据库以及如何使数据库中的数据转换为XML数据已成为亟待解决的关键问题。在研究XML文档特征的基础上,论述了2种主要的基于XML的数据库的类型及其特性。通过对多星业务管理控制系统体系结构和存储数据内容的特征分析,利用ORACLE对XML的支持机制,给出了基于XML-Enabled数据库的多星管理控制系统数据存储设计的实现方法。  相似文献   

9.
关联规则反映了大量数据中项集之间的相互依存性和关联性,Apriori算法是关联规则挖掘中的经典算法。本文利用关联规则的Apriori算法对校园物资管理系统中的数据进行了挖掘,找出物品潜在的频繁集以达到提高工作效率的目的。  相似文献   

10.
《信息技术》2017,(7):147-151
针对原始Apriori算法在计算二项频繁集时产生大量无效的候选集,以及对候选集进行了冗余的扫描这两个问题,文中提出一种改进算法LZ-Apriori,能够大大提升Apriori算法在计算二项频繁集过程中的时间效率,进而加速整个运算过程。将新算法运用到沪深股市板块联动的规则挖掘中,证实了新的算法具有良好的改进效果。  相似文献   

11.
针对XML文档的信息查询,介绍了XQuery标准产生及发展现状,分析了XQuery的查询处理过程;结合XQuery和Java技术进行查询处理,查询结果用XSLT和SVG技术进行转换显示;设计了一个XML检索应用实例,完成了从XML数据源中直接检索数据.  相似文献   

12.
We present a user-centered database query language called QBT (Query By Templates) for user communication with databases containing complex structured data, such as data stored in the Extensible Markup Language (XML). XML has revolutionized data storage as well as representation and transfer methods in today's internet applications. The growing popularity of XML as a language for the representation of data has enabled its use for several applications involving storage, interchange, and retrieval of data. Several textual query languages have been proposed for XML retrieval, including the World Wide Web Consortium's (W3C) recommendation of XQuery. Native XML database systems have been implemented, all of which provide methods for user communication with the database, although most communication methods use text-based query languages or form-based interfaces. QBT, the language presented here, is one of the first attempts toward a generalized alternative language that is based on human factors of familiarity. It is ideal for documents with a simple yet highly recognizable layout (e.g., poems, dictionaries, journals, etc.). We present the QBT language and report results from an initial usability test that shows promise for this type of an interface as a generalized user-database communication method.  相似文献   

13.
Today mobile network and various smart devices flourish rapidly. Data collected from the mobile devices and network can bring us huge opportunities to understand some significant characteristics of the users which traditional data cannot. Association rules mining is an extremely important topic in data mining that can make the utmost value of massive data effectively. Apriori algorithm and the improved Apriori ones based on Boolean matrix are the representative ones in association rules mining. Nevertheless, these solutions have their problems. In this paper, we have proposed an algorithm called MAR-DPS, which has some deep pruning strategies containing three methods to compress the size of frequent itemsets and reduce the joining numbers in generating new frequent itemsets. It can also select the appropriate method to generate frequent 2-itemsets when facing different data sets. Extensive experimental results on three different data sets have demonstrated that our MAR-DPS can perform much better than other tested algorithms.  相似文献   

14.
Liao  Jiyong  Wu  Sheng  Liu  Ailian 《Wireless Personal Communications》2021,116(3):1639-1657

High utility itemsets mining has become a hot research topic in association rules mining. But many algorithms directly mine datasets, and there is a problem on dense datasets, that is, too many itemsets stored in each transaction. In the process of mining association rules, it takes a lot of storage space and affects the running efficiency of the algorithm. In the existing algorithms, there is a lack of efficient itemset mining algorithms for dense datasets. Aiming at this problem, a high utility itemsets mining algorithm based on divide-and-conquer strategy is proposed. Using the improved silhouette coefficient to select the best K-means cluster number, the datasets are divided into many smaller subclasses. Then, the association rules mining is performed by Boolean matrix compression operation on each subclass, and iteratively merge them to get the final mining results. We also analyze the time complexity of our method and Apriori algorithm. Finally, experimental results on several well-known real world datasets are conducted to show that the improved algorithm performs faster and consumes less memory on dense datasets, which can effectively improve the computational efficiency of the algorithm.

  相似文献   

15.
We present novel query algorithms that efficiently support some popular XPath operations over LZCS-transformed documents. The LZCS transformation compresses a redundant XML collection without loss. The main idea of LZCS, inspired by Lempel-Ziv compression, is to replace whole substructures by previous occurrences thereof, and our algorithms try to reuse the work done over those repeating substructures. The algorithms are implemented in a prototype called lzcs-grep. The main advantage of lzcs-grep is that it processes the documents in transformed form, obtaining very fast response times in combination with low memory requirements. Our experimental results show that lzcs-grep is competitive with other XPath processors even over untransformed documents, and by far unbeaten when it can operate over their LZCS-transformed version  相似文献   

16.
在数据挖掘的过程中,使用到很多分类算法,可见分类算法在数据挖掘中占有非常重要的地位。数据分类算法有很多种,各有不同的优缺点,因此,通过对不同算法特性的研究,有助于后期对算法进行相应的改进,确保新的分类算法能够具备更好的实用性能。数据分类算法的性能优良,不仅可以提高数据挖掘的功能性和实用性,还可以确保使用者对算法具备更多的选择性,基于此,对数据挖掘中不同的数据分类算法进行了研究和分析。  相似文献   

17.
针对关联规则中Apriori算法的不足之处,提出两种基于矩阵的Apriori改进算法.改进算法充分利用矩阵这一工具,以大幅度减少扫描数据库的次数和计算成本,进而有效提高算法的运算效率.同时,通过实例应用和算法性能分析证明所提出的两种改进算法都是有效的关联规则挖掘方法,且比Apriori算法具有更好的性能.  相似文献   

18.
提出一种利用XML和Excel设计动态通用报表系统的新方法。首先对Excel报表模板进行分解,生成报表模板的报表信息、架构信息和映射信息,再根据统计模板生成统计分析信息,这些信息均以XML文档的形式存入数据库。在系统运行时,将用户上报的Excel文件中的报表数据提取出来,以XML文档的形式存入数据库。然后结合XPath和XQuery对报表数据进行统计分析,得到统计报表数据。最后将统计报表数据组装为Excel文件输出给用户。采用这种方法设计的报表系统动态灵活、通用性强。  相似文献   

19.
关联规则的挖掘   总被引:5,自引:0,他引:5  
数据挖掘是在数据库中对数据进行一定的处理 ,获得其中隐含的 ,事先未知的 ,却又可能极为有用的信息。介绍了数据挖掘的概念和技术 ,应用Apriori算法进行关联规则的挖掘 ,应用于实例中 ,取得了良好的结果。  相似文献   

20.
针对传统气象数据质量控制算法存在的不足,首先提出将Apriori关联规则挖掘算法用于气象数据中,通过Apriori算法挖掘出关联规则;其次分析了Apriori算法存在的不足,提出了一种改进的MC_Apriori算法,通过真实数据仿真表明,新算法在时间性能上更加优越;最后,在原数据的基础上植入部分错误数据,通过与规则库中的关联规则进行规则匹配,找出错误数据率达到93.3%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号