首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
针对Apriori算法需要频繁扫描事务数据库并且会产生大量候选项集的不足,提出一种改进的Apriori算法。采用矩阵压缩的思想,增加了3个向量,分别表示事务矩阵中各行各列1的个数,即事务项目数和项目支持数,以及重复的事务出现次数,从而减小矩阵规模,避免多次扫描数据库。在矩阵运算过程中,对矩阵中事务项目数和项目支持数进行排序并删除不满足条件的项集和非频繁项集,形成新的矩阵结构,提高空间效率。对改进后的算法进行性能分析和试验分析发现,该算法相对于Apriori算法具有更高的效率,同时可以更有效的挖掘出频繁项集。  相似文献   

2.
安全散列算法(SHA)已经被广泛地应用于电子商务等信息安全领域.为了满足安全散列算法计算速度的需要,本文通过对SHA-3算法的候选算法——MD6算法的并行性分析,在GPU平台上快速实现了MD6算法,其最快实现速度是CPU速度的5倍,为快速高效的实现安全散列算法提供了有效的途径.  相似文献   

3.
为了设计出能应用于无线移动通信的序列密码算法,提出了一种将单分组散列函数应用于哈希链方法的序列密码算法(SC-SBH).该算法首先用哈希链的方法对单分组散列函数进行循环运算,将运算的每一次结果值输出后连接成序列密码的密钥序列,然后将明文与密钥序列进行按位异或运算得到密文.实现SC-SBH算法后,对其安全性和随机性进行了测试,并将其运行效率与SC-MD5和SC-SHA算法进行了比较.实验结果表明,SC-SBH算法在加密方面不仅能够保证安全性,而且其运行效率明显高于SC-MD5和SC-SHA算法.  相似文献   

4.
为解决大数据量情况下的网络用户行为分析的时效性、准确性,针对Apriori算法对数据库反复扫描和候选集过大的问题,提出了一种将压缩矩阵和事务权值引入的改进型Apriori算法,并将改进后的算法运用于云计算平台Spark。实验证明,改进后的算法的性能和效率都更高,在网络用户行为分析中具有优势。  相似文献   

5.
在3DGIS领域中,空间数据结构占有突出的地位,它直接关系到GIS的功能和效率。为了对3DGIS海量数据进行有效地存储和管理,本文讨论了3DGIS栅格数据结构线性八叉树编码压缩技术,并在原来压缩技术基础上,对其压缩过程进行了改进,同时给出了改进后的压缩和解压缩算法。通过对改进前后算法的比较,发现改进后的算法在压缩时间和数据压缩率上都有显著提高。  相似文献   

6.
基于概念格的频繁闭项集增量挖掘算法研究   总被引:1,自引:0,他引:1  
近年的研究表明,概念格可以应用于解决频繁闭项集的挖掘问题.针对已有渐进式概念格构造算法中存在的问题,提出了一种基于概念格的频繁闭项集增量挖掘新算法——FIPT-I算法.新算法利用模式树对概念格进行组织,并利用模式树压缩数据库中的事务,在渐进式构造概念格的同时实现了事务的批处理,减少了概念格的调整操作时间.实验结果表明,与其他同类算法相比,FIPT-I算法对于增量挖掘频繁闭项集来说具有更高的效率.  相似文献   

7.
针对Apriori算法需要多次扫描数据库的缺陷,提出一种基于垂直事务关系的改进算法XApriori。该方法对原始事务数据库扫描后,采用项集事务垂直对应关系的位集合数据存储结构,并构建逻辑生成候选项集策略,利用数值统计的方法生成候选项集并确定频繁项集,实现关联规则的挖掘。对比实验结果表明,改进算法比Aprior算法关联规则挖掘的效率有所提高。  相似文献   

8.
本文讨论了改进哈夫曼码的算法及其编译码技术。应用该项技术把60路报纸传真信号压缩为64 kb/s 单话路数据,压缩比大于5,编码效率优于0.84。通过卫星信道的传输实验得到令人满意的结果。  相似文献   

9.
基于事务相似矩阵的关联规则挖掘算法   总被引:3,自引:0,他引:3  
通过对Apriori算法挖掘过程的深入分析,提出一种改进的关联规则挖掘算法——基于事务相似矩阵的关联规则挖掘算法(ARBSM):在压缩事务布尔矩阵的基础上构建一个事务相似矩阵,直接查找高阶肛项频繁集,有效解决了Apriori算法逐层搜索的迭代产生频繁项集的瓶颈问题。测试结果表明,ARBSM算法可以高效地挖掘潜在的强关联规则。  相似文献   

10.
通过扩展Heritrix相应组件来抓取特定网页,实现预定的抓取策略,并加入APHash算法对URL进行散列,达到了多线程抓取网页的目的,极大地提高了抓取数据的效率。  相似文献   

11.
针对已有Web事务识别模型的缺点,提出一种识别Web事务的新模型———IPRC模型.该模型根据主索引页上的引用以及文档目录结构将网页分类,并以此作为识别Web事务的依据.在此基础上提出了一种挖掘频繁访问模式的算法WDHP,该算法继承了DHP算法使用hash树过滤候选集以及裁剪数据库的基本方法,并以访问路径树的方式将数据库存储于内存,在内存中完成后继的挖掘,不仅减少了扫描数据库的次数,而且大大降低了算法的时间复杂性.实验表明WDHP算法不仅优于DHP算法,而且也优于典型的基于内存的WAP算法.  相似文献   

12.
为了提高Eclat算法的效率,从剪枝、项集连接和交叉计数3方面对Eclat算法进行优化.将后缀相同的项集归为一个等价类,使剪枝更充分,剪枝时引入双层哈希表加快搜索候选项集子集的速度;提出项集集合划分链表,以减少项集连接过程中比较判断的环节;提出事务标识(Tid)失去阈值,以加快交叉计数的速度.在此基础上提出一种优化的Eclat_opt算法(ZAKI),把它与Eclat原算法以及其他2种Eclat改进算法Diffset (ZAKI), hEclat(熊忠阳)进行对比实验的结果表明,Eclat_opt算法的效率在稀疏数据集上最高,总体时间性能最好.  相似文献   

13.
目前密码分析者已经可以在较短的时间内有效找到MD5、SHA1等国际密码杂凑算法的碰撞,通过熵增来增强杂凑值的随机性是提高密码杂凑算法抗碰撞性的有效途径,因此提出一种将纠错码和SM3算法迭代结构融合的改进方案。首先,基于纠错码的线性性质和最小汉明距离最大化原则,选择拟阵理论所构建的二进制线性分组码,计算出其系统形式的生成矩阵,并通过循环移位来消除比特之间的规律,并计算最终产生的有效码字;其次,在线性分组码中遵循周期性原则选取最优码字来构建初始常量值,并将其赋值于初始寄存器中,同时在迭代结构中引入初始寄存器构成算法的压缩函数,完成杂凑算法迭代结构的二次构建;最后,考虑杂凑值信息熵对算法混乱度的评估能力,将提出的方案和2种现有公开的国际密码杂凑算法进行对比实验,同时进行算法效率、内存损耗以及雪崩效应测试并进行综合评价。实验结果表明,本文方案在不改变运算效率的前提下具有稳定的雪崩效应,运行过程中的内存损耗相比SM3算法降低0.01~0.07MB,同时杂凑值的信息熵值高于其他两类对比算法。表明提出的基于纠错码的改进方案能够通过熵增证明杂凑值比特之间的随机性更高,更好实现隐藏明文和杂凑值之间统计信息的目的,提高了密码杂凑算法的安全性。  相似文献   

14.
It is extremely difficult to measure traffic information with a growing network link speed. In recent years, increasing focus has been put on probabilistic algorithms which are fast enough to examine all packets and can provide estimates of the sizes of all flows. However, the previously proposed flow estimating algorithm of PMC has the drawbacks of poor space efficiency and large estimation error. To address the problem, a double bit field (D-BF) algorithm is proposed. The method is divided into two steps: the newly arrived packet is mapped to two bit fields using different hash functions in the data capturing stage; two virtual matrixes recovered from the bit fields have been intersected to eliminate errors caused by the hash collision in the data recovering stage. Experimental results show that the proposed D-BF is more accurate than PMC in flow estimate, while a reduction of 75% in memory space can be achieved.  相似文献   

15.
现有的数据共享模型普遍存在数据检索慢、新节点在交易验证过程中参与度不够和数据提供方须依托于效率较低的本地计算等不足.针对这些问题,提出了一种基于区块链和云平台的数据共享模型.通过平衡二叉树和默克尔树结合的方式对链上数据的哈希值排序,提高区块的检索效率;采用基于健康指数的抽签算法选取共识节点,增加新节点被选中的机会;并将...  相似文献   

16.
Apriori算法的改进   总被引:2,自引:0,他引:2  
针对Apriori算法要多次扫描事务数据库以及生成大量候选集缺陷,在候选集C_1中增加事务标识符列表Tid_list实现只扫描一遍事务数据库,利用频繁项目集的性质来减少生成候选集的数量,提高了算法效率.  相似文献   

17.
分布式并行数据库系统以高可用性、高效率等特征愈来愈受到人们的关注。针对分布式并行数据库系统的特征,提出了分布式并行重定向算法,实现服务器节点的透明切换。该算法不仅能实现负载均衡以及位置透明性,提高系统效率,而且能保证节点故障时事务不被中断,实现系统的高可用性。  相似文献   

18.
基于访问频率的Hash树   总被引:3,自引:0,他引:3  
Hash树是一种常用的数据结构。当Hash树不能完全装入内存时,会增加缺页中断次数,导致算法效率下降,为此本文研究并提出了根据项集的联合概率生成Hash树的方法。按访问频率将Hash树结点数据顺序地排放在线性空间中。这种数据存储方式既能适应操作系统中的程序局部性特征,又能达到减少I/O次数、提高数据存取效率的目的。  相似文献   

19.
为了解决点对点(P2P)系统中多种资源合作完成任务卸载的问题,提出了多资源组合交易卸载算法,设计了激励机制,促使设备加入任务卸载系统,同时保证系统内资源可以被高效地利用。通过严格的理论分析可知,所设计的多资源组合交易机制能满足计算效率可行性和个体理性的要求。通过实验模拟得出结论:提出的多资源组合交易卸载算法的资源交易数量虽然没有达到对比算法下的资源交易数量,但时间复杂度远远低于对比算法。  相似文献   

20.
为了保证视频内容被合法用户接收,且接收到的视频内容没有受到帧丢弃、帧重组等恶意攻击,对接收到的视频内容安全信息进行远程取证。提出了基于可信平台模块TPM的视频安全远程取证,对该远程取证的结构和过程进行了分析。为防止中间人伪造远程取证响应,提出了基于Fourier-Mellin的视频内容哈希算法,采用TPM对视频帧的特征进行认证;同时为提高远程取证的效率,提出了用于视频安全远程取证下的可区分粒度的取证模式,分析了如何能够有效地在粒度下视频序列中寻找不可信视频帧。通过实验证明了该视频哈希算法的有效性,并验证了可区分粒度取证模式的特点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号