首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
序列数据是一种重要的数据类型,在诸多领域都有应用,比如说文本、生物数据库以及Web访问日志等。在对该类型数据进行分析的时候,对于相关信息的获取一般都是通过相似性查询得到的。本文首先根据序列查询算法的特点,提出了SSQ_MF,也就是多重过滤算法。并在此基础上设计了最优过滤顺序模型和过滤集大小估计的相关实验。实验结果表明,SSQ_MF算法的查询性能优于单一过滤器算法和随机过滤顺序的多过滤器算法。  相似文献   

2.
数值型序列在很多应用中存在,如超市的POS销售记录和证券交易所的股票买卖数据等.在此类数据中查询与给定序列模式相似的子模式具有重要的现实意义.提出一种趋势融合的序列相似性查询算法NSS_QA,首先对所有序列进行单调区间的“融合”处理,然后根据各区间的长度比例和幅度比例产生序列模式的候选集,最后定义了一种新的相似性度量来...  相似文献   

3.
序列数据相似性查询技术研究综述   总被引:2,自引:0,他引:2  
序列数据在文本、Web访问日志文件、生物数据库等应用中普遍存在,对其进行相似性查询是一种提取有用信息的重要手段.近年来,随着各种科学计算的发展和序列数据的大量产生,序列相似性查询已经成为数据分析领域一个研究热点.其涉及到的几个重要问题有面向各种应用领域的相似性度量及其相互之间的关系;随机序列数据中距离分布的统计信息及其对分析查询算法性能的作用;在大规模数据中,各种高效回答相似性查询的关键技术及各自的优缺点比较.总结了序列数据的分类和特点,给出了几种序列数据相似性度量和随机序列之间距离分布的统计信息,并进一步分析了这些度量之间的关系.接着给出了几种序列相似性查询的类型,以及序列相似性查询要解决的核心问题.在此基础上,针对各种序列相似性查询关键技术进行分类和评价.最后,讨论了关于序列数据相似性查询研究所面临的挑战,并归结了未来的研究方向.  相似文献   

4.
一种优化的协同过滤推荐算法   总被引:39,自引:0,他引:39  
协同过滤技术被成功地应用于个性化推荐系统中.随着电子商务系统用户数目和商品数目的日益增加,整个项目空间上用户评分数据极端稀疏,传统的相似性度量方法存在一定的不足.在引入项目评分预测思想的基础上,考虑到数据稀疏性带来的影响,采用修正的条件概率方法计算项目相似性,提出一种优化的协同过滤推荐算法,计算结果更具有实际意义和准确性.实验表明,该算法能够有效避免传统方法带来的弊端,提高系统的推荐质量.  相似文献   

5.
多连接查询优化是提高数据库性能的关键问题之一。Chiang Lee提出了一种启发式多连接查询优化算法MVP,分析发现该算法并没有考虑减小执行计划的计算代价。该文结合哈希过滤的特点提出一种改进的多连接查询优化算法,与MVP算法相比该算法降低了执行计划的计算代从,从而使查询响应时间更短。  相似文献   

6.
网内查询处理需要让网络中各个节点共同承担查询任务,其基本问题是如何采取合适的策略将各个查询映射到网络节点上,以使得网络传输数据量和网络延迟达到最小.基于在查询间共享数据流的思想,提出了基于查询包含和查询合并的数据流共享策略,并建立了相应的收益模型,最后通过实验分析对比了两种策略的运行效果.  相似文献   

7.
几乎所有的多维空间索引都没有考虑空间对象之间的顺序关系,只支持单个空间对象的索引和查询,无法直接支持空间对象序列查询.本文在R-Tree的基础上,提出一种可直接用于空间对象序列查询的动态索引--OR-Tree,保存了空间对象序列中对象之间的序关系.时间序列的相似性查询实验表明:与R-Tree相比,基于OR-Tree的方法在磁盘I/O次数和查询结果的候选集大小上显著降低,并且查询序列越长,性能提高就越明显.  相似文献   

8.
面向相似性查询的时间序列距离度量方法述评   总被引:1,自引:0,他引:1  
从一元时间序列和多元时间序列两个方面对当前提出的主要时间序列距离度量方法进行了述评.深入分析了各种算法的原理和特点,比较了算法对时间序列形变的支持情况以及时间复杂度.从客观上讲,各种算法之间并不具有绝对的优劣关系,每种算法的原理和特点各异,适用的问题领域也不一样.对于工程应用中选择时间序列距离度量方法具有指导意义,同时对于设计新的距离度量方法也具有参考价值.  相似文献   

9.
协同过滤算法是个性化推荐中应用最成功的技术之一,计算用户间的相似性是协同过滤算法的关键。而传统的相似性度量方法在数据稀疏和小用户交集时性能严重下降,因此本文提出了一种基于改进信息熵的相似性度量方法(NWDE),充分考虑了数据稀疏环境的特点,在计算用户间的相似性时综合考虑了用户间的交集大小以及评分差异的大小,使其得分更加真实。实验结果表明,在数据稀疏和小用户交集的情况下,该算法的推荐精度比传统方案取得了显著的改善。  相似文献   

10.
王伟  周刚 《计算机应用研究》2020,37(12):3569-3571
传统基于邻居的协同过滤推荐方法必须完全依赖用户共同评分项,且存在极为稀疏的数据集中预测准确性不高的问题。巴氏系数协同过滤算法通过利用一对用户的所有评分项进行相似性度量,可以有效改善上述问题。但该种方法也存在两个很明显的缺陷,即未考虑两个用户评分项个数不同时的情况以及没有针对性地考虑用户偏好。在巴氏系数协同过滤算法的基础上进行了改进,既能充分利用用户的所有评分信息,又考虑到用户对项目的积极评分偏好。实验结果表明,改进的巴氏系数协同过滤算法在数据集上获得了更好的推荐结果,提高了推荐的准确度。  相似文献   

11.
分析图相似查询候选集的产生过程以及特征图之间的关系对候选图集的影响,提出一种基于特征索引的图相似查询过滤算法,使用GIndex算法建立特征图索引结构,通过特征图之间的选择性关系给出一个有序的特征集,并借助特征-图矩阵对数据库进行筛选得到候选图集。实验结果证明,该方法能准确地产生候选图集,从而提高图查询的效率。  相似文献   

12.
一种求解MSA问题的自适应遗传算法   总被引:1,自引:0,他引:1  
胡桂武  郑启伦  彭宏 《计算机工程》2004,30(13):6-7,168
多序列比对(MSA)在生物信息学研究中占有重要地位,MSA问题是一个典型的NP问题,遗传算法是求解NP完全问题的一种有效方法。文章针对MSA问题,提出了一种新型自适应遗传算法,根据群体的多样性自适应调节变异概率,有效消除了算法中的欺骗性条件,使用突变算子来确保算法的搜索能力。整个算法模拟了自然界进化的周期性,较好的解决了群体的多样性和收敛深度的矛盾。算法的分析和测试表明,该算法是有效的。  相似文献   

13.
协同过滤技术被成功地应用于个性化推荐系统中.随着电子商务系统用户数目和商品数目的日益增加,整个项目空间上用户评分数据极端稀疏,传统的相似性度量方法没有考虑项目所属类别对项目相似性的影响,因而计算结果不够准确.在引入项目评分预测思想的基础上,考虑到数据稀疏性和项目所属分类对项目相似性的影响,采用修正的条件概率方法计算项目相似性;在计算用户初步预测评分和最终预测评分阶段,采用新的预测方法进行预测;针对系统性能随着用户和资源的增多而不断下降的问题,提出一种优化的增量协同过滤推荐算法.实验表明,该算法可以有效地解决用户评分数据极端稀疏情况下传统相似性度量方法存在的问题,显著提高推荐系统的推荐质量.  相似文献   

14.
李容  李明奇  郭文强 《计算机科学》2016,43(12):206-208, 240
协同过滤利用邻居用户的偏好对目标用户的偏好进行推荐预测,相似度计算是其关键。传统的相似度计算忽略了用户共同评分项目数与用户平均评分的影响,以至于在数据稀疏时不能很好地度量用户间的相似度。提出了两个修正因子来改进传统相似度,同时改进了协同过滤算法,将其应用于电影推荐。仿真结果表明,在电影推荐中,基于改进后相似度计算的协同过滤算法能取得比传统算法更低的MAE值,提高了电影推荐质量。  相似文献   

15.
在计算用户相似度时,传统的协同过滤推荐算法往往只考虑单一的用户评分矩阵,而忽视了项目之间的相关性对推荐精度的影响。对此,本文提出了一种优化的协同过滤推荐模型,在用户最近邻计算时引入项目相关性度量方法,以便使得最近邻用户的选择更准确;此外,在预测评分环节考虑到用户兴趣随时间衰减变化,提出了使用衰减函数来提升评价的时间效应的影响。实验结果表明,本文提出的算法在预测准确率和分类准确率方面均优于基于传统相似性度量的项目协同过滤算法。  相似文献   

16.
一种优化的Item-based协同过滤推荐算法   总被引:3,自引:0,他引:3  
针对传统的Item-based协同过滤推荐算法在推荐系统应用中存在的不足,提出一种优化的Item-based协同过滤推荐算法.从项目相似性计算,项目近邻选取和预测评分计算三个方面对算法进行了优化,使计算结果更具有实际意义和准确性.实验结果表明,提出的算法可解决传统方法中由于数据稀疏所导致的相似性度量不准确的问题,并显著地提高了算法的推荐精度.  相似文献   

17.
基于优化过滤策略的XML数据查询处理   总被引:2,自引:0,他引:2  
如何高效地处理XML查询,是目前研究的热点。由于当前方法存在过多扫描无用节点引起效率下降的问题,本文设计了一种XML数据的二级索引结构,基于该结构给出路径查询处理算法。首先,本文对XML模式中每个节点按路径类型进行分类编码,然后把每个节点按该编码进行聚类存储。在查询时,就可以先根据模式信息和查询信息得到目标节点的编码,然后只需将二级索引中这些编码对应的部分载入内存,进行过滤操作。这样就不必扫描整个索引,提高CPU和IO效率。本文还对二级索引结构进行扩展,使本文的过滤索引能方便应用在有分支结构的查询上。实验结果表明,本文的XML数据过滤算法效率优于基于Bit vector的过滤算法,并且索引结构所需要的存储空间也小于Bitvector索引。  相似文献   

18.
19.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号