共查询到19条相似文献,搜索用时 62 毫秒
1.
序列数据是一种重要的数据类型,在诸多领域都有应用,比如说文本、生物数据库以及Web访问日志等。在对该类型数据进行分析的时候,对于相关信息的获取一般都是通过相似性查询得到的。本文首先根据序列查询算法的特点,提出了SSQ_MF,也就是多重过滤算法。并在此基础上设计了最优过滤顺序模型和过滤集大小估计的相关实验。实验结果表明,SSQ_MF算法的查询性能优于单一过滤器算法和随机过滤顺序的多过滤器算法。 相似文献
2.
数值型序列在很多应用中存在,如超市的POS销售记录和证券交易所的股票买卖数据等.在此类数据中查询与给定序列模式相似的子模式具有重要的现实意义.提出一种趋势融合的序列相似性查询算法NSS_QA,首先对所有序列进行单调区间的“融合”处理,然后根据各区间的长度比例和幅度比例产生序列模式的候选集,最后定义了一种新的相似性度量来... 相似文献
3.
序列数据相似性查询技术研究综述 总被引:2,自引:0,他引:2
序列数据在文本、Web访问日志文件、生物数据库等应用中普遍存在,对其进行相似性查询是一种提取有用信息的重要手段.近年来,随着各种科学计算的发展和序列数据的大量产生,序列相似性查询已经成为数据分析领域一个研究热点.其涉及到的几个重要问题有面向各种应用领域的相似性度量及其相互之间的关系;随机序列数据中距离分布的统计信息及其对分析查询算法性能的作用;在大规模数据中,各种高效回答相似性查询的关键技术及各自的优缺点比较.总结了序列数据的分类和特点,给出了几种序列数据相似性度量和随机序列之间距离分布的统计信息,并进一步分析了这些度量之间的关系.接着给出了几种序列相似性查询的类型,以及序列相似性查询要解决的核心问题.在此基础上,针对各种序列相似性查询关键技术进行分类和评价.最后,讨论了关于序列数据相似性查询研究所面临的挑战,并归结了未来的研究方向. 相似文献
4.
一种优化的协同过滤推荐算法 总被引:39,自引:0,他引:39
协同过滤技术被成功地应用于个性化推荐系统中.随着电子商务系统用户数目和商品数目的日益增加,整个项目空间上用户评分数据极端稀疏,传统的相似性度量方法存在一定的不足.在引入项目评分预测思想的基础上,考虑到数据稀疏性带来的影响,采用修正的条件概率方法计算项目相似性,提出一种优化的协同过滤推荐算法,计算结果更具有实际意义和准确性.实验表明,该算法能够有效避免传统方法带来的弊端,提高系统的推荐质量. 相似文献
5.
多连接查询优化是提高数据库性能的关键问题之一。Chiang Lee提出了一种启发式多连接查询优化算法MVP,分析发现该算法并没有考虑减小执行计划的计算代价。该文结合哈希过滤的特点提出一种改进的多连接查询优化算法,与MVP算法相比该算法降低了执行计划的计算代从,从而使查询响应时间更短。 相似文献
6.
网内查询处理需要让网络中各个节点共同承担查询任务,其基本问题是如何采取合适的策略将各个查询映射到网络节点上,以使得网络传输数据量和网络延迟达到最小.基于在查询间共享数据流的思想,提出了基于查询包含和查询合并的数据流共享策略,并建立了相应的收益模型,最后通过实验分析对比了两种策略的运行效果. 相似文献
7.
《模式识别与人工智能》2005,18(5)
几乎所有的多维空间索引都没有考虑空间对象之间的顺序关系,只支持单个空间对象的索引和查询,无法直接支持空间对象序列查询.本文在R-Tree的基础上,提出一种可直接用于空间对象序列查询的动态索引--OR-Tree,保存了空间对象序列中对象之间的序关系.时间序列的相似性查询实验表明:与R-Tree相比,基于OR-Tree的方法在磁盘I/O次数和查询结果的候选集大小上显著降低,并且查询序列越长,性能提高就越明显. 相似文献
8.
面向相似性查询的时间序列距离度量方法述评 总被引:1,自引:0,他引:1
从一元时间序列和多元时间序列两个方面对当前提出的主要时间序列距离度量方法进行了述评.深入分析了各种算法的原理和特点,比较了算法对时间序列形变的支持情况以及时间复杂度.从客观上讲,各种算法之间并不具有绝对的优劣关系,每种算法的原理和特点各异,适用的问题领域也不一样.对于工程应用中选择时间序列距离度量方法具有指导意义,同时对于设计新的距离度量方法也具有参考价值. 相似文献
9.
10.
传统基于邻居的协同过滤推荐方法必须完全依赖用户共同评分项,且存在极为稀疏的数据集中预测准确性不高的问题。巴氏系数协同过滤算法通过利用一对用户的所有评分项进行相似性度量,可以有效改善上述问题。但该种方法也存在两个很明显的缺陷,即未考虑两个用户评分项个数不同时的情况以及没有针对性地考虑用户偏好。在巴氏系数协同过滤算法的基础上进行了改进,既能充分利用用户的所有评分信息,又考虑到用户对项目的积极评分偏好。实验结果表明,改进的巴氏系数协同过滤算法在数据集上获得了更好的推荐结果,提高了推荐的准确度。 相似文献
11.
12.
13.
14.
协同过滤技术被成功地应用于个性化推荐系统中.随着电子商务系统用户数目和商品数目的日益增加,整个项目空间上用户评分数据极端稀疏,传统的相似性度量方法没有考虑项目所属类别对项目相似性的影响,因而计算结果不够准确.在引入项目评分预测思想的基础上,考虑到数据稀疏性和项目所属分类对项目相似性的影响,采用修正的条件概率方法计算项目相似性;在计算用户初步预测评分和最终预测评分阶段,采用新的预测方法进行预测;针对系统性能随着用户和资源的增多而不断下降的问题,提出一种优化的增量协同过滤推荐算法.实验表明,该算法可以有效地解决用户评分数据极端稀疏情况下传统相似性度量方法存在的问题,显著提高推荐系统的推荐质量. 相似文献
15.
在计算用户相似度时,传统的协同过滤推荐算法往往只考虑单一的用户评分矩阵,而忽视了项目之间的相关性对推荐精度的影响。对此,本文提出了一种优化的协同过滤推荐模型,在用户最近邻计算时引入项目相关性度量方法,以便使得最近邻用户的选择更准确;此外,在预测评分环节考虑到用户兴趣随时间衰减变化,提出了使用衰减函数来提升评价的时间效应的影响。实验结果表明,本文提出的算法在预测准确率和分类准确率方面均优于基于传统相似性度量的项目协同过滤算法。 相似文献
16.
一种优化的Item-based协同过滤推荐算法 总被引:3,自引:0,他引:3
针对传统的Item-based协同过滤推荐算法在推荐系统应用中存在的不足,提出一种优化的Item-based协同过滤推荐算法.从项目相似性计算,项目近邻选取和预测评分计算三个方面对算法进行了优化,使计算结果更具有实际意义和准确性.实验结果表明,提出的算法可解决传统方法中由于数据稀疏所导致的相似性度量不准确的问题,并显著地提高了算法的推荐精度. 相似文献
18.
19.