排序方式: 共有70条查询结果,搜索用时 0 毫秒
51.
目的设计基于DTW的高效过滤算法,提高时间序列数据流的过滤查询的效率.方法提出基于DTW的双边界的概念,并在此基础上定义新的更紧密的基于DTW的下界距离.结果实验证明基于DTW双边界的过滤算法在不发生错误丢失的情况下改进了算法的效率.对于模式间差异较大的情况,算法性能更好.结论基于DTW的双边界算法可以有效地过滤时间序列数据流. 相似文献
52.
不同地区的用户兴趣不同,并且当推荐物品具有位置属性时,用户更加倾向于离自身较近的物品。根据用户和物品的位置信息来捕获用户兴趣能有效地提高个性化推荐精度。为了有效处理用户和物品的位置信息,在推荐系统中引入金字塔模型(PS)来实现用户分区和用户旅行代价的计算,提出了基于金字塔模型的协同过滤算法(PMCF),来生成对用户的Top-N物品推荐。使用MovieLens数据集、Foursquare数据集和Synthetic数据集来分别评估算法的有效性,实验表明,所提出的算法的准确度要高于传统的推荐算法。 相似文献
53.
从亚麻产销概况,生物学特性和南方春季的自然条件等方面,结合作者近期的研究,分析了南方春季亚麻开发的必要性和可能性,针对南方春季亚麻生产与纺织开发的制约因素,提出了相应的解决途径。 相似文献
54.
异常点检测是数据挖掘的一个重要研究方向,基于Cell的异常点检测算法生成的Cell(单元)数与维数成指数增长.当生成的单元数增多及数据量增大时,基于Cell的算法不能有效工作.分析发现这些单元中存在很多无用的空单元.本文采用CD-Tree结构对非空单元进行索引,并采用聚簇技术,将每个单元中的数据点存放在同一个磁盘页链中.实验表明,采用CD-Tree以及聚簇技术设计的异常点检测磁盘算法的效率,以及所能处理的数据集维数较原基于Cell的磁盘算法都有显著的提高. 相似文献
55.
推荐系统中,基于聚类的协同过滤推荐算法利用K-means等算法对用户和物品进行聚类,聚类结果里用户或物品只能属于一个类别,然而在实际应用中,一个用户可以有多种兴趣,一个物品也可以属于多个类别。针对上述问题,提出了一种基于谱聚类群组发现的算法,该算法通过谱聚类和C-means聚类得到用户和物品相似度较高的群组以及用户和物品归属于群组的隶属度矩阵,而且用户或物品可以属于多个群组。通过计算用户在各个群组中对物品的偏好值,并结合用户和物品在群组里相应的隶属度来预测用户对物品最终的偏好值,生成对用户的Top-N推荐结果。实验结果表明,与以往推荐算法相比,本方法在降低了数据稀疏性的同时提高了推荐结果的准确率和召回率。 相似文献
56.
CBFrag-Cubing:一种基于压缩位图的高维数据立方创建算法 总被引:1,自引:0,他引:1
数据立方的计算是数据仓库和OLAP研究的一个重要方向,同时又是数据仓库中代价很大的操作。针对在生物信息、统计分析、文本处理等领域中存在的基数较小的高维数据集,X.L.Li等人提出了Frag-Cubing算法。为了提高Frag-Cubing算法的效率,本文提出了基于分片思想的算法CBFrag-Cubing。该算法使用了位图索引结构,优化了数据立方的存储,减少了数据立方的计算时间。实验表明,与Frag-Cubing算法相比,该算法在存储空间上至少节省25%,在计算时间上节省30%。 相似文献
57.
基于签到数据的短时间体验式路线搜索 总被引:5,自引:0,他引:5
路线搜索已经广泛地应用于基于位置的服务和旅游路线推荐等领域.现有的关于路线搜索的研究,通常只考虑景点之间路线的流行程度与用户的需求,因此提供的推荐路线并未考虑景点类别的丰富性,存在类别重复的现象.为了能使用户在短时间内体验所在地区不同类别特色的景点,增强旅游体验效果,文中提出一种新的路线搜索:短时间体验式路线搜索(SERS).该路线搜索方法根据用户给定的查询位置vs、旅行时间限定t以及用户对景点类别选择的集合uc,找到一条非重复多类别且收益最大化的最优景点访问路线.为了有效处理SERS,提出一种预计算结点收益上界值的优化策略,设计了两种优化搜索算法:单收益上界剪枝搜索算法(SUB)和多收益上界剪枝搜索算法(MUB).优化的搜索算法利用收益上界值剪掉了不可能产生结果的分枝,提高了搜索效率.利用Gowalla和Foursquare社交网站真实的签到数据集进行了充分实验,评估了所提出的算法在不同参数设置下的搜索效率,验证了算法的有效性. 相似文献
58.
一种优化的基于网格的聚类算法 总被引:5,自引:0,他引:5
聚类是数据挖掘领域中一个重要的研究课题.与其它算法相比,基于网格的聚类算法可以高效处理低维的海量数据.然而,由于划分的单元数与数据的维数呈指数增长,因此对于维数较高的数据集,生成的单元数过多,导致算法的效率较低.本文基于CD—Tree设计了新的基于网格的聚类算法,该算法的效率远高于传统的基于网格聚类算法的效率.此外,本文设计了一种剪枝优化策略,以提高算法的效率.实验表明,与传统的聚类算法相比,基于CD-Tree的聚类算法在数据集的大小及维度的可伸缩性方面均有显著提高. 相似文献
59.
介绍数据仓库和OLAP技术的基本概念和功能,并给出一个基于Analysis Services的小城镇先进适用技术OLAP系统的实现方案。该系统通过OLAP多维模型的上卷下钻功能,为用户提供先进适用技术与产品信息的查询,为管理者提供对信息的分析和统计。通过本系统,可以更好的将先进适用技术与产品的信息从不同层次提供给用户,并将统计分析的结果展示给管理者,为其提供决策支持,有效地促进小城镇先进适用技术与产品的推广。 相似文献
60.
随着研究生招生规模的不断扩大和大数据技术的广泛应用,为了更好的加强研究生质量监测,建立建全研究生信息服务体系,提出了基于大数据的研究生质量监测与信息服务模型。通过对大数据技术,研究生质量评价和研究生质量信息化的研究,确定了具体的研究方案,利用海量、多源异构的研究生大数据,实现了对研究生质量的有效监测和信息服务平台建设。 相似文献