共查询到10条相似文献,搜索用时 15 毫秒
1.
2.
为解决中文字符串匹配精度较低的问题,提出了一种基于编辑距离和相似度改进的汉字字符串近似匹配算法,针对汉字字符串特点,使用汉字拼音和五笔编码计算;通过改进动态规划算法,能够有效提高编辑距离的计算准确度以及执行效率;再引入考虑交换问题的归一化算法,以语义编辑距离与长句长度的比值作为归一化结果,以此来提高近似匹配算法的准确度。实验结果表明,改进后算法计算的相似度质量要优于改进前的算法结果,且对提高算法效率和查全率、查准率和时间性能等指标均有明显改善,证明该算法的可行性和有效性。 相似文献
3.
4.
谱聚类算法通常是采用高斯核作为相似性度量,并利用所有可用的特征来构建具有欧氏距离的相似度矩阵,数据集复杂度会影响其谱聚类性能,因此该文提出一种基于公理化模糊子集(AFS)的改进谱聚类算法。首先结合AFS算法,利用识别特征来衡量更合适的数据成对相似性,生成更强大的亲合矩阵;再有效地利用Nystr?m采样算法,计算采样点间以及采样点和剩余点间的相似度矩阵去降低计算的复杂度;最后通过在不同数据集以及图像分割上进行实验,证明了提出算法的有效性。 相似文献
5.
在云存储中,如何有效地调度用户请求到目标磁盘以实现绿色节能存储是一个热点问题.鉴于云存储对节能调度算法提出的新要求,如请求响应时间敏感与对动态优化的限制等,本文提出了一种基于布局的虚拟磁盘节能调度方法.该方法将磁盘阵列动态划分为工作区与就绪区,以工作区为主向用户分发资源,并以未连接虚拟机的虚拟磁盘为单位,根据实时负载情况对虚拟磁盘布局进行动态优化.实验结果表明,这种方法不仅能够降低磁盘阵列的能耗,而且能够有效地缓解响应时间延长的问题,还能够使虚拟磁盘布局达到更高的负载均衡水平. 相似文献
6.
7.
累进式空间连接查询广泛应用于空间数据集成、在线空间聚集查询系统中.本文提出一种高效的累进式空间连接查询处理算法,在现有累进式等值连接查询处理框架之上增加空间连接处理策略,使之适于处理空间连接查询;提出一种基于驻留度的动态同步替换策略处理内存溢出,提高了驻留内存空间对象的利用率;还提出了一种基于BEA的不完全连接查询处理算法有效减少磁盘连接计算冗余的I/O和CPU计算代价.实验表明,所提出的算法明显优于现有累进式空间连接查询处理算法. 相似文献
8.
提出一种基于子空间特征向量的三维点云相似性分析算法。首先,获取两个物体的三维点云数据,并进行位置标准化。其次,利用最小子空间分割算法将两个三维点云分别分割成若干子空间。随后,计算子空间的质心到其拟合曲面的距离和夹角,并基于上述距离和夹角构成的向量空间,提取子空间特征向量。最后,通过特征向量间的相似度计算来评价两个三维点云的相似性。由于该方法将描述三维形体特征的子空间特征向量作为相似度度量的依据,所以具有数据量小、精度高的特点。实验表明,该算法能够定量地分析两个三维物体的相似性。 相似文献
9.
提出了一种有效的增量式关联规则挖掘算法IAR,算法的特点在于:提出并采用了基于候选项集个数上阶的选择扫描数据库的机制,可有效减少数据库的扫描次数;算法是一种通用的增量式算法,提出了最小支持度和数据库均改变时,增量式挖掘中的重要性质,从而可充分利用上一次挖掘的结果,有效减少候选项集的数目.并且提出了基于组合数学和项集等价类理论的计算候选项集个数的上阶的方法.通过大量的数据实验,表明算法的效率比已有的算法有了很大提高. 相似文献
10.
空间数据集中的点普遍由空间信息及描述文本信息组成.空间近似关键字反远邻查询(Approximate String Reverse Furthest Neighbors Search,ASRFNS)问题是在一个空间数据集中搜索所有以给定查询点为最远邻,且满足文本相似度条件的目标.基于现有的空间反远邻查询算法以及近似关键字查询算法,我们提出了两个基本的解决算法:凸包最远单元交集(CHFCsJoin)算法和凸包最远单元近似字符串串行查询(CHFCASSS)算法;我们又设计了一种包含空间和关键字信息的外存索引结构Filter-Rtree,并给出了相应的凸包最远单元过滤R树(CHFilterRtree)高效算法.通过真实数据集的实验测试,验证这三种算法的有效性,并分析比较了其性能与效率. 相似文献