首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
张天佑  王小玲 《计算机工程》2011,37(14):282-284
针对空间数据集的特性,提出一种基于空间局部偏离因子(SLDF)的离群点检测算法。利用SLDF度量空间点对象的离群程度,计算空间数据集中点对象的SLDF值并对其进行排序,将取值较大的前M个点对象作为空间离群点。实验结果表明,该算法能较好地检测空间局部离群点,其有效性与准确性均优于SLZ算法,适用于高维大数据集的空间离群点检测。  相似文献   

2.
本文提出了一种基于模式匹配的多序列相似性分析方法,该方法将模式匹配应用到序列比对中,采用Kimura双参数模型计算进化矩阵并构造物种进化树,进行相似性分析。实验结果表明该方法的有效性。  相似文献   

3.
针对当前标准对象存储系统的数据对象属性存储和检索方面的不足,结合空间应用数据对象特点,进行了对象属性设计,提出了一种基于HBase数据库的属性管理方法。该方法利用HBase数据库对数据对象及其属性进行集中管理,同时采用分段散列索引实现利用对象属性快速检索对象数据。测试结果表明,基于HBase数据库对象管理方法性能优于现有的属性管理方法,具有较高的对象属性检索效率。  相似文献   

4.
为使汪培庄先生提出的因素空间理论便于应用,和基于该理论对多域值属性影响对象集合进行聚类分析,提出了以研究对象为中心的图形化域值属性表示方法,即属性圆。属性圆可以表示无穷多个域属性对对象的影响。先基于属性圆概念进行对象的相似性分析,后为计算方便将图形定义转化为数值相似性定义,进而研究了对象集合的聚类分析方法。实施的聚类原则为:严格遵照相似与不相似划分,参考模糊相似划分。列举了一个实际电气系统的系统可靠性表述群作为研究对象集合,对表述群进行聚类分析。结果表明:决策集D与对象集U的对应关系说明对对象集的划分就其决策属性而言是非奇异的、准确的。这说明尽管在不同环境下对系统进行了可靠性评价,但是这些评价语义是相对客观的,评价的语义可以相互佐证。  相似文献   

5.
图像中所蕴含的属性对于图像识别有着重要作用,以往的传统分类方法往往忽略了这些特性,为此,提出一种将稀疏表示和属性学习结合用于图像分类的新方法。该方法首先对图像特征进行稀疏分解,利用系数稀疏表示重构图像特征,然后将重构的特征数据用于属性学习,通过属性分类器的训练学习完成对目标图像的属性识别,达到识别出图像种类的目的。在植物数据集上的对比试验证实了该算法的有效性和在识别准确率上相对于传统识别算法的提升。  相似文献   

6.
点、线、面、体是建筑空间组合的基本要素,通过对这些基本要素在建筑平面、立面中的剖析,而更好的理解建筑空间与形式组合的原理。基本元素的构成方式,影响者主宰着建筑的空间与形式,而这种设计语汇的应用与掌握,是设计师更好的理解建筑,创作建筑的关键。  相似文献   

7.
虚拟空间中在线同源用户具有相似行为特征,但现有相似性度量算法难以对其进行有效识别。提出一种基于序列对齐的在线同源用户识别算法,根据在线用户行为日志提取点击流数据,采用序列对齐方法计算在线用户的行为相似度,将其用行为相似度矩阵表示并对用户进行层次聚类,以识别虚拟空间中的在线同源用户,同时分析不同维度的用户特征属性对用户行为相似性的影响程度。实验结果表明,该算法能准确识别出在线同源用户,用户行为相似性受性别、户籍和教育程度3种特征属性影响较大,受年龄、社会阶层和收入水平的影响较小。  相似文献   

8.
With fast development in information times, the database, as the kernel unit of information storage, has been playing an increasingly role in the field of the modern information technology. In this paper, ORACLE storage architecture is analyed from physical and logical aspects. Meanwhile, its object space allocation is also discussed and explained by some examples.  相似文献   

9.
对象定向概念格和属性定向概念格是经典概念格的两种推广模型。首先,利用对象幂集上的一对对偶近似算子分别定义了对象定向概念格和属性定向概念格上的同余关系。其次,分别基于两类同余关系构造了一个内部算子和一个闭包算子,并研究了内部算子与对象定向概念格的关系以及闭包算子与属性定向概念格的关系。最后将对象(属性)定向概念格之间的关系转化为相应的同余关系之间的关系。  相似文献   

10.
针对聚类分析在处理任意形状、任意密度和具有一定结构特征的数据集时存在的不足,首先在数据空间中建立离散拓扑流形,通过在此结构上定义邻域密度相似性和邻域密度变化光滑性两个相对性度量标准,并利用可达性给出样本结构相似性和类结构的定义,证明类结构关系是一个等价关系。然后将结构相似性当作吸引力,设计基于压缩变换的聚类方法,该方法具备处理任意形状、任意密度和解释性好等许多优点。最后在人工数据集和标准数据集上的比较实验结果表明,该方法在聚类效率和有效性上都明显优于其它聚类算法。  相似文献   

11.
为研究多个边坡稳定性情况的分类,提出点化属性圆的多范围属性分类方法。影响边坡稳定性的因素较多,而且这些因素很难使用一个值表示,但通常可方便地表示为具有范围的属性域,为适应该情况提出上述基于属性圆的方法。首先论述了属性圆的基本性质,然后论述了属性圆点化方法、推导过程及性质,最后给出了基于点化属性圆的多范围属性分类方法。使用该方法对十个边坡按照四个属性进行分类。结果表明当阈值为0.09时所有对象均被分类,其中边坡1、3、4、9、10为一组;边坡2、5、8为二组;边坡6、7为三组。最后论述了该方法的误差和影响。  相似文献   

12.
为挖掘存量用户的潜在数据业务使用需求,研究客户细分成为各电信运营商进行差异化营销所必须解决的问题。利用聚类算法提出了一种解决电信短信业务客户分群的应用模型。首先基于因子分析为复杂参数变量下的数据挖掘有效地减少了冗余字段,提高了模型构建的质量和效率,然后通过无监督的K-MEANS分群算法完成分群。经验证,该短信分群模型具备明显的特征差异性。2009年某西部通信企业应用该模型在数据业务差异化营销中取得了明显的效益。  相似文献   

13.
设计了一种对基于XML描述的软件构件进行聚类的算法(即基于模拟退火的构件聚类算法),该算法通过模拟金属退火基本原理对构件库中的软件构件聚类进行全局优化.构件聚类时,根据一般意义的树间编辑距离,提出一种用于判断基于XML描述的构件间是否相似的度量测度(称为XML编辑距离).利用XML编辑距离,可将构件间相似性度量的时间复杂度限制在多项式级,且能保持构件的XML描述文档的节点语义信息和节点间的祖孙嵌套关系.最后,在构件库测试模型上进行实验,结果证实了基于模拟退火的构件聚类算法在构件查询实践中的可行性和有效性.  相似文献   

14.
基于文本分类的文档相似度计算   总被引:1,自引:0,他引:1  
如何从成千上万篇文档中找出与指定文档相似的所有文档,首先要做的第一件事就是判断其类别,也就是分类;在判定类别后,再进一步计算,找出同类中所有与指定文档内容相似的文档。由于文档相似度的计算和文本分类过程很相似,所以可以借助指定文档的分类结果,即类别和文档特征向量值,通过进一步计算与同类中其他文档的相似度值,找出超过阂值的文档,即找出与指定目标内容相似的文档。  相似文献   

15.
在文本无关的说话人确认系统中, 联合因子分析算法以其明确的空间估计方法成为主流的技术手段。然而由于算法流程的限制, 使用该算法得到的说话人空间和信道空间不可避免地产生重叠。为解决空间模型的重叠问题, 文中采用基于信号子空间的空间变换方法, 使空间模型分离。对于NIST SRE 2008核心测试任务中的电话信道注册-电话信道测试, 相对于不采用空间变换的联合因子分析算法, 取得9。2%等错误率的降低。  相似文献   

16.
黄寿孟  高华玲  潘玉霞 《计算机科学》2016,43(Z6):467-470, 507
软件相似性分析算法是为了更好地保护软件的知识产权。此算法并不会加固程序以增加其抵御攻击的能力,而是对两个或两个以上的程序进行比较,判断是否相互包含。该算法有重复代码筛选、软件作者鉴别、软件“胎记”和剽窃检测,它们最本质的操作就是直接处理程序的源码或二进制可执行文件,将其转换成一种更易于处理的表示形式,从而确定两个程序(或者程序片段)之间的相似度,或是其中一个(部分或全部)是否包含了另一个。最后总结出此类算法的通用格式,并对每种算法作出相应的分析综述表。  相似文献   

17.
姜大庆  周勇 《计算机科学》2012,39(11):142-144
针对现有个性化推荐服务系统中用户会话聚类算法存在相似性度量准确性低和需要事先确定聚类数目的问 题,对序化的用户访问页面和对应的访问时间信息进行整合,提出一种基于动态规划算法的全序列比对方法来度量用 户会话的相似性。在此基础上,运用改进的NJ W谱聚类算法对用户会话进行自动谱聚类。实验结果表明,算法充分 考虑了用户会话的整体特征和局部信息,较相关比对算法具有更高的聚类性能,可以提高网站个性化推荐服务的效 率。  相似文献   

18.
针对海量网页数据挖掘问题,提出基于向量空间的网页内容相似计算算法和软件系统框架。利用搜索引擎从海量网页中提取中文编码的网页URL,在此基础上提取网页的中文字符并分析提取出中文实词,建立向量空间模型计算网页内容间的相似度。该系统缩小了需要进行相似度计算的网页文档范围,节约大量时间和空间资源,为网络信息的分类、查询、智能化等奠定了良好的基础。  相似文献   

19.
一种基于语言概念空间聚类的信息检索方法   总被引:2,自引:0,他引:2       下载免费PDF全文
吴晨  张全 《计算机工程》2007,33(8):51-53
提出了一种以语言概念空间中的概念为聚类对象的信息检索方法以及适合于该方法的聚类算法。该聚类算法通过曲线拟合技术来实现文本的自动阈值确定和聚类划分,并最终通过聚类间的迭代和结果修正来完成整个聚类过程。概念的引入为解决词语的同义、多义问题提供了有力保障。实验表明,采用该方法的信息检索系统,与Jelinek-Mercer、k-means模型相比有较高的准确率和召回率,效果理想。  相似文献   

20.
相似性查询在实际应用中用途广泛,例如相似网页检测、相似图像检索、语言识别、数据清理等。而基于q-gram的字符串相似性查询作为主流方法之一.在查询的效率和灵活性上相对于其他方法都有很大的优势。实现基于q-gram的基本过滤器,并构成过滤器组合模型,用来过滤掉不匹配的字符串,得到候选集。实验结果表明,与传统的依靠编辑距离来比较每一对字符串的值相比,基于q-gram的过滤器能在保证相似性查询结果准确的前提下,在效率方面有显著的提升。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号