首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 390 毫秒
1.
针对协同过滤算法存在用户兴趣不易捕捉的问题,提出了一种基于用户兴趣偏移和项目自身属性特征的个性化推荐算法。利用滑动时间窗内项目属性和用户评分建立出用户兴趣偏爱因子,通过推荐项目自身属性特征给出用户对项目的偏爱度;最后结合项目偏爱度和协同过滤算法中预测评分产生推荐。实验结果表明,该算法准确反映出用户兴趣的偏移和项目自身属性特征,在推荐质量上也得到提高。  相似文献   

2.
为了使孤立点检测更为自动化,减少用户对参数选择的困难,提出了平均密度的定义,并给出基于平均密度的孤立点检测方法。该方法提出了孤立点对象的密度要小于数据集的平均密度;非孤立点对象的密度不应因为封闭区间的收缩而减少。采用企鹅图像边缘检测对该方法进行验证,实验结果表明,该方法能够有效地检测出图像边缘孤立点,同时简化了孤立点检测时对用户输入参数的要求。  相似文献   

3.
基于网格的参数自动化聚类算法   总被引:9,自引:1,他引:9  
提出了一种基于网格的参数自动化聚类算法PAG,主要目的是解决传统的网格聚类算法对参数敏感的问题.算法采用参数自动化技术来处理参数,即算法开始运行时所需的参数直接由参数自动化技术中的公式计算得出,不需要用户输入任何参数.通过对大量数据集的实验表明,该算法可扩展性好,能处理任意形状和大小的聚类,能够很好地识别出孤立点或噪声,并且有很好的精度.  相似文献   

4.
针对传统异常用电行为识别方法准确率低、时效性差且人工消耗较高等问题,提出了一种基于粒子群算法的改进孤立森林识别方法。该方法通过总结异常用电行为规律,重构相关行为的特征指标,并侧重于对异常样本的学习与训练,进而在集成算法套袋思想的基础上构建了孤立森林。同时利用粒子群算法的群集寻优能力选择出精准度较高、差异度较大的孤立树形成子集,进一步优化了异常用电行为的识别效果。实验结果表明,改进方法的AUC值和识别效率均高于聚类算法及孤立森林算法,能够对异常用电行为进行准确识别。  相似文献   

5.
针对目前商品简单的排序结果无法满足用户需求的情况,提出了一种改进的基于商品属性权重的多级匹配算法.算法根据用户对商品不同属性的重视程度,预先设置属性权重,然后再结合传统多级匹配算法对商品进行重新排序.理论分析和实验结果表明该算法能够满足不同用户的需求,在实际应用方面具有优越性.  相似文献   

6.
通过分析蛛网态微博关系网的特点,指出识别蛛网态微博关系网中有影响力用户的重要意义.重点探讨微博用户自身属性对用户影响力的作用,结合PageRank算法原理,提出一种蛛网态微博关系网中有影响力用户发现方法 (Influential User Discovering Algorithm,IUDA),并基于新浪微博的真实用户数据将该方法与另外两种方法进行对比实验.结果显示,结合用户本身影响值的IUDA方法可以更高质量地发现蛛网态微博网中有影响力用户,客观反映用户的影响力.  相似文献   

7.
为了减少语音识别时间,降低系统资源耗费,提出一种针对非特定人、孤立词、大词汇量的语音分组识别算法.运用K均值聚类算法对语音分组,并对语音分组特征进行置信度检验,使分组稳定,保证分组后识别率不下降.通过对非特定人孤立词的语音识别的实验,证实了该方法的有效性.  相似文献   

8.
针对聚类中广泛应用的经典k均值算法随机选择初始质心和易受孤立点影响的不足,给出了二次改进的k均值算法。首先使用距离法移除孤立点,然后采用邻近吸收法对初始聚类中心的选择进行改进,并做了改进前后的对比实验。结果表明,改进后的算法比较稳定、准确,受孤立点和随机选择质心的影响也有所降低。  相似文献   

9.
为保证血氧仪测试的精确性,针对血氧仪信号抗干扰性差的问题,分析了影响血氧饱和度测量中的各种因素,构建了典型的测量电路,利用电路参数的模糊控制方法,对电路参数进行有效的控制,给出了一种从测量信号识别脉搏波形并计算出脉率的有效算法。实验表明该识别算法较常规算法具有更高的可靠性。  相似文献   

10.
孤立点检测是数据挖掘的重要分支之一,旨在发现一个数据集中与多数对象行为明显不同的一些对象.针对分类型矩阵数据,通过给出一种矩阵对象自身的内聚度和该矩阵对象与其他矩阵对象之间的耦合度,定义了矩阵对象的孤立因子,提出一种面向分类型矩阵数据的孤立点检测算法.在Market basket、Microsoft web和MovieLens真实数据集上的实验结果表明,与基于共同近邻(common-neighbor-based,CNB)算法、局部异常因子(local outlier factor,LOF)算法和基于信息熵(information entropy-based,IE-based)的算法相比,本算法能有效检测分类型矩阵数据中的孤立点.  相似文献   

11.
针对智能电网监控传输协议、计算处理效率和异常数据检测等存在的不足,提出了一种基于数据标签的SEG监控架构和异常数据检测算法。先对SEG数据标签监控与异常检测的框架进行设计;然后对异常检测流程、稀疏化与精简算法和检测算法进行设计,提出一种基于数据标签的数据精简和异常检测算法;最后进行SEG数据标签监控实例分析和对比仿真实验。通过实验,本文所设计的数据标签SEG监控与异常数据检测,其异常数据检测的准确率大于80%和召回率高于82%,而算法运行时间较参比算法少2.0-3.0秒。  相似文献   

12.
本研究结合信息熵与粗糙集理论中的属性约简技术,提出了一种新颖的离群点检测算法。这种方法通过在更小的属性子空间去获得相同或相近的离群数据集,使对离群数据的分析更加集中于较小的目标域。该算法对原属性空间进行划分,通过分析计算将具有最大相对熵与负相对势的对象集合判定为离群点集合。为了验证算法的有效性,还在通用数据集上进行了测试,理论分析和实验结果表明该离群点检测算法是有效可行的。  相似文献   

13.

基于CLOF的乙烯裂解炉温度测量数据异常值检测

辛一丹1,胡绍林1,2,陈文卓1,宋鹤1

(1. 西安理工大学 自动化与信息工程学院,西安710048;

2. 广东石油化工学院 自动化学院石油化工设备与故障诊断省级重点实验室,广东 茂名525000)

摘要:

烟道温度是表征乙烯裂解炉燃烧状态的重要指标之一,温度采样数据异常值会直接影响裂解炉炉管结焦诊断。使用常规异常检测算法如孤立森林算法对烟道温度测量数据进行异常值检测无法检测出所有的异常值。为提高检测准确率同时降低运算量,本文提出一种基于CLOF(Clipping Local Outlier Factor, CLOF)算法的烟道测量数据异常值检测算法,该算法将聚类剪枝与离群因子检测算法相结合,在原始数据中筛选出异常值候选集,对异常值候选集中的数据点进行离群因子检测,实现了对裂解炉烟道温度测量数据高准确率、高效率异常值检测。采用某石化工厂乙烯裂解炉烟道温度实测数据,根据实验效果对CLOF算法中主要参数进行选定,对比分析孤立森林算法、常规LOF算法与CLOF算法异常值检测效果。结果显示,CLOF算法中合适的裁剪系数能显著提高检测效率与检测准确度,相比孤立森林算法的异常值检测结果,CLOF检测结果的准确率大幅提高,数据计算量也显著减少。

关键词:温度数据;异常检测;乙烯裂解炉;聚类;数据减枝;局部离群因子

  相似文献   

14.
为了解决大规模数据中的异常检测问题,提出了基于支持向量数据描述(SVDD)的高效离群数据检测算法。该算法的核心思想为:首先利用SVDD获得包含单类数据的最小球形边界,然后通过该边界对未知样本数据进行分类,并利用最小闭包球算法对SVDD分类器进行优化求解。在UCI机器学习数据集和入侵检测数据集上将该算法与其他离群数据检测算法进行了实验比较,结果表明,该算法不仅获得了更高的检测准确率,而且具有较低的运行时间。  相似文献   

15.
客户价值的分析在现代企业中起着重要的作用,而分类算法在分析客户价值上是卓有成效的。决策树算法是分类算法中一类重要的算法,其中以C4.5算法最为流行,但是这种算法准确率性能方面还不是很理想。在C4.5算法的基础之上引入推进技术,改善了C4.5算法的准确率性能。实验证明,用改进后的C4.5算法分析超市客户数据,其算法的准确率高于原算法,增强了决策的可信度。  相似文献   

16.
提出了一种基于空间相邻关系的点对象离群检测算法SAOD(Space Adjacent Relations Based GML Point Outlier Detection Algorithm).利用空间相邻关系作为空间点对象的相似度度量准则,得到相似度矩阵,从而挖掘GML中的离群点对象.实验结果表明,SAOD算法能有效地检测GML中的离群点对象并且具有较高的效率.  相似文献   

17.
完善大客户的绩效考核制度,是目前电信公司大客户营销服务体系建设的一项重要内容。文章在分析完善电信大客户营销绩效考核制度的现实意义的基础上,剖析了当前电信大客户营销绩效考核制度存在的主要问题,即绩效考核指标复杂、收入全额挂钩考核引起的收入分配差距过大、业务发展分值占比过小、大客户经理职业发展通道不明确等。对此,有针对性地提出了完善电信大客户营销绩效考核制度的思路及对策。  相似文献   

18.
一种基于包含关系的空间面对象条件离群检测算法   总被引:1,自引:0,他引:1  
提出了一种基于包含关系的空间面对象条件离群检测算法DCOP-IR(detecting conditional outlier polygons based on inclusion relations),该算法针对空间面对象的包含关系和非空间属性,定义了一种相似度度量方法,利用基于密度的离群查找算法,先检测出整体的空间离群对象,然后在一定的条件属性下检测空间条件离群对象。实验结果表明,算法DCOP-IR能准确地检测出满足一定条件属性的空间离群对象,并具有较高的效率。  相似文献   

19.
针对大多数基于距离和密度的异常检测算法敏感于近邻参数k的问题,提出了一种鲁棒性异常检测标准——k-近邻域中心偏移异常因子(COOF).数据结点的k-近邻域中心位置会随着近邻参数k的变化而发生迁移,鉴于异常结点要比正常结点对k-近邻域中心位置偏移量的影响更大,通过累加因递增k而产生的偏移量来表征数据结点的异常程度,并在COOF基础上实现了鲁棒性的异常检测算法.通过综合数据和真实数据的实验仿真可知,COOF不仅对近邻参数k具有鲁棒性,而且相比基于距离的k最近邻算法、基于局部距离的异常因子和基于密度的局部异常因子具有更稳定且更准确的异常检测性能.  相似文献   

20.
在当今以客户为中心的供应链中,及时的确定分配方案已成为物流管理的一个重要部分,经典的配送系统大多运用单一分配规则,这一规则假设客户所需商品由与其最近的某一仓库提供[1].文章在分析和总结相关文献的基础上,研究如何在有容量限制的主次仓库间分配客户需求的供应链管理问题,当主仓库不能满足客户需求时,通过一个次仓库弥补主仓库的不足.首先,把该问题构造成一个整数规划模型,其次,运用遗传算法加以解决,算法应用和检验说明了该遗传算法在解决这类问题中的有效性和实用性,在实际的供应链网络设计中有着广泛的应用前景和实际意义.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号