首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 62 毫秒
1.
随着垃圾邮件逐渐成为网络用户的一大困扰,垃圾邮件过滤技术的研究显得越来越重要。针对电子邮件存在数据极度稀疏性、高特征维数和多重相关性等特点,本文提出了一种基于偏最小二乘原理的特征抽取方法,可以通过对原始特征进行线性组合抽取出既可反映邮件内容又可反映邮件类型的潜在语义特征,并可解决多重相关性问题。在Enron-Spam邮件数据集上的实验结果表明,同χ2特征选择方法相比,该方法在较低维数上可以获取良好的邮件过滤性能。  相似文献   

2.
郭辉  刘贺平 《信息与控制》2005,34(4):403-407
提出了用核的偏最小二乘进行特征提取.首先把初始输入映射到高维特征空间,然后在高维特征空间中计算得分向量,降低样本的维数,再用最小二乘支持向量机进行回归.通过实验表明,这种方法得到的效果优于没有特征提取的回归.同时与PLS提取特征相比,KPLS分析效果更好.  相似文献   

3.
王海燕 《计算机仿真》2012,29(11):323-326,394
研究了线损率预测问题。由于影响线损率的因素间存在着复杂的非线性和强相关性,一般方法难以得到较高精度的预测结果。针对线损率的特点,为了提高预测精度,本文首次将核偏最小二乘回归算法应用于线损率预测。先以历年来的线损率及其相关数据为样本建立预测模型,然后对预测年线损率进行预测。以某电网为实例进行仿真,并将仿真结果与其他方法所得到的仿真结果进行比较。结果表明基于核偏最小二乘回归分析的线损率预测具有较高精度,能较好地克服变量相关性和非线性因素对预测模型的不利影响,为电力企业制订科学合理的线损率计划提供理论依据。  相似文献   

4.
基于偏最小二乘的支持向量机多分类方法   总被引:1,自引:0,他引:1       下载免费PDF全文
该文提出了一种基于偏最小二乘(PLS)的支持向量机(SVM)多分类方法,该算法利用偏最小二乘思想对样本进行预处理,消除了样本属性之间的相关性,而且得到的综合属性与类信息的相关程度达到最大。通过实验可以看出,该方法不仅可以减少用支持向量机进行分类过程中的支持向量数目,而且当样本属性较多时,可以提高一定的识别率。  相似文献   

5.
传统KPLS在构造输入变量与输出变量时未考虑样本间的动态特性,使故障样本信息易被其他样本掩盖;同时,KPLS未考虑所有变量对故障样本的影响,使变量间隐藏信息不能被完全表达。针对以上问题,提出一种基于全相关动态KPLS(all correlated dynamic KPLS,ADKPLS)的非线性工业过程故障诊断方法。该方法首先对原始数据进行动态特征分析研究,使组成的数据矩阵能很好地反映变量间的动态关系。然后分析证明了KPLS中输出变量的变化会影响到输入残差空间,设计一个输出变量辅助矩阵,表征输入变量与输出变量的全相关性。最后,采用基于输入变量与输出变量之间的全相关信息构建贡献图以识别故障源变量。与KPLS相比,在输入和输出变量之间建立了更直接的关系。在抽油机生产过程上的仿真结果表明,所提方法具有良好的故障检测与识别性能。  相似文献   

6.
基于核偏最小二乘的锌层重量预测模型   总被引:3,自引:0,他引:3  
姚林  阳建宏  何飞  徐金梧 《控制工程》2008,15(2):154-158
为了给带钢热镀锌生产的质量控制提供必要的决策支持和分析手段,针对气刀对锌层重量的控制工艺,提出了基于核偏最小二乘回归的锌层重量预测模型。利用核函数将低维空间的非线性回归转化为高维空间的线性回归,克服了实际生产工艺中非线性因素对预测模型的不利影响。应用鞍山钢铁集团公司带钢热镀锌的生产实际数据进行验证,结果表明,基于核偏最小二乘的锌层重量预测方法与线性偏最小二乘、BP神经网络等方法相比,具有更好的预测精度。  相似文献   

7.
基于语义理解的垃圾邮件过滤处理研究   总被引:1,自引:0,他引:1  
文章基于统计和基于规则的垃圾邮件过滤技术,将语义理解的研究和垃圾邮件过滤算法的研究结合起来,构建一个通过语义理解对垃圾邮件进行过滤的模型,并提出一种改进的分词算法,提高了分词的效率、准确率和识别未登录词的能力。最后通过实验数据可知,基于语义理解的过滤模型,在一定程度上解决了邮件过滤中遇到的词的“拆解”的问题、分词后所遇到的未登录词的问题,为垃圾邮件过滤提供了有益的探索。  相似文献   

8.
偏最小二乘算法(PLS)是常用的线性光谱建模方法。针对汽油在线调合中具有非线性特点的辛烷值、干点等属性应用PLS方法建立模型误差较大问题,本文提出了残差-递阶偏最小二乘的建模方法,该方法对已经提取成分后的自变量中剩余的信息再提取主成分,并将该主成分作为新的自变量参与回归建模。仿真验证结果表明:残差-递阶偏最小二乘方法建立的模型中验证集的样本数据误差均在正负0.2之间。残差-递阶偏最小二乘方法与偏最小二乘、递阶偏最小二乘叫-PLS)两种方法比较,残差-递阶偏最小二乘建立的模型有的更高的精度和模型适应性。  相似文献   

9.
杨慧中  陈定三 《控制工程》2011,18(6):886-889
为改善软测量模型精度,提出了一种局部惩罚加权核偏最小二乘算法.该方法通过核映射将原始输入映射到高维特征空间实现对非线性问题的线性化处理,并通过偏最小二乘算法进行主成分提取,降低数据维数;对由主成分构成的新数据集,依据局部学习思想构建局部惩罚加权最小二采回归模型,降低模型对异常数据的敏感度、优化模型参数.鉴于多模型可以改...  相似文献   

10.
作战飞机效能的预测是防空作战中的重要问题,简述了效能预测的各种方法.分析了影响飞机效能的参数,提出用最小二乘回归方法来预测飞机效能值.该方法对变量进行主成分分析、典型相关分析和多元线性回归,在处理存在多重线性相关的小样本多元数据方面效果很好.通过实例与神经网络法的结果进行了比较,结果表明偏最小二乘回归更精确和简单.  相似文献   

11.
为了解决非线性系统参数不确定和噪声信息不准确导致EKF随时序估计误差较大的问题,利用核偏最小二乘法与系统方程参数和噪声信息无关的特点优化EKF。先将量测数据和EKF的收敛估计作为学习样本,建立KPLS预测模型,然后,融合KPLS和EKF的预测值进行状态估计;同时,若状态估计的收敛判据为真,将估计值作为学习样本,并利用滑动窗口更新KPLS核矩阵,使KPLS能时序预测;若收敛判据为假,则更新量测协方差。最后,通过实验仿真的方法,分析KPLS-EKF算法的收敛性和性能。实验结果表明:KPLS-EKF能够有效地解决非线性系统参数和噪声信息不准确导致的EKF误差较大的问题。  相似文献   

12.
垃圾邮件过滤就是在线对邮件做出Spam(垃圾)或Ham(非垃圾)的判断,这是一种根据客户反馈不断自学习的过程。本文抽取邮件的语言特征和行为特征构建多个简单过滤器,然后采用集成学习方法组合这些简单过滤器,获得了比简单过滤器更高的性能。实验表明单一特征学习的计算复杂性低、速度较快,而集成学习的效果更好。本文提出的将SVM集成学习用于邮件过滤的方法,在各种集成学习方法中效果最好。
  相似文献   

13.
垃圾邮件过滤具有处理规模巨大,数据无限递增、动态变化等流数据特征,传统的垃圾邮件过滤方法利用静态的文本特征提取方法,无法体现流数据特征随时间动态变化的特点。该文提出一种基于时间流特性来实时调整有效特征的垃圾邮件过滤方法,在TREC Spam Track语料集上的测试结果表明,该方法在保证垃圾邮件过滤高准确率的同时,使垃圾邮件过滤计算的时间性能和空间性能更加优化。
  相似文献   

14.
基于协同过滤的垃圾邮件过滤系统   总被引:1,自引:0,他引:1       下载免费PDF全文
许志佴  邹恒明 《计算机工程》2008,34(23):153-154
针对当前垃圾邮件过滤技术中邮件性质评价难及邮件附件判断难的问题,提出协同过滤模型,设计一个多层次垃圾邮件过滤系统。该系统针对垃圾邮件一般群发给多人的特点,提取用户的操作和阅读速度进行反馈,利用他人的反馈结果进行协同过滤。实验和分析结果表明,协同过滤技术有效地提高了垃圾邮件过滤的召回率。  相似文献   

15.
图像型垃圾邮件过滤技术研究综述   总被引:1,自引:1,他引:0  
首先概述了图像型垃圾邮件的基本概念;其次根据不同的标准对图像型垃圾邮件过滤技术进行了分类,并评述了各种图像型垃圾邮件过滤方法和技术;对已经用于图像型垃圾邮件分类的两类共五种分类算法进行了理论分析与效果比较;最后对图像型垃圾邮件过滤技术的研究方向进行了展望.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号