首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 194 毫秒
1.
针对工业过程数据固有概念漂移特性导致软测量模型性能恶化、需识别漂移样本以有效更新模型等问题,提出一种面向工业过程难测参数建模的双窗口概念漂移检测方法.首先,在离群样本检测窗口采用支持向量回归获得实时过程数据中包含的离群样本;接着,在分布检测窗口计算离群样本与历史样本集间的欧氏距离;最后,结合多种分布检验方法,新定义能够表征离群样本蕴含分布变化的检验漂移度指标,进而实现漂移样本的有效识别.采用合成和真实工业过程数据集验证了所提方法的有效性,表明具有优于已有方法的性能.  相似文献   

2.
基于更新样本智能识别算法的自适应集成建模   总被引:1,自引:0,他引:1  
汤健  柴天佑  刘卓  余文  周晓杰 《自动化学报》2016,42(7):1040-1052
选择表征建模对象特性漂移的新样本对软测量模型进行自适应更新,能够降低模型复杂度和运行消耗,提高模型可解释性和预测精度.针对新样本近似线性依靠程度(Approximate linear dependence, ALD)和预测误差(Prediction error, PE)等指标只能片面反映建模对象的漂移程度,领域专家结合具体工业过程需要依据上述指标和自身积累经验进行更新样本的有效识别等问题,本文提出了基于更新样本智能识别算法的自适应集成建模策略.首先,基于历史数据离线建立基于改进随机向量泛函连接网络(Improved random vector functional-link networks, IRVFL)的选择性集成模型;然后,基于集成子模型对新样本进行预测输出后采用在线自适应加权算法(On-line adaptive weighting fusion, OLAWF)对集成子模型权重进行更新,实现在线测量阶段对建模对象特性变化的动态自适应;接着基于领域专家知识构建模糊推理模型对新样本相对ALD(Relative ALD, RALD)值和相对PE(Relative PE, RPE)值进行融合,实现更新样本智能识别,构建新的建模样本库;最后实现集成模型的在线自适应更新.采用合成数据仿真验证了所提算法的合理性和有效性.  相似文献   

3.
基于集成学习的半监督情感分类方法研究   总被引:1,自引:0,他引:1  
情感分类旨在对文本所表达的情感色彩类别进行分类的任务。该文研究基于半监督学习的情感分类方法,即在很少规模的标注样本的基础上,借助非标注样本提高情感分类性能。为了提高半监督学习能力,该文提出了一种基于一致性标签的集成方法,用于融合两种主流的半监督情感分类方法:基于随机特征子空间的协同训练方法和标签传播方法。首先,使用这两种半监督学习方法训练出的分类器对未标注样本进行标注;其次,选取出标注一致的未标注样本;最后,使用这些挑选出的样本更新训练模型。实验结果表明,该方法能够有效降低对未标注样本的误标注率,从而获得比任一种半监督学习方法更好的分类效果。  相似文献   

4.
在线KPLS建模方法及在磨机负荷参数集成建模中的应用   总被引:5,自引:0,他引:5  
针对过程非线性、基于历史数据构建的离线模型泛化性差以及基于滑动窗口 和每样本递推更新的在线建模方法难以均衡建模精度和建模速度等问题, 提出了一种在线 核偏最小二乘(On-line kernel partial least squares, OLKPLS)建模方法. 该方法依据新样本与建模样本间的近似线性依靠(Approximate linear dependence, ALD)值和代表工业过程特性漂移幅度的 阈值, 选择有价值样本更新KPLS模型, 并采用合成数据和Benchmark平台数据对该方法进 行了仿真验证. 针对基于离线历史数据建立的融合多传感器信息的磨机负荷参数集成模型难以适应磨 矿过程时变特性的问题, 提出了基于OLKPLS和在线自适应加权融合算法的在线集成建模方 法, 并通过实验球磨机的实际运行数据仿真验证了方法的有效性.  相似文献   

5.
针对流程工业中工况改变易导致当前样本与历史样本分布失配,传统软测量模型失准的问题,考虑工业数据时序性、动态性以及存在过程漂移等特性对建模的影响,提出一种基于迁移子空间学习的偏最小二乘回归软测量方法.首先,回归框架采用非线性迭代偏最小二乘方法,对其求解映射向量的目标函数施加基于子空间重构的域适应正则项,映射过程中保证当前工况中每个样本能够被历史工况样本线性重构.在此基础上对重构矩阵施加低秩稀疏约束,保持数据结构的同时使重构矩阵具备块状结构以应对过程漂移特性.将所提出方法在1个数值案例和3个不同的多工况数据集中进行实验,并与现有域适应回归方法进行对比分析.实验表明,所提出方法能够有效提高模型在跨工况条件下的预测精度,减少工况间数据分布差异对模型性能的影响.  相似文献   

6.
基于数据驱动的软测量模型广泛用于工业过程中产品质量与环保指标等难测参数的在线测量,该过程中存在的概念漂移问题易导致模型精度下降.如何有效识别过程概念变化并精准检测漂移样本是提高模型测量性能的关键.本文总结并分析目前漂移检测的研究思路与进展,为面向工业过程软测量的漂移检测算法提供设计指导.首先,介绍了概念漂移的通常定义与其在工业过程中的表现形式;然后,从检测依据与检测对象两个视角分析了目前具有代表性的检测方法;接着,讨论了这些算法的技术特点和当前工业领域的研究难点;最后,展望了未来的研究方向.  相似文献   

7.
缩略词拓展解释识别任务中标注样本较少,无法从中总结出全面的规则或采用有监督的学习方法来学习.为此,提出一种基于半监督条件随机场(CRF)的缩略词扩展解释识别模型,利用广泛的未标注样本和较少的标注样本寻找序列文本中恰当的语句,以解释给定的缩略词.使用较少的标注序列样本训练一个全监督CRF模型,针对未标注序列样本,采用最小序列熵学习样本之间的联系,结合标注样本和未标注样本,利用半监督自学习方法学习两者的关系.实验结果表明,该模型的序列F1值达到84.73%,高于支持向量机和全监督CRF基准算法.  相似文献   

8.
情感分类是目前自然语言处理领域的一个热点研究问题。该文关注情感分类中的半监督学习方法(即基于少量标注样本和大量未标注样本进行学习的方式),提出了一种新的基于动态随机特征子空间的半监督学习方法。首先,动态生成多个随机特征子空间;然后,基于协同训练(Co-training)在每个特征子空间中挑选置信度高的未标注样本;最后使用这些挑选出的样本更新训练模型。实验结果表明我们的方法明显优于传统的静态产生方式及其他现有的半监督方法。此外该文还探索了特征子空间的划分数目问题。  相似文献   

9.
针对基于图的半监督学习方法在多媒体研究应用中忽略视频相关性的问题,提出了一种基于相关核映射线性近邻传播的视频标注算法.该算法首先通过核函数按照半监督学习调整后的距离计算出迭代标记传播系数;其次利用传播系数求得表示低层特征空间的样本,再根据视频相关性建模构造出语义概念间的关联表;最后完成近邻图的构造,并利用已标注视频信息迭代传播到未标注视频中,完成视频标注.实验结果表明,该算法不仅可以提高视频标注的准确度,还能弥补已标注视频数据数量的不足.  相似文献   

10.
基于多学习器协同训练模型的人体行为识别方法   总被引:1,自引:0,他引:1  
唐超  王文剑  李伟  李国斌  曹峰 《软件学报》2015,26(11):2939-2950
人体行为识别是计算机视觉研究的热点问题,现有的行为识别方法都是基于监督学习框架.为了取得较好的识别效果,通常需要大量的有标记样本来建模.然而,获取有标记样本是一个费时又费力的工作.为了解决这个问题,对半监督学习中的协同训练算法进行改进,提出了一种基于多学习器协同训练模型的人体行为识别方法.这是一种基于半监督学习框架的识别算法.该方法首先通过基于Q统计量的学习器差异性度量选择算法来挑取出协同训练中基学习器集,在协同训练过程中,这些基学习器集对未标记样本进行标记;然后,采用了基于分类器成员委员会的标记近邻置信度计算公式来评估未标记样本的置信度,选取一定比例置信度较高的未标记样本加入到已标记的训练样本集并更新学习器来提升模型的泛化能力.为了评估算法的有效性,采用混合特征来表征人体行为,从而可以快速完成识别过程.实验结果表明,所提出的基于半监督学习的行为识别系统可以有效地辨识视频中的人体动作.  相似文献   

11.
针对复杂工业过程的非线性、变量间的强相关性以及工况时变的特点,提出了一种基于局部KPLS特征提取的LSSVM建模方法。该方法通过属性加权的欧式距离指标选取局部训练样本子集,利用KPLS算法对该子集进行特征提取,使用LSSVM算法在线建立局部软测量模型。实验结果表明,该方法可以有效实现特征提取,具有更好的推广能力和预测精度,比基于全局KPLS特征提取的LSSVM模型和未经特征提取的全局LSSVM模型具有更好的泛化能力。  相似文献   

12.
二噁英是城市固废焚烧过程排放的痕量有机污染物.受限于相关技术的复杂度和高成本,二噁英排放浓度检测的大时滞已成为制约城市固废焚烧过程优化控制的关键因素之一.虽然具有低成本、快响应、高精度等特点的数据驱动软测量模型能够有效解决上述问题,但二噁英建模方法必须要契合数据的小样本、高维度特性.对此,提出了由特征映射层、潜在特征提取层、特征增强层和增量学习层组成的宽度混合森林回归软测量方法.首先,构建由随机森林和完全随机森林构成的混合森林组进行高维特征映射;其次,依据贡献率对全联接混合矩阵进行潜在特征提取,采用信息度量准则保证潜在有价值信息的最大化传递和最小化冗余,降低模型的复杂度和计算消耗;然后,基于所提取潜在信息训练特征增强层以增强特征表征能力;最后,通过增量式学习策略构建增量学习层后采用Moore-Penrose伪逆获得权重矩阵.在基准数据集和城市固废焚烧过程二噁英数据集上的实验结果表明了方法的有效性和优越性.  相似文献   

13.
在开放环境下,数据流具有数据高速生成、数据量无限和概念漂移等特性.在数据流分类任务中,利用人工标注产生大量训练数据的方式昂贵且不切实际.包含少量有标记样本和大量无标记样本且还带概念漂移的数据流给机器学习带来了极大挑战.然而,现有研究主要关注有监督的数据流分类,针对带概念漂移的数据流的半监督分类的研究尚未引起足够的重视....  相似文献   

14.
映射域漂移和偏见性预测问题使得现有的方案无法很好地应对广义零样本学习挑战.在CADA-VAE模型的基础上,提出了基于模态融合的半监督学习方案,就如何利用未标注样本及语义辅助模型进行模态内自学习提供了一种思路.该方案使用潜层向量空间作为视觉和语义模态融合的桥梁,提出了视觉质心和异类语义潜层向量概念,用以指导模态间互学习;...  相似文献   

15.
卷积神经网络(CNN)在半监督学习中取得了良好的成绩,其在训练阶段既利用有标记样本,也利用无标记样本帮助规范化学习模型。为进一步加强半监督模型的特征学习能力,提高其在图像分类时的性能表现,本文提出一种联合深度半监督卷积神经网络和字典学习的端到端半监督学习方法,称为Semi-supervised Learning based on Sparse Coding and Convolution(SSSConv);该算法框架旨在学习到鉴别性更强的图像特征表示。SSSConv首先利用CNN提取特征,并对所提取特征进行正交投影变换,下一步通过学习其稀疏编码的低维嵌入以得到图像的特征表示,最后据此进行分类。整个模型框架可进行端到端的半监督学习训练,CNN提取特征部分和稀疏编码字典学习部分具有统一的损失函数,目标一致。本文利用共轭梯度下降算法、链式法则和反向传播等算法对目标函数的参数进行优化,将稀疏编码的相关参数约束于流形上,CNN参数既可定义在欧氏空间,也可以进一步定义在正交空间中。基于半监督分类任务的实验结果验证了所提出SSSConv框架的有效性,与现有方法相比具有较强的竞争力。  相似文献   

16.
为了充分利用工业过程中大量无标签样本信息,并减少过程的不确定因素对无标签样本质量的影响,提出一种助训练框架下的半监督孪生支持向量回归软测量建模方法。采用孪生支持向量回归机构建主学习器,对高置信度无标签样本添加伪标签;同时,基于K近邻算法构建辅学习器,最大化学习器在近邻样本集上的均方误差,经过此项指标筛选后的待处理样本集包含了更多的数据信息;主、辅学习器二者相辅相成,一定程度上提高了模型的泛化性;再利用所构建的助训练框架提高样本利用率后得到预测模型,实现对无标签样本信息的充分挖掘。通过对脱丁烷塔工业过程中的实际数据进行建模仿真,所得结果表明此模型具有良好的预测性能。  相似文献   

17.
音乐的情感标签预测对音乐的情感分析有着重要的意义。该文提出了一种基于情感向量空间模型的歌曲情感标签预测算法,首先,提取歌词中的情感特征词构建情感空间向量模型,然后利用SVM分类器对已知情感标签的音乐进行训练,通过分类技术找到与待预测歌曲情感主类一致的歌曲集合,最后,通过歌词的情感相似度计算找到最邻近的k首歌曲,将其标签推荐给待预测歌曲。实验发现本文提出的情感向量空间模型和“情感词—情感标签”共现的特征降维方法比传统的文本特征向量模型能够更好地提高歌曲情感分类准确率。同时,在分类基础上进行的情感标签预测方法可以有效地防止音乐“主类情感漂移”,比最近邻居方法达到更好的标签预测准确率。  相似文献   

18.
城市固废焚烧(MSWI)排放的污染物二噁英(DXN)对生态环境与人类健康具有极大危害,其浓度的实时检测对MSWI过程运行优化和城市污染控制至关重要.具有痕量特性的DXN排放浓度不能实时检测,机理模型难以构建,并且其与过程变量间的映射关系复杂.针对上述问题,本文提出了一种基于特征约简和选择性集成算法的DXN排放浓度软测量...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号