首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 947 毫秒
1.
传统的“特征脸”和“Fisher脸”对于小样本的识别非常不理想。提出了基于小波变换的梯度方向直方图结合线性判别分析的特征提取算法,对原图像进行小波变换,对近似部分进行HOG+LDA处理,对高频部分用均方差处理,分别对这两部分特征进行欧氏距离判断,进行加权识别。实验数据表明该方法能够克服LDA对小样本敏感问题,提高识别率的同时降低了耗时。  相似文献   

2.
刘振  姜晖  王粒宾 《计算机应用》2013,33(2):534-538
为解决传统Fisher线性鉴别分析(LDA)在SAR图像目标识别中存在的“小样本”问题和“次优性”问题,提出一种基于加权的两向二维线性鉴别分析方法(W(2D)2LDA)。该方法对两向二维线性鉴别分析准则中散度矩阵的构造进行加入权值的改进,采用加权的两向二维鉴别准则函数进行特征提取,从理论上有效解决了 “次优性”问题,并缓解了“小样本”问题。对美国运动与静止目标获取与识别(MSTAR)计划录取的SAR图像数据进行的仿真实验结果表明,该算法增强了提取特征的可鉴别性,能够以较小的特征维数和运算量获得更高的识别率,验证了该算法的有效性。  相似文献   

3.
针对不平衡数据集分类效果不理想的问题,提出了一种新的基于混合采样的不平衡数据集算法(BSI)。通过引进“变异系数”找出样本的稀疏域和密集域,针对稀疏域中的少数类样本,提出了一种改进SMOTE算法的过采样方法(BSMOTE);对密集域中的多数类样本,提出了一种改进的欠采样方法(IS)。通过在六种不平衡数据集上的实验表明,该算法与传统算法相比,取得了更高的G-mean值、F-value值、AUC值,有效改善了不平衡数据集的综合分类性能。  相似文献   

4.
邵超  张慧娟 《计算机应用》2012,32(7):1987-1990
等距特征映射(ISOMAP)算法要求数据位于单一流形之上且具有良好采样,而当数据采样于一个不完整流形时,该算法将会产生“过聚类”问题。为此,提出了一种改进算法--WISOMAP,它采用多维尺度分析(MDS)算法的一个变种--WMDS来降低逼近精度相对较差的多边测地距离在MDS距离保持中的主导作用,使逼近精度相对较好的少边测地距离能够得到更好的保持,从而能在一定程度上缓解“过聚类”问题。实验结果表明WISOMAP算法能更好地对采样于不完整流形的数据进行可视化。  相似文献   

5.
李珍  王凤先 《计算机应用》2005,25(7):1663-1665
针对仿生免疫系统模型(GECISM)中已识别出的“非我”入侵程序,介绍了基于系统调用序列根据入侵行为进行分类的方法。通过对训练集提取规则,建立“非我”类的特征库,从而判断出“非我”程序所属的“非我”类。实验验证了这一方法的可行性和有效性。  相似文献   

6.
数据分析是将描述性的、诊断性的、预测性的和规定性的模型用于数据,来回答特定的问题或发现新的见解的过程。本文以百度搜索指数为平台,以“三门峡职业技术学院”为搜索关键词,利用网络爬虫软件截取2012-2017年6年中的百度热词周搜索点击次数,通过灰色预测模型分析得出年度对应时间周的周搜索次数预测方程,经与一元线性回归模型预测值对比后判决预测方程合理有效,预判出以后2个年度的关键词搜索次数。最后通过数据图表分析“三门峡职业技术学院”作为百度搜索关键词有着显著的时间特征:一是总搜索次数每年呈递增趋势,二是在一年内的各周峰谷值有着明显的起伏规律,结合百度指数平台对关键词的周期搜索分布进行分析,提出相应的应对方法。  相似文献   

7.
针对SMOTE方法对所有少数类样本进行过采样的缺陷,提出一种基于特征加权与聚类融合的过采样方法(WKMeans-SMOTE),由此进行不平衡数据分类。考虑到不同特征权重对聚类结果的影响程度不同,选择特征加权的聚类算法对原始数据集进行聚类,并多次改变初始簇中心生成不同的聚类结果;根据簇标签匹配方法将不同的聚类结果进行匹配,引进“聚类一致性系数”筛选出处于少数类边界的样本;对筛选出的少数类样本进行SMOTE过采样,并采用CART决策树方法作为基分类器,对新的少数类样本与所有的多数类样本进行训练。实验结果表明,与现有的SMOTE、Borderline-SMOTE和ADASYN等过采样方法相比,所提出的WKMeans-SMOTE方法在分类性能上有一定的提升。  相似文献   

8.
为更高效地支持个性化字库的制作或生成,提出一种使用径迹点集描述的汉字由“楷”直接变“行”的方法。参考楷书与行书的异同,使用径迹点集计算楷体字的笔画、部件及其相互关系,以判断、生成一般的笔画间游丝为基础(基础游丝),辅之以特殊笔画及部件的游丝和变形。实验结果表明,在保持用户原楷体书写风格的原则下,“楷”变“行”方法,可以支持实现个性化行书字体的生成。  相似文献   

9.
 由于二手车推荐的数据集具有非平衡特性,因此,二手车推荐可视为非平衡分类问题,可借助解决非平衡分类问题的方法来实现二手车推荐。本文对非平衡数据分类的数据集重构进行研究,通过分析合成少数类过采样方法(Synthetic Minority Over-sampling Technique, SMOTE)的特点与不足,提出合成少数类过采样过滤器方法(Synthetic Minority Over-sampling Technique Filter, SmoteFilter),对SMOTE方法合成样本进行过滤,减少合成样本中的噪声数据,提高训练样本“质量”。使用支持向量机对SMOTE合成的数据和SmoteFilter合成的数据进行实验对比,结果表明SmoteFilter方法相较传统的SMOTE过采样方法,提高了二手车推荐中少数类的预测精度,提升了对二手车推荐的整体预测性能。  相似文献   

10.
基于图像的火焰检测中无量纲动态特征研究   总被引:1,自引:0,他引:1  
黄正宇  缪小平  芮挺 《计算机应用》2012,32(7):1894-1898
对火焰动态特征难以统一描述的问题,提出一种无量纲的检测方法。用“搜寻”的方法分割出火焰的可疑区域,分析火焰初期的特性,提取出三个无量纲特征因子并在贝叶斯分类器中训练,最后实现对火灾火焰的检测。其中“火焰动态常数”因子具有“稳定”的特性,其统计取值区间为[-0.003,0.003],突破了传统研究的时空局限性,不受火焰发展阶段、空间探测尺度以及监控设备种类的影响。对于实验中的不同远近的200帧序列的火焰检测,无量纲特征识别同一般特征识别结果相比较,正确识别率均超过90%。实验结果表明,无量纲动态特征因子能更好地描述火焰的特征,提高火焰识别的效率,增强火检系统的鲁棒性和可靠性。  相似文献   

11.
对手写数字的识别是模式识别的一个重要研究方向。通常的手写数字风格多变,无法实现高精度的识别。为此,提出一种新颖的手写数字记录方式,称为“手写液晶体数字”,进而为其设计了一种专门的识别算法。通过多个采样窗口提取图像特征,并与各类数字的标准特征向量进行相似度计算;基于贝叶斯判决原理,依据最大后验概率完成分类;建立专门的数据集并进行测评。实验结果表明,新算法具有极高的识别率,而且识别速度很快。  相似文献   

12.
针对单纯利用压力点分布特征进行触觉步态识别的不足,提出了一种结合无符号Laplace谱特征的动态触觉步态识别算法。利用足底压力数字化场地采集常速、快速和慢速三种情况下的触觉步态数据,生成足底压力分布图像,并根据足底解剖学的结构划分区域;以足底压力图像各区域为节点构造结构图,并采用无符号Laplace矩阵表示;通过对该矩阵进行奇异值分解(Singular Value Decomposition,SVD)获取谱特征,并结合形状特征得到触觉步态特征;选择“一对一”的支持向量机(Support Vector Machine,SVM)多分类方法,按照人在行走过程中不同的速度分别构造分类器,从而实现动态触觉步态的识别。实验结果表明该识别算法对不同速度样本数据的触觉步态识别正确率都较高。  相似文献   

13.
招投标网站资源中蕴含着丰富的情报信息。“远程监督”方法借助知识库自动标注数据,弥补了传统信息抽取方法在语料准备阶段对人工强依赖的缺陷,可有效提高信息抽取效率。该方法会引入噪声数据,导致信息抽取效果不够理想。因此,提出一种基于因子图模型的远程监督实体关系抽取方法,并结合领域特征,采用知识融合技术提高实体抽取质量,进而针对远程监督的缺陷提出基于负例数据学习的降噪方法。实验结果表明,该方法能够有效减少“噪声”干扰,提高关系抽取性能。  相似文献   

14.
脑波信号识别是脑机接口(BCI)技术需要解决的关键问题之一。针对脑波信号的数据处理以及特征提取,提出了采用小波变换系数计算“专心度”的特征来描述精神力集中强烈程度以及脑电波活跃状况,并结合实际测试得出不同精神状态下的检测算法。设计了一款基于ARM处理器的脑波控制轨道小车系统,将“专心度”值发送给小车系统,实现了不同精神状态下对小车车速的控制。实验结果表明,采用专心度的特征在识别效果方面要优于FFT的单一频率特征。并且该系统能够快速提取出脑波特征并实时地控制轨道小车行驶,系统性能稳定具有一定的实用价值。  相似文献   

15.
针对社保业务数据分散、大数据分析能力较低等问题,采用“云结构、积木式架构、容器技术、多级权限设计”构建智慧社保大数据分析平台的整体架构。该平台包含数据交换平台、基础计算平台、流程调度平台、管理分析平台和实时分析平台。采用OGG接口技术获取源系统中的增量数据,通过流程调度服务实现对各层数据和业务工作流的调用和管理。该平台已包括1960万人的基本信息,集成了社保的各项业务和服务,为“最多跑一次”助力。  相似文献   

16.
新一代测序因其数据量大、数据处理过程复杂、对计算资源要求高等特点,需要通过云计算进行处理。然而,云计算的处理方式要求先将测序数据上传到云平台中。但由于测序过程的随机性,使得同一样本的两次测序、两个相似样本分别测序后所产生的文件在二进制层面会有较大差别。目前已有的去重方法无法有效识别出这样的“重复”测序文件和测序结果中的“重复”内容。重复上传和存储这些重复数据,不仅消耗网络带宽,而且浪费存储空间。针对现存的重复数据删除方法仅仅基于文件的二进制特征,并未有效利用测序结果数据相似性特点的问题,提出一种面向云平台的海量高通量测序数据近似去重方法NPD(Near Probability Deduplication)。该方法对FastQ中的序列和质量信息,使用SimHash计算分块指纹,采用客户端与云平台双布谷过滤器(Cukoo Filter)对指纹值进行快速存在性检测,最后由云平台使用近似算法对指纹值近似去重。实验结果表明,NPD方法在保证高效的同时,大幅提升了去重率,进而减少了网络流量,缩短了数据上传时间,能够支撑海量数据处理,具有良好的实用价值。  相似文献   

17.
在类别不平衡数据集中,由于靠近类边界的样本更容易被错分,因此准确识别边界样本对分类具有重要意义。现有方法通常采用K近邻来标识边界样本,准确率有待提高。针对上述问题,提出一种基于Tomek 链的边界少数类样本合成过采样方法。首先,计算得到类间距离互为最近的样本形成Tomek链;然后,根据Tomek链标识出位于类间边界处的少数类样本;接下来,利用合成少数类过采样技术(SMOTE)中的线性插值机制在边界样本及其少数类近邻间进行过采样,并最终实现数据集的平衡。实验对比了8种采样方法,结果表明所提方法在大部分数据集上均获得了更高的G-mean和F1值。  相似文献   

18.
随着微博机器人账户的不断增多,对其识别检测已成为当前数据挖掘领域的热点问题。已有的微博机器人识别研究多使用爬取搜集的相关数据,在小规模平衡分布的机器人与普通用户数据集上训练并验证算法模型, 在样本分布不平衡的真实情况下存在局限性。重采样是一种针对不平衡数据集分类的常用技术,为探究重采样对 相关监督学习机器人识别算法的影响,该文以微热点数据挖掘竞赛的真实数据为基础,提出一种结合重采样的微 博机器人识别框架,在5种不同采样方式的基础上使用多种评价指标,综合评估了7种监督学习算法在不平衡验 证集上的分类性能。实验结果表明,以往基于小规模平衡样本数据训练的模型在真实情况下的Recall有较大降低,而结合重采样的算法框架能够大幅提高机器人账户的识别率,其中使用 NearMiss欠采样会让算法的 Recall大幅提升,而使用 ADASYN 过采样会让算法的 G_mean有所提高。一般而言,微博用户的发布时间、发布地域以及 发布时间间隔等属性是区分正常用户和机器人的重要特征属性。重采样调整了机器学习算法所依赖的特征属性, 从而获得更好的预测性能。  相似文献   

19.
GIS 支持下三峡库区主要地类自动分类方法研究   总被引:2,自引:0,他引:2       下载免费PDF全文
针对三峡库区遥感图像变异大的特征, 设计建立了主要地类自动分类系统并在其子系统中完成了地形光谱纠正、辅助数据生成及数据合成等预处理工作; 提出了一种可交互作业的计算机全自动土地利用类型分类方法。应用专业的图像处理软件eCognition 为平台, 通过图像图斑化、选取样本、寻找最佳波段并生成判别函数来进行自动分类, 在很大程度上克服了“同物异谱”、“异物同谱”、“边界过渡”等现象对分类结果的影响。在应用地理信息系统和自动分类方法来获取波谱特征复杂地区的土地利用信息的技术路线和方法方面作了有效探索。  相似文献   

20.
考虑潜在高价值旅客特有的数据高度不平衡、旅客特征和价值类别弱相关等问题,提出一种基于三重混合采样和集成学习的潜在高价值旅客发现模型。采用RFM(Recency Frequency Monetary)方法标注旅客类别;使用三重混合采样对不平衡旅客数据集进行重采样;使用融合特征选择算法遴选旅客特征;使用梯度提升决策树作为分类器,构建旅客价值预测模型,识别潜在高价值旅客。在PNR数据集上的实验结果表明,与基准算法相比,该模型能取得更好的AUC值和F1值,可以较好地识别潜在高价值旅客。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号