共查询到20条相似文献,搜索用时 15 毫秒
1.
针对肺结节良恶性分类模型中特征选择过程无法避免特征多样性不受破坏的问题,提出一种将肺结节特征矢量化处理的特征选择方法。首先,假设每个肺结节特征都是由数据、类型构成的一个矢量。然后,按照特征类型添加特征到相应的特征子集,并分别利用Relief算法评价特征、特征子集的分类重要性。最后,通过动态阈值的方式筛选得到优化后的特征子集。在150个肺结节样本的分类实验中,采用本文算法所取得的敏感性为94.7%、特异性为93.7%、虚警率为5.2%、受试者工作特性曲线下面积为97.3%。分析表明,本文算法几乎不破坏肺结节特征的多样性,能够显著提高肺结节良恶性分类的准确性。 相似文献
2.
针对处理高维度属性的大数据的属性约减方法进行了研究。发现属性选择和子空间学习是属性约简的两种常见方法,其中属性选择具有很好的解释性,子空间学习的分类效果优于属性选择。而往往这两种方法是各自独立进行应用。为此,提出了综合这两种属性约简方法,设计出新的属性选择方法。即利用子空间学习的两种技术(即线性判别分析(LDA)和局部保持投影(LPP)),考虑数据的全局特性和局部特性,同时设置稀疏正则化因子实现属性选择。基于分类准确率、方差和变异系数等评价指标的实验结果比较,表明该算法相比其它对比算法,能更有效的选取判别属性,并能取得很好的分类效果。 相似文献
3.
针对噪声或者离群点通常会增加矩阵的秩的问题,提出一个在低秩限制下的基于超图的稀疏属性选择算法。具体地,该算法首先利用其他属性稀疏地表达每一个属性来获得属性自表达系数矩阵。然后,利用超图正则化因子获取数据的局部结构将子空间学习嵌入到属性选择的框架中。同时,利用范数惩罚自表达系数矩阵和损失函数,挖掘出属性之间的关系和样本间的关系来帮助算法有效地进行属性选择,最终提高模型的预测能力。在UCI数据集上的实验结果表明,该算法相比其它对比算法,能更有效地选取重要属性,并取得很好的分类效果。 相似文献
4.
针对软件缺陷数据集中不相关特征和冗余特征会降低软件缺陷个数预测模型的性能的问题,提出了一种面向软件缺陷个数预测的混合式特征选择方法-HFSNFP。首先,利用ReliefF算法计算每个特征与缺陷个数之间的相关性,选出相关性最高的m个特征;然后,基于特征之间的关联性利用谱聚类对这m个特征进行聚类;最后,利用基于包裹式特征选择思想从每个簇中依次挑选最相关的特征形成最终的特征子集。实验结果表明,相比于已有的五种过滤式特征选择方法,HFSNFP方法在提高预测率的同时降低了误报率,且G-measure与RMSE度量值更佳;相比于已有的两种包裹式特征选择方法,HFSNFP方法在保证了缺陷个数预测性能的同时可以显著降低特征选择的时间。 相似文献
5.
针对高维数据具有低秩形式和属性冗余等特点,提出一种基于属性自表达的无监督超图属性选择算法。具体地,该算法首先利用属性自表达特点用其他属性稀疏地表达每个属性,此自表达形式使用低秩假设寻找高维数据的低秩表示,然后建立超图正则化因子保持高维数据的局部结构,最后利用稀疏正则化因子进行属性选择。属性自表达特性确定属性的重要性,低秩表示相当于考虑数据的全局信息进行子空间学习,超图正则化因子考虑数据的局部结构对数据进行子空间学习。该算法实际上考虑数据全局和局部信息进行子空间学习,更是一种嵌入了子空间学习的属性选择算法。实验结果表明,该算法相比其它对比算法,能更有效地选取属性,并能取得很好的分类效果。 相似文献
6.
7.
面对海量数据的管理和分析,文本自动分类技术必不可少。特征权重计算是文本分类过程的基础,一个好的特征权重算法能够明显提升文本分类的性能。本文对比了多种不同的特征权重算法,并针对前人算法的不足,提出了基于文档类密度的特征权重算法(tf-idcd)。该算法不仅包括传统的词频度量,还提出了一个新的概念,文档类密度,它通过计算类内包含特征的文档数和类内总文档数的比值来度量。最后,本文在两个中文常见数据集上对五种算法进行实验对比。实验结果显示,本文提出的算法相比较其他特征权重算法在F1宏平均和F1微平均上都有较大的提升。 相似文献
8.
单一的特征与分类器只能对限定条件下的人脸进行较好的识别,当在非限定条件下(如光照、背景等发生变化时)将出现人脸识别率较低问题,针对该问题,提出了一种基于多种局部二进制特征集成学习的人脸识别算法。首先,使用监督梯度下降法 (SDM)对人脸特征点定位,应用中心对称局部二进制(CSLBP)算子提取每个特征点邻域特征,将所有人脸特征点邻域特征合成为精细的纹理特征;同时运用分区LBP直方图算法提取人脸区域的微观空间结构特征;然后,使用K最近邻算法(KNN)和支持向量机(SVM)分别训练这两种特征,得到类别排序列表和投票决策矩阵;最后,利用加权求和的规则融合决策矩阵,构成最优集成分类器,从而得到输出类别。通过在非限制性人脸库LFW上实验结果表明,所提算法采用集成的方法明显优于单一的特征和分类器。 相似文献
9.
为了克服不同人群密度及所采用特征对人数估计的影响,提出了一种基于人群密度分类及组合特征的人数统计算法。该算法包括离线特征组合选取和在线实时估计两个阶段。在离线阶段,选取密度阈值将图像样本分为高、低密度两类,然后通过实验方法选取最优的特征组合。在线估计阶段首先通过分类器将样本分为高、低密度两类,然后利用离线阶段选取的特征组合训练得到高斯模型,并分别对两类样本进行人数估计。实验结果表明,与不分高低密度相比,平均估计误差由10.6%降至8.1%;与目前主流的人数估计算法相比,本文算法的平均估计误差也更小。 相似文献
10.
11.
基于运动补偿的帧率提升算法是目前主要的帧率提升方法。为减小内插帧中的块效应、孔洞和遮挡问题,提高插值帧质量,本文提出一种基于卷积神经网络(convolutional neural network)的自学习帧率提升(frame rate up-conversion)方法。卷积神经网络用于利用两相邻帧预测待插值帧。在卷积神经网络的训练阶段,我们假设高帧率视频是存在的,网络参数由高帧率视频与低帧率视频训练而来。最后视频数据以低帧率视频加网络参数的形式传输,在接收端就可以利用卷积神经网络重建高帧率视频。实质上,我们这样做是通过增加视频发布者的负担以提供给视频接受者更多便利。对于视频点播网站来说,这是提升用户体验的重要因素。实验表明,我们的方案相对于传统的基于运动补偿的帧率提升算法,平均PSNR提升至少0.6 DB,取得较大程度提升。并且,我们的方法是基于全局的帧预测方法,可以有效避免快效应、孔洞和遮挡问题。 相似文献
12.
针对现有决策树模型在分类过程中没有考虑决策者对结果的偏好行为,因而不能很好的预测具有明显偏好倾向问题的不足,提出了一种偏好敏感决策树(Preference Sensitive Decision Tree, PSDT)分类算法。该算法引入了偏好度和偏好代价的概念,并通过综合考虑属性信息和有效偏好,构建新型属性选择因子和基于有效偏好的结点类标号分配准则。通过自适应调整偏好度,可生成最佳偏好敏感决策树。实验结果证明该算法既能实现对偏好类的高精度预测,同时能够保证决策树拥有良好的整体精度,且具有较高的有效性和实用性,能够很好的解决偏好敏感环境下的决策问题。 相似文献
13.
基于深度学习的用户投诉预测模型研究* 总被引:1,自引:0,他引:1
用户投诉预测模型能有效的降低电信用户投诉率,对企业提高用户满意度和竞争力有着至关重要的作用。在模型训练过程中,由于人工设计特征的缺陷和设计过程中存在难以预估的复杂性,使得模型预测的精度和设计特征的效率不能有很大的提升。针对上述问题,本文提出了一种基于深度学习的用户投诉预测模型。该模型通过深层网络特征学习单元能从电信用户原始数据中自动学习到适合分类器分类的高层非线性组合特征,并将这些高层特征输入到传统分类器中来提高模型的精度。通过实验结果分析,本文的预测模型在AUC指标上比以往用户投诉模型提升了7.1%,证明了该模型自动学习特征的有效性和深度学习在电信大数据领域的可用性。 相似文献
15.
16.
17.
18.
在运动想象脑-机接口系统中,常采用高密度导联获取脑电信号,导致实验准备时间长,系统运行速度慢,性能变差等问题。针对上述不足,本文提出了一种基于遗传算子的蜂群算法用于导联优选,引入交叉和变异算子以提高蜂群算法的邻域搜索能力。通过对第四届国际BCI 竞赛 Dataset 1中四名被试者(a,b,f和g)的59导联运动想象数据进行导联优选,用多类CSP算法和支持向量机对优选导联数据进行特征提取和分类识别。结果表明所提出的算法在大大降低了导联维数的同时,也得到了比采用全部导联更高的分类识别率,验证了本文所提算法的实用性和有效性。 相似文献
19.
因受到非视距传播等影响,基于位置指纹的室内定位精度不高。针对此问题,提出一种基于可靠AP选择和深度置信网络(DBN)的室内定位算法(RAP-DBN)。离线阶段,利用改进k-means聚类算法将定位区域划分成若干子区域,并依据Fisher准则和各AP缺失频率,选取分辨能力强且可靠的AP节点作为子区域的训练节点,最后采用DBN模型对各子区域参考点数据进行训练;在线阶段,根据接收信号强度判别测试点所属的类簇,并根据训练好的DBN模型在线估计测试点位置。实验结果表明,和WKNN算法、M-WKNN算法以及PSO-ANN算法相比,改进算法在定位精度和稳定性方面均有所提高。 相似文献