首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
王海燕  王虎  王国祥  刘军 《计算机工程》2015,(3):172-176,181
目前多数白酒分类方法需要进行特征选取,但特征选取算法会增加计算复杂度,限制特征数量,而且选取结果的好坏直接影响识别效果。为此,提出应用压缩感知理论对白酒香型进行分类的方法。通过压缩感知对白酒飞行时间质谱进行整体分析,运用训练数据构造冗余字典作为稀疏基,选择高斯随机矩阵作为测量矩阵,通过求解最小l1范数得到反映白酒香型特征的稀疏表示,进而根据K近邻法( KNN)实现对白酒香型的分类识别。将4种不同重构算法分别结合最小冗余误差和KNN进行香型分类,实验结果表明,将压缩感知用于白酒香型分类是可行的,能避免特征选取的问题,其中采用稀疏度自适应匹配追踪算法求解l1范数,并根据KNN进行分类的稳定性较好,准确率达到91.45%。  相似文献   

2.
基于视觉显著性检测的图像分类方法   总被引:1,自引:0,他引:1  
针对传统的图像分类方法对整个图像不分等级处理以及缺乏高层认知的问题,提出了一种基于显著性检测的图像分类方法。首先,利用视觉注意模型进行显著性检测,得到图像的显著区域;然后,利用Gabor滤波方法和脉冲耦合神经网络模型,分别提取该显著区域的纹理特征和时间签名特征;最后,根据提取的纹理特征和时间签名特征,利用支持向量机实现图像分类。实验结果表明,所提方法在SIMPLIcity图像数据集上平均分类正确率达到94.26%,在Caltech数据集上平均分类正确率为95.43%,从而证明,显著性检测与有效的特征提取对图像分类有重要影响。  相似文献   

3.
为了找出快速、简捷、有效的鉴定老陈醋年份的方法,对72种老陈醋样品采集数据,并采用RBF神经网络来建立分类模型,对测试样本分类验证。结果表明:RBF网络分类正确率为100%,此方法有效可行。  相似文献   

4.
在缺乏标注数据的条件下,该文将藏文正字检错任务视为一个分类问题: 首先从语言学知识中构建音节混淆子集并给每个原句加噪,然后建立深层双向表征的BERT作为分类模型,最后为了证明该方法的有效性,构建两个基线模型和三种不同领域的测试集,实验结果表明,该方法的结果优于两个基线模型。该文方法在相同领域测试集上句子分类的正确率达到93.74%,不同领域测试集上也能达到83.6%。对错误音节的识别率为74.53%,同时对无错误音节的误判率只有2.30%。  相似文献   

5.
采用气体传感器阵列对7种市售白酒进行了动态测量,并研究蒸发温度对白酒识别分类的影响.白酒样本分别在20,40,60,80℃蒸发后进行测量,在每个蒸发温度下结合主元分析(PCA)法,分析了传感器阵列信号与白酒的香型和酒精度特征之间的关系,以及所有白酒样本按蒸发温度划分的结果.结果表明:按香型和酒精度划分,60℃的分类结果...  相似文献   

6.
针对支持向量机(SVM)参数一般是人为选取,无法准确取到最佳值的问题,提出了一种基于粒子群算法(PSO)对参数进行优化的支持向量机(PSO-SVM).以减速机齿轮的3类故障类型(正常、磕碰、磨损)数据作为研究资料,组成训练样本集,训练PSO-SVM分类模型,从训练集中抽取部分数据组成测试样本集,对模型进行检验测试.研究表明:PSO-SVM模型分类正确率达到了93.8%,相较未进行参数优化的SVM,算法能更好地找到全局最优解,提高了模型的分类正确率.  相似文献   

7.
与核酸作用的蛋白质在基因功能许多方面扮演着极其重要的角色,预测蛋白质是否与核酸作用在生物信息学领域受到广泛关注。本文用氨基酸组成、氨基酸物化特性和蛋白质结构等信息作为特征参数,通过支持向量机方法预测了与核酸作用的蛋白质。分别取与rRNA,RNA和DNA作用的3个蛋白质数据集,用SVM训练,筛选最优核函数,优化核函数参数,建立分类判别模型,并用于预测蛋白质是否与核酸作用。结果表明:即使对同源相似性低于40%的蛋白质,通过用10-crossvalidation(交叉验证)方法测试上述3个数据集都分别有93.75%、83.41%、81.85%的预测正确率。用外部测试集测试所得模型分别有93.8%、84.2%、81.9%的预测正确率。在此基础上,我们建立了1个预测蛋白质与核酸是否作用的网上在线软件系统。网址是:http://chemdata.shu.edu.cn/protein_na。  相似文献   

8.
台风是最严重的自然灾害之一,做好台风等级分类预测是防灾减灾的关键。针对现有卫星云图特征提取复杂、识别率低等问题,基于卷积神经网络框架,以北太平洋1978—2016年近1 000多个台风过程的卫星云图作为样本,提出改进深度学习模型Typhoon-CNNs。该框架采用循环卷积策略增强模型表征力,使用十折交叉验证引入信息熵、Dropout置零率以优化模型灵敏度及防止过拟合。通过800样本测试集对模型Typhoon-CNNs进行验证,实验结果表明,本文算法的分类精度达到92.5%,台风和超强台风2个等级的预测正确率达到99%,优于传统分类方法。最后对模型提取的特征图进一步分析,模型能够准确识别台风眼和螺旋云带,从而证明Typhoon-CNNs对台风等级分类的可行性。  相似文献   

9.
采用傅里叶变换红外光谱,测定了45个来自青海省不同产地的枸杞样品的红外光谱。小波变换对红外光谱原始数据进行了预处理。红外光谱数据压缩到原来的1/8,其分析精度与原始光谱数据基本相当。将45个样本数据分为30个训练集和15个测试集,建立随机森林(RF)预测枸杞产地模型,使用内部交叉验证和外部数据进行验证。采用R语言实现随机森林算法,并对模型的参数进行了优化。结果,所建立的判别模型中训练样本判别正确率为100%,测试样本判别正确率为100%。研究结果表明,建立的模型能够正确地对枸杞样品快速地进行产地鉴别,红外光谱法结合随机森林可作为中药材产域分类鉴别的一种新的现代化方法。  相似文献   

10.
提出了一种基于声音场景分类的噪声抑制算法。算法使用调制滤波法对纯语音、纯噪音和含噪语音3种场景进行分类,并根据分类结果调整噪声抑制算法参数集,得到不同的抑制系数。本文方法在助听器测试系统中取得了良好的实验效果,场景分类正确率在95%以上。在不同噪声类型情况下,经过本文算法处理的输出语音信号取得了良好的信噪比和MOS评分的提升。本文算法可以有效地提高数字助听器输出语音质量。  相似文献   

11.
Electronic nose has been widely used in the classification of liquid samples, such as vinegars, wines and liquors, which have complex components. The difficulty of these classifications is how to get the information of the trace components in these samples. In this paper a method for liquor recognition based on liquid evaporation was presented. This method makes use of the distinct evaporation characteristics of different components in liquor samples. And during the evaporation process, one metal oxide gas sensor was used to detect the headspace of liquor samples for classification. Due to the distinct evaporation characteristics of different components, volatile compounds in the headspace evaporating from samples would change with the testing time. Meanwhile, the gas sensor would respond to these volatile compounds. Accordingly, more information of liquor samples during evaporation may be acquired with the proposed method. To verify the performance of this method, 8 different Chinese liquors with 50% alcohol for comparison were tested under the method. The results showed that the evaporation characteristics of these liquor samples were quite distinct. The correct classification accuracy of discriminant function analysis was 100%, which indicated this method may be a simple and effective way for complex-component liquid sample analysis.  相似文献   

12.
针对随机森林分类效果受样本集类间不平衡、类内不规则的影响,提出一种聚类欠采样策略的随机森林优化方法。该方法对原始数据大类样本聚类,得到与小类样本个数相同的子类簇;从每个子类簇中随机有放回抽取一个样本与小类样本合并,形成平衡样本集;对平衡样本集进行有放回随机抽样,形成单棵决策树的训练样本集并完成建树;将两次未被抽中的样本作为袋外数据,用于模型测试;重复上述过程多次,形成随机森林。使用10组非平衡数据集进行实验验证,结果表明,该方法在这10组数据集上的分类能力及稳定性均优于传统随机森林。  相似文献   

13.
基于增量式贝叶斯模型的中文问句分类研究   总被引:1,自引:0,他引:1  
固定训练集生成的分类器性能不理想且不能跟踪用户需求,为此,提出一种将增量式贝叶斯思想用于问句分类的方法。采用遗传算法选取最优特征子集优化分类器,从而避免训练集特征过分冗余,使分类器在学习过程中动态地扩大训练集并修改分类器参数。在对问句进行分类时,提取问句的疑问词、句法结构、疑问意向词和疑问意向词在知网的首项义原作为分类特征。为了验证增量式贝叶斯方法的有效性,从语料库中随机抽取不同规模的问句构成增量集,基于不同的增量集对同一测试集中的问句进行分类。实验结果表明,增量式贝叶斯分类器较朴素贝叶斯分类器有更高的分类精度,大类和小类的准确率分别达到90.2%和76.3%,在提高准确率的同时优化了运行效率。  相似文献   

14.
用于文本分类的改进KNN算法   总被引:1,自引:1,他引:1       下载免费PDF全文
采用灵敏度方法对距离公式中文本特征的权重进行修正;提出一种基于CURE算法和Tabu算法的训练样本库的裁减方法,采用CURE聚类算法获得每个聚类的代表样本组成新的训练样本集合,然后用Tabu算法对此样本集合进行进一步维护(添加或删除样本),添加样本时只考虑增加不同类交界处的样本,添加或删除样本以分类精度最高、与原始训练样本库距离最近为原则。  相似文献   

15.

Classification is one of the data mining processes used to predict predetermined target classes with data learning accurately. This study discusses data classification using a fuzzy soft set method to predict target classes accurately. This study aims to form a data classification algorithm using the fuzzy soft set method. In this study, the fuzzy soft set was calculated based on the normalized Hamming distance. Each parameter in this method is mapped to a power set from a subset of the fuzzy set using a fuzzy approximation function. In the classification step, a generalized normalized Euclidean distance is used to determine the similarity between two sets of fuzzy soft sets. The experiments used the University of California (UCI) Machine Learning dataset to assess the accuracy of the proposed data classification method. The dataset samples were divided into training (75% of samples) and test (25% of samples) sets. Experiments were performed in MATLAB R2010a software. The experiments showed that: (1) The fastest sequence is matching function, distance measure, similarity, normalized Euclidean distance, (2) the proposed approach can improve accuracy and recall by up to 10.3436% and 6.9723%, respectively, compared with baseline techniques. Hence, the fuzzy soft set method is appropriate for classifying data.

  相似文献   

16.
Training set resampling based ensemble design techniques are successfully used to reduce the classification errors of the base classifiers. Boosting is one of the techniques used for this purpose where each training set is obtained by drawing samples with replacement from the available training set according to a weighted distribution which is modified for each new classifier to be included in the ensemble. The weighted resampling results in a classifier set, each being accurate in different parts of the input space mainly specified the sample weights. In this study, a dynamic integration of boosting based ensembles is proposed so as to take into account the heterogeneity of the input sets. An evidence-theoretic framework is developed for this purpose so as to take into account the weights and distances of the neighboring training samples in both training and testing boosting based ensembles. The effectiveness of the proposed technique is compared to the AdaBoost algorithm using three different base classifiers.  相似文献   

17.
提出了一种融合奇异值分解(SVD)和最大间距准则鉴别分析(MMC)的人脸识别方法。对人脸图像进行奇异值分解,选取较大的一组奇异值构成特征向量,对所有训练样本按照最大间距准则鉴别分析算法计算投影矩阵,把人脸图像矩阵在投影矩阵上投影得到特征矩阵。融合决策阶段,在以上两类特征集中,分别计算待识别样本到所有训练样本的欧氏距离并对得到的两类结果进行加权融合,最后根据最近距离分类器分类。基于ORL人脸数据库上的实验结果表明算法的有效性。  相似文献   

18.
目的 细粒度分类近年来受到了越来越多研究者的广泛关注,其难点是分类目标间的差异非常小。为此提出一种分类错误指导的分层双线性卷积神经网络模型。方法 该模型的核心思想是将双线性卷积神经网络算法(B-CNN)容易分错、混淆的类再分别进行重新训练和分类。首先,为得到易错类,提出分类错误指导的聚类算法。该算法基于受限拉普拉斯秩(CLR)聚类模型,其核心“关联矩阵”由“分类错误矩阵”构造。其次,以聚类结果为基础,构建了新的分层B-CNN模型。结果 用分类错误指导的分层B-CNN模型在CUB-200-2011、 FGVC-Aircraft-2013b和Stanford-cars 3个标准数据集上进行了实验,相比于单层的B-CNN模型,分类准确率分别由84.35%,83.56%,89.45%提高到了84.67%,84.11%,89.78%,验证了本文算法的有效性。结论 本文提出了用分类错误矩阵指导聚类从而进行重分类的方法,相对于基于特征相似度而构造的关联矩阵,分类错误矩阵直接针对分类问题,可以有效提高易混淆类的分类准确率。本文方法针对比较相近的目标,尤其是有非常相近的目标的情况,通过将容易分错、混淆的目标分组并进行再训练和重分类,使得分类效果更好,适用于细粒度分类问题。  相似文献   

19.
遥感图像飞机目标分类的卷积神经网络方法   总被引:2,自引:0,他引:2       下载免费PDF全文
目的 遥感图像飞机目标分类,利用可见光遥感图像对飞机类型进行有效区分,对提供军事作战信息有重要意义。针对该问题,目前存在一些传统机器学习方法,但这些方法需人工提取特征,且难以适应真实遥感图像的复杂背景。近年来,深度卷积神经网络方法兴起,网络能自动学习图像特征且泛化能力强,在计算机视觉各领域应用广泛。但深度卷积神经网络在遥感图像飞机分类问题上应用少见。本文旨在将深度卷积神经网络应用于遥感图像飞机目标分类问题。方法 在缺乏公开数据集的情况下,收集了真实可见光遥感图像中的8种飞机数据,按大致4∶1的比例分为训练集和测试集,并对训练集进行合理扩充。然后针对遥感图像与飞机分类的特殊性,结合深度学习卷积神经网络相关理论,有的放矢地设计了一个5层卷积神经网络。结果 首先,在逐步扩充的训练集上分别训练该卷积神经网络,并分别用同一测试集进行测试,实验表明训练集扩充有利于网络训练,测试准确率从72.4%提升至97.2%。在扩充后训练集上,分别对经典传统机器学习方法、经典卷积神经网络LeNet-5和本文设计的卷积神经网络进行训练,并在同一测试集上测试,实验表明该卷积神经网络的分类准确率高于其他两种方法,最终能在测试集上达到97.2%的准确率,其余两者准确率分别为82.3%、88.7%。结论 在少见使用深度卷积神经网络的遥感图像飞机目标分类问题上,本文设计了一个5层卷积神经网络加以应用。实验结果表明,该网络能适应图像场景,自动学习特征,分类效果良好。  相似文献   

20.
针对多观测样本的二分类问题,提出适合多观测样本的基于LS-SVM的新分类算法。每次分类中,待分类的模式使用多观测样本集进行表示,首先对多观测样本集的标签进行假设,将此假设条件作为LS-SVM中优化问题的约束条件,由此得到分类误差,通过比较两次假设下的分类误差确定多观测样本的类别。该方法无需提前训练获得分类器,而是同时利用已知标签样本和多观测样本集,充分利用同类样本在特征空间中连续分布的特点。最后通过三组实验验证了所提方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号