首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
目的 计算机智能分析用户的饮食是一项有意义的研究课题。传统的分析方法侧重于分析食物类型,可是中国是个美食之国,食物类型在各个区域间表现出极大的多样性,造成很难实现通用的食物自动分类方法。为此尝试针对食物的原材料,即食材进行自动分析收集并建立了一个真实环境下的食材图像数据库(FOOD-SCUT),此数据库包括目前中国市面上常见的70种食材类别,共8 015幅图片。方法 基于此数据库,本文尝试性地利用不同的传统特征和分类方法,对此食材图像数据库进行自动分类,以此来分析对比各种特征和分类方法的性能。对比性实验中所选用的特征包括:SIFT特征、颜色直方图特征、梯度直方图、SURF特征、LBP特征和Gabor特征等。除颜色直方图外其他特征都会利用词袋模型进行特征编码,而所选用分类方法包括:支持向量机(SVM)、朴素贝叶斯、随机森林、K-最近邻(KNN)算法。另外本文还尝试采用最近流行的深度神经网络方法对数据库进行特征学习和分类。结果 通过实验验证基于各种传统特征分类方法的实验性能,其中各种特征包括单特征和多特征组合两种方式,通过不断调整不同特征组合和分类识别算法及其参数,得到基于传统特征分类方法的最好分类性能。同时通过实验验证深度卷积神经网络模型的实验性能,深度卷积神经网络模型使用直接训练和预训练两种不同训练模式,并调整不同的网络层数和权重初始化方法后获得最好的分类识别性能。本食材数据库基于传统特征分类方法的最好分类准确率为88.98%,而基于深度神经网络分类方法上可以获得最佳的实验性能,即95.7%,这个准确率比基于传统特征分类方法高出6.72%。结论 数据库的统计结果表明此食材图像数据库类内数据具有极大的差异,可以作为分析食材的一个基础数据库。此数据库具有极高的应用价值,可以为后续各种基于食材分析应用提供相关分析数据,并且本文实验分析结果,对于后续用户开发相关的各种相关应用中,提供了模型和参数选择的建议,节省了用户选择模型和调参的实验过程。  相似文献   

2.
基于结构磁共振影像的孤独症分类对孤独症疾病的早期筛查和精准诊断具有重要意义,但受数据噪声及样本不足的影响,基于结构磁共振影像的孤独症分类模型的准确率并不理想。该文提出一种新的数据增强模型,并采用孤独症脑成像交换数据库 I 中的密西根大学样本库 1 数据集进行模型测试,随机选取密西根大学样本库 1 数据集中的 78 个样本进行实验,以对孤独症分类准确率进行评估。实验结果显示:该方法在 500 次实验的 494 次(98% 以上的实验)中能够将分类准确率提升10%~20%,在不增加数据量的情况下显著提升了孤独症的分类准确率。通过分析准确率提升和标注变化比例之间的关系,该文进一步对数据标注噪声的问题进行了探讨。  相似文献   

3.
随着企业信息传递量的激增,围绕信息精准推送的研究成为相关领域的热点,对于企业推送短文本的精准分类更是其中非常重要的一环。传统的短文本分类多采用TF-IDF算法构建词向量,并采用机器学习方法进行分类,存在维度过高、分类精准度不够等问题。提出基于深度学习的企业推送短文本有监督分类方法,引入深度神经网络代替机器学习分类方法,创建TextCNN模型对企业推送短文本进行处理并分类。实验结果表明,提出方法在开源数据集THUCNews上达到了96.53%的准确率,平均处理时间较传统方法最少缩短400%以上,在性能和准确率上都得到了较好的提升,具有较高的应用价值。  相似文献   

4.
针对传统单个分类器在不平衡数据上分类效果有限的问题,基于对抗生成网络(GAN)和集成学习方法,提出一种新的针对二类不平衡数据集的分类方法——对抗生成网络-自适应增强-决策树(GAN-AdaBoost-DT)算法。首先,利用GAN训练得到生成模型,生成模型生成少数类样本,降低数据的不平衡性;其次,将生成的少数类样本代入自适应增强(AdaBoost)模型框架,更改权重,改进AdaBoost模型,提升以决策树(DT)为基分类器的AdaBoost模型的分类性能。使用受测者工作特征曲线下面积(AUC)作为分类评价指标,在信用卡诈骗数据集上的实验分析表明,该算法与合成少数类样本集成学习相比,准确率提高了4.5%,受测者工作特征曲线下面积提高了6.5%;对比改进的合成少数类样本集成学习,准确率提高了4.9%,AUC值提高了5.9%;对比随机欠采样集成学习,准确率提高了4.5%,受测者工作特征曲线下面积提高了5.4%。在UCI和KEEL的其他数据集上的实验结果表明,该算法在不平衡二分类问题上能提高总体的准确率,优化分类器性能。  相似文献   

5.
王新颖  王亚 《图学学报》2019,40(6):1072
三维模型应用广泛,如何有效地管理和分类这些数据库中的三维模型一直是人们 关注的问题。然而,由于不同三维模型之间的相似性难以测量,因而很难获得一种稳健且广泛 适用的三维模型分类算法。为此,提出了一种权值优化集成卷积神经网络(WOTCNN)模型,并 将其应用到三维模型的分类识别中。首先,获取三维模型的深度投影视图来最大限度地保留三维 模型的空间信息。然后,采用调整的 VGG 网络对各角度的深度投影图像进行训练并提取预测概 率值。最后,通过加权集成算法获得完整三维模型的最终分类结果。对 ModelNet10 及 ModelNet40 数据库的实验表明:三维模型的平均分类准确率达到 92.84%和 86.51%。在预测性能方面,该网 络优于普通的单卷积神经网络;在三维模型识别方面,其分类准确率能够得到显著提升。  相似文献   

6.
为了提升深度卷积神经网络对音乐频谱流派特征的提取效果,提出一种基于频谱空间域特征注意的音乐流派分类算法模型DCNN-SSA。DCNN-SSA模型通过对不同音乐梅尔谱图的流派特征在空间域上进行有效标注,并且改变网络结构,从而在提升特征提取效果的同时确保模型的有效性,进而提升音乐流派分类的准确率。首先,将原始音频信号进行梅尔滤波,以模拟人耳的滤波操作对音乐的音强及节奏变化进行有效过滤,所生成的梅尔谱图进行切割后输入网络;然后,通过深化网络层数、改变卷积结构及增加空间注意力机制对模型在流派特征提取上进行增强;最后,通过在数据集上进行多批次的训练与验证来有效提取并学习音乐流派特征,从而得到可以对音乐流派进行有效分类的模型。在GTZAN数据集上的实验结果表明,基于空间注意的音乐流派分类算法与其他深度学习模型相比,在音乐流派分类准确率和模型收敛效果上有所提高,准确率提升了5.36个百分点~10.44个百分点。  相似文献   

7.
由于建筑领域问题包含复杂多样的领域专有术语,常见的文本分类算法在建筑领域问题分类上难度较大。为提高建筑领域问题的分类性能,提出一种基于融合RoBERTa和Word2Vec的建筑文本分类算法。实验结果表明:在建筑领域问题数据集上,准确率达到91.59%,分类性能较好;在通用数据集上,准确率均高于SVM、CNN等模型。  相似文献   

8.
传统的文本分类方法仅使用一种模型进行分类,容易忽略不同类别特征词出现交叉的情况,影响分类性能。为提高文本分类的准确率,提出基于主题相似性聚类的文本分类算法。通过CHI和WordCount相结合的方法提取类特征词,利用K-means算法进行聚类并提取簇特征词构成簇特征词库。在此基础上,通过Adaptive Strategy算法自适应地选择fasttext、TextCNN或RCNN模型进行分类,得到最终分类结果。在AG News数据集上的实验结果表明,该算法可较好地解决不同类别特征词交叉的问题,与单独使用的fasttext、TextCNN、RCNN模型相比,其文本分类性能显著提升。  相似文献   

9.
王威  邹婷  王新 《计算机应用研究》2020,37(4):1261-1264,1270
针对轻量级深度神经网络MobileNet会减少分类准确率的问题,将空洞卷积核引入MobileNet模型的某一卷积层中,提出一种基于局部感受野扩张的D-MobileNet模型。该模型根据空洞卷积核所在位置的不同分为三种结构,在不增加参数数量的同时能够扩大该层卷积核的局部感受野,提高分类精度。实验在Caltech-101数据集、Caltech-256数据集以及图宾根大学动物分类数据库上进行,结果表明,D-MobileNet模型可获得比MobileNet更好的分类准确率,最多可以提高2%。  相似文献   

10.
由于军事背景下战场上不同目标的相似度极高以及复杂情况下的分类识别率不高,传统视觉特征的分类精度已不能满足要求。针对含有特定军事目标的大规模图像分类问题构造了一种新的基于主成分分析(Principal Components Analysis, PCA)白化的卷积神经网络结构,有效地降低数据间的相关性,加强学习能力,提高目标分类的准确率。利用大规模的军事图像数据集对该模型进行了识别精度评估,实验表明,与基于视觉特征的词袋模型以及经典的卷积神经网络分类算法相比,该算法对于军事目标的分类精度有明显提高。  相似文献   

11.
与以往的层次化分类不同,本文使用了一种本质为图的层次结构,利用这种层次结构解决平面分类问题,从而提高平面分类的查准率和查全率.在普通的类别层次结构中,同一父类的兄弟类别之间的混淆关系是对称的,但事实上类别之间的混淆关系不是对称的.本文从分类器的混淆矩阵入手,引入了混淆类别的概念.利用混淆类别构造的类别层次结构,从查准率和查全率的角度来考虑类别之间的关系,表达出了混淆关系的非对称性.实验结果显示,使用类别的混淆类别构建类别层次结构的方法,无论从宏观上还是微观上都可以提高分类的准确率.  相似文献   

12.
基于朴素贝叶斯分类器邮件分类系统的改进   总被引:1,自引:0,他引:1  
目前朴素贝叶斯分类方法在电子邮件分类起到了良好的效果,但是并不能100%区分垃圾邮件与非垃圾邮件,然而在商业应用中,我们不能遗漏任何一封重要邮件。本文先简单介绍Bayes方法,然后提出一种对目前的Bayes分类方法的改进思想和方法。  相似文献   

13.
提出了一种新的基于多维角度的攻击分类方法,给出分类的标准和结果.通过对诸多攻击样例的分类来验证所给的攻击分类方法,并对此攻击分类的方法作了客观的分析评价.  相似文献   

14.
In Spatial Data Mining, spatial dimension adds a substantial complexity to the data mining task. First, spatial objects are characterized by a geometrical representation and relative positioning with respect to a reference system, which implicitly define both spatial relationships and properties. Second, spatial phenomena are characterized by autocorrelation, i.e., observations of spatially distributed random variables are not location-independent. Third, spatial objects can be considered at different levels of abstraction (or granularity). The recently proposed SPADA algorithm deals with all these sources of complexity, but it offers a solution for the task of spatial association rules discovery. In this paper the problem of mining spatial classifiers is faced by building an associative classification framework on SPADA. We consider two alternative solutions for associative classification: a propositional and a structural method. In the former, SPADA obtains a propositional representation of training data even in spatial domains which are inherently non-propositional, thus allowing the application of traditional data mining algorithms. In the latter, the Bayesian framework is extended following a multi-relational data mining approach in order to cope with spatial classification tasks. Both methods are evaluated and compared on two real-world spatial datasets and results provide several empirical insights on them.  相似文献   

15.
构建的专利自动分类模型,利用国际专利分类号自身的类别信息建立类别特征词原始集合,结合现有专利进行扩充训练.计算待分类专利中所有类别的特征词频率向量,进而判断专利与各类别的关联程度,实现专利的自动分类.实验结果显示,该模型的分类效果在大类、小类层次上较好.  相似文献   

16.
近年来.数据挖掘技术已成为国内外研究热点.而数据分类是数据挖掘中最重要的任务之一。本文介绍了一种神经模糊数据分类方法NEFCLASS模型,它通过从数据学习得到模糊分类规则.产生具有良好解释性的分类结果,分析了它的结构、学习算法和修减策略.还讨论了它的实现工具和应用。  相似文献   

17.
不平衡数据分类是机器学习领域的重要研究内容,但现有的不平衡分类算法通常针对不平衡二分类问题,关于不平衡多分类的研究相对较少。然而实际应用中的数据集通常具有多类别且数据分布具有不平衡性,而类别的多样性进一步加剧了不平衡数据的分类难度,因此不平衡多分类问题已经成为亟待解决的研究课题。针对近年来提出的不平衡多分类算法展开综述,根据是否采用分解策略把不平衡多分类算法分为分解方法和即席方法,并进一步将分解方法按照分解策略的不同划分为“一对一(OVO)”架构和“一对多(OVA)”架构,将即席方法按照处理技术的不同分为数据级方法、算法级方法、代价敏感方法、集成方法和基于深度网络的方法。系统阐述各类方法的优缺点及其代表性算法,总结概括不平衡多分类方法的评价指标,并通过实验深入分析代表性方法的性能,讨论了不平衡多分类的未来发展方向。  相似文献   

18.
基于不平衡数据的中文情感分类   总被引:2,自引:0,他引:2  
近些年来,情感分类在自然语言处理研究领域获得了显著的发展。然而,大部分已有的研究都假设参与分类的正类样本和负类样本一样多,而实际情况中正负类数据的分布往往是不平衡的。该文收集四个产品领域的中文评论文本,发现正类样本的数目远远多于负类样本。针对不平衡数据的中文情感分类,提出了一种基于欠采样和多分类算法的集成学习框架。在四个不同领域的实验结果表明,我们的方法能够显著提高分类性能,并明显优于目前主流的多种不平衡分类方法。  相似文献   

19.
台湾西南部泥岩分布区因其特殊的土壤和气候条件,造成泥岩裸露面积的增加和严重的土壤侵蚀。笔者从地面数据的调查、泥岩影像的目视判读特征、光谱特征等方面综合探讨应用遥感数据探测泥岩裸露地。利用监督式最大似然法与知识库分类法为泥岩裸露地卫星影像解译的影像分类法则,结合GIS、GPS数据在分类中以提高分类精度,并提供一套良好的影像分析模式,有效地分析出泥岩裸露地之分布范围。  相似文献   

20.
华北  曹先彬 《计算机仿真》2007,24(6):322-325
к-近邻作为一种简单、有效、非参数的分类方法,在文本分类中得到广泛的应用,但是这种方法计算量较大.针对к-近邻法的不足之处,提出了一种新的快速文本分类方法,通过对原始训练样本集的训练生成代表样本,再根据原始训练样本与已生成代表样本之间的分布状况,对已生成的代表样本进行多次调整,从而使代表样本更具有代表性.这种方法有效地压缩了原始训练样本集,提高了分类效率;同时,由于代表样本的分布更加合理,可以提高分类的准确性.实验结果显示,此方法具有很好的分类性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号