首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
QPSO算法在朴素贝叶斯分类上的应用研究   总被引:1,自引:0,他引:1  
朴素贝叶斯分类假定类条件独立,使得所选数据集的条件属性集在预处理时必须进行属性约简,如果处理不当,就会造成分类的不准确.本文分别对在训练集上随机选取的属性子集组成粒子,构造适应度函数,从而构建了朴素贝叶斯分类器,并利用量子粒子群算法对分类效果进行择优操作.实验证明,其分类效果优于传统的朴素贝叶斯分类方法.  相似文献   

2.
针对采用传统智能优化算法挖掘分类规则时易出现分类精度不理想、噪声容忍度差等情况,提出一种基于双链量子遗传优化分类规则挖掘算法.采用双链量子位对分类规则进行实数编码,通过解空间变换将量子位概率幅映射到相应实数集,根据目标函数梯度变化确定量子旋转门转角,并利用量子非门进行个体变异.选取UCI数据库中9组分类数据集对所提出算法分类性能进行测试,结果表明,所提出算法具有较好的分类精度和噪声容忍度.  相似文献   

3.
朴素贝叶斯分类器是一种简单高效的分类算法,但其属性独立性假设影响了分类效果。通过放松朴素贝叶斯假设可以增强朴素贝叶斯的分类效果,但是通常会导致计算代价大幅提高。针对以上问题,提出了一种基于粗糙集的特征加权朴素贝叶斯算法,加权参数直接从训练数据中学习得到,可以看作是计算某个后验概率时,某个特征对于该类别的影响程度。将该分类算法与朴素贝叶斯分类器(na ve bayesian classifier,NB)、贝叶斯网(bayes networks)和NBTree分类器进行实验比较。结果表明:在大多数数据集上,FWNB分类器在较小的计算代价下,具有较高的分类正确率。  相似文献   

4.
基于知识语义权重特征的朴素贝叶斯情感分类算法   总被引:1,自引:0,他引:1  
针对文档级情感分类的准确率低于普通文本分类的问题,提出一种基于知识语义权重特征的朴素贝叶斯情感分类算法.首先,通过特征选择的方法,对情感词典中的词进行重要度评分并赋予不同权重.然后,基于词典极性的分布信息与文档情感分类的相关性,将情感词的语义权重特征融合到朴素贝叶斯分类中,实现了新算法.在标准中文数据集上的实验结果表明,提出的算法在准确率、召回率和F1测度值上都优于已有的一些算法.  相似文献   

5.
针对朴素贝叶斯分类器硬分类的不足,将模糊C-均值聚类与朴素贝叶斯分类相结合,提出一类新的基于模糊聚类的混合朴素贝叶斯分类模型,并给出它的分类误差估计方法。理论分析与实验结果表明,基于模糊聚类的混合朴素贝叶斯分类模型可行,其分类的误差估计方法有效。新的基于模糊聚类的混合朴素贝叶斯分类模型提高了模式分类能力。  相似文献   

6.
关联性识别对于系统演化规律的确定意义重大,从测试数据累积、更新的视角,针对皮肤指标与中医体质之间的关联性进行探索,构建分类模型。提出基于建模数据动态修订决策树和模糊朴素贝叶斯融合算法的权重,建立具有较好分类及解释性的分类模型。其中决策树采用最佳后剪枝方式,避免过拟合弊端;朴素贝叶斯算法则通过定义指标归属区间的模糊隶属度来解决属性分类中存在的随机与模糊性。实证结果表明随着建模数据的变化,分类模型的融合权重动态调整,目前模型的准确率为86.7%,高于独立决策树、朴素贝叶斯的83.3%和80%,亦高于对照组小数据分类模型的76.7%。可见此动态分类模型可有效利用参与建模的数据信息识别出外在皮肤与内在体质之间的关联性,为皮肤-体质间的定量研究奠定了基础。目的:针对人体面部皮肤状态指标与中医体质类型之间的关联性进行科学、定量研究,从测试数据持续累积与知识发现深入推进的过程视角,尝试揭示人体内在中医体质与外观皮肤状态指标间的复杂动态演化规律。方法:本文综合小样本条件下决策树的良好归纳特性及大样本条件下贝叶斯算法分类准确率高的优势。提出基于建模数据量会不断增多的趋势,构建可自适应修订决策树和模糊朴素贝叶斯融合分类算法的权重,以适用于测试数据从小到大积累过程中分类模型均具有较好分类特性及可解释性的应用要求。其中决策树采用最佳后剪枝方式,避免了常规决策树存在的过拟合弊端;朴素贝叶斯算法则通过定义指标归属区间的模糊隶属度来解决皮肤属性测试与分类中存在的随机性与模糊性。结果:实证结果表明本文提出的分类模型的融合权重可动态调整且随着建模数据的增多分类精度会相应提高。目前对应151个建模数据的分类模型的分类准确率为86.7%,高于独立决策树、朴素贝叶斯的83.3%和80%,亦高于对照组80个建模数据对应分类准确率的76.7%。结论:可见此皮肤—体质动态分类模型通过有效利用参与建模的数据信息,能识别出人体面部外观皮肤状态指标与内在中医体质之间的复杂关联性,建立的分类模型具有较好的精度与可解释性,为基于数据驱动的中医理论的科学化、智能化发展进行了有益的探索。  相似文献   

7.
基于ANFIS与量子BP神经网络(QBP)提出了一种基于自适应网络的量子模糊推理系统(ANQFIS)。不同于ANFIS,ANQFIS以量子门旋转的方式将模糊规则强度与QBP相结合,最后以量子态的测量概率作为输出,QBP的加入使得模型的输出准确率更高,且凭借量子计算的速度优越性提升了模型的计算速度。根据梯度下降法,给出了该系统中参数的学习算法。在仿真实验中,分别使用低维数据和高维数据作为数据集来训练模型,使用攻击算法生成对抗样本进行测试,结果表明ANQFIS在输出准确率、鲁棒性方面优于ANFIS与QBP。  相似文献   

8.
针对文本训练集中各个类别的样本分布不均衡时,少数类别的特征会被多数类别的特征淹没的问题,提出一种属性加权补集的朴素贝叶斯文本分类算法,该算法使用属性加权改进补集朴素贝叶斯算法,使用TF-IDF算法计算特征词在当前文档中的权重;利用当前类别补集的特征表示当前类别的特征并结合特征词在文档中的权重,解决分类器容易倾向大类别而忽略小类别的问题。与传统的朴素贝叶斯及补集朴素贝叶斯算法进行对比实验,结果表明:在样本集分布不均衡时,改进算法的性能表现最优,分类准确率、召回率及G-mean性能分别可达82.92%、84.6%、88.76%。  相似文献   

9.
基于贝叶斯算法的垃圾邮件过滤技术   总被引:8,自引:0,他引:8  
对基于朴素贝叶斯算法的垃圾邮件过滤技术进行了研究分析和实验验证.介绍了向量空间模型(VSM)方法以及特征向量抽取方法,推导和研究了引入“特征之间互相独立”假设的朴素贝叶斯分类算法.采用K次交叉验证的方法,以收集的一些邮件为语料,应用朴素贝叶斯分类算法,通过训练集计算得到类别的先验概率和特征项的类条件概率,并以此为基础对测试集中的邮件进行归属判断,以正确率和召回率为指标给出了实验结果.  相似文献   

10.
为了解决传统串行朴素贝叶斯算法分类性能低下的问题,提出一种基于朴素贝叶斯算法的并行化分类方法。选取多项式朴素贝叶斯,搭建Hadoop集群,通过卡方检验选取特征词,利用词频-逆文本频率指数方法计算出每个特征项的权值,并求出每类的权重总和,将权值应用到朴素贝叶斯公式中得到分类结果。实验结果表明:在该集群上设计的并行化朴素贝叶斯分类方法较比传统朴素贝叶斯方法,其精确率,召回率,F1值分别至少提高了7.66%,7.56%,11.98%,且用时更短,说明本文的方法能够提高处理文本的时间效率。  相似文献   

11.
针对不确定性数据的分类问题,提出一种基于直方图估计的不确定性朴素贝叶斯分类器(HU-NBC).基于直方图估计的思想,建立估计不确定性数据概率密度函数的数学模型,并利用该模型估计不确定性朴素贝叶斯分类器的类条件概率密度函数.实验结果表明,与同类型算法相比,基于直方图估计的HU-NBC算法拥有较优的分类精度、较小的时间代价和空间需求,适合解决数据量较大的不确定性数据分类问题.  相似文献   

12.
复杂性是大数据区别于传统数据的根本所在,大数据的复杂性必然带来不确定性,如何高效、安全、准确地处理大数据所具有的复杂性和不确定性问题已经成为实现大数据知识发现的前提和关键。该文分析了目前大数据环境下不确定性集合理论和大数据计算与分析方法、机器学习、量子计算及量子机器学习的研究现状和不足,展望了未来的发展趋势,指出在即将来临的“大数据+人工智能+量子计算”时代,将“大数据+不确定性集合理论+机器学习+量子计算”交叉融合研究既有理论和现实意义,又有实用价值,也必将成为智慧化时代大数据领域的研究热点。  相似文献   

13.
以人工神经网络(ANN)模型为基础,通过与量子并行计算、量子门线路以及变分量子线路等量子理论与量子力学概念相结合提出了一种优化的变分量子神经网络(VQNN)模型,该模型是由可在噪声中尺度量子(NISQ)设备上运行的量子线路结合机器学习(ML)策略构成的一种量子经典混合计算模型。其中量子线路由两部分组成:量子态编码线路用于将经典数据编码为量子态数据;变分量子线路(VQC)则学习目标状态并将信息编码到一个真实的量子数据结构之中。最终通过测量VQC量子态输出获得经典概率输出分布,利用经典计算机进行变分量子线路的参数优化处理,这种结构使得VQC与经典ML很容易地融合。进一步探索了使用VQNN来建立基于实际应用的分类器,将其应用在网络攻击检测领域。实验结果表明,对于KDD CUP99数据集,VQNN具有相对较高的检测性能,且均高于其他经典对比检测模型以及量子门线路神经网络模型。此外,该VQNN可以部署在近期绝大多数的NISQ设备中。同时,所提出的VQNN是首个可以部署在NISQ中进行网络攻击检测的模型。  相似文献   

14.
针对人体面部皮肤状态指标与中医体质类型之间的关联性进行科学、定量研究,从测试数据持续累积与知识发现深入推进的过程视角,尝试揭示人体内在中医体质与外观皮肤状态指标间的复杂动态演化规律。综合小样本条件下决策树的良好归纳特性及大样本条件下贝叶斯算法分类准确率高的优势。提出基于建模数据量会不断增多的趋势,构建可自适应修订决策树和模糊朴素贝叶斯融合分类算法的权重,以适用于测试数据从小到大积累过程中分类模型均具有较好分类特性及可解释性的应用要求。其中决策树采用最佳后剪枝方式,避免了常规决策树存在的过拟合弊端;朴素贝叶斯算法则通过定义指标归属区间的模糊隶属度来解决皮肤属性测试与分类中存在的随机性与模糊性。实证结果表明本文提出的分类模型的融合权重可动态调整且随着建模数据的增多分类精度会相应提高。目前对应151个建模数据的分类模型的分类准确率为86.7%,高于独立决策树、朴素贝叶斯的83.3%和80%,亦高于对照组80个建模数据对应分类准确率的76.7%。分析可得:此皮肤与体质动态分类模型通过有效利用参与建模的数据信息,能识别出人体面部外观皮肤状态指标与内在中医体质之间的复杂关联性,建立的分类模型具有较好的精度与可解释性,为基于数据驱动的中医理论的科学化、智能化发展进行了有益的探索。  相似文献   

15.
针对传统粗糙集属性约简算法无法高效处理日益增长的大数据问题,提出了一种基于云计算的多层量子精英属性协同约简算法。该算法首先在云计算MapReduce模型下将大规模数据集划分到不同的进化蛙群中,分别获得各子种群最优解;然后构造一种基于多层量子蛙群精英向量的属性协同约简策略,挑选出具有全局搜索和局部精化最强优化能力的精英子种群向量,快速引导各子种群找到各自最小属性约简集,从而取得大规模数据集的全局最优属性约简集。实验结果表明本文算法在大规模数据集上求解全局最优属性约简解的效率和精度具有明显优势,同时应用于电子病历数据库MRI分割效果表明其具有较强适用性。  相似文献   

16.
文本分类是数据挖掘领域中重要的研究分支.通过对自适应遗传算法和朴素贝叶斯分类器的研究,提出一种基于自适应遗传算法的朴素贝叶斯分类算法.将该算法应用于中文文本分类中,可以生成最优贝叶斯分类器及最优属性集合,提高分类精度.  相似文献   

17.
针对软件可靠性分配中存在多个优化目标的问题,提出了一种新的模糊多目标分配模型,并采用量子粒子群优化算法求解该模型。将软件可靠性和成本作为模糊目标函数,通过三角形隶属函数对模糊目标进行处理,将优化后的量子粒子群算法用来求解软件模糊可靠性分配模型。实验结果验证了文章提出的软件模糊可靠性分配模型是有效的,多目标的Pareto最优解为可靠性和成本之间的决策提供了依据。  相似文献   

18.
在自主研制的高精度声学探测系统采集的海洋哺乳动物声学数据基础上,提出一种基于Stacking分类融合的声学数据处理算法。该方法融合了支持向量机(Support Vector Machines, SVM)、K最近邻(K-Nearest Neighbor, KNN)、决策树(Decision Tree)、朴素贝叶斯(Naive Bayes model)4种单分类模型,并采用Labview软件开发,将采集的水下哺乳动物音频数据提取梅尔频率倒谱(Mel-Frequency Cepstrum Coefficient, MFCC)系数作为分类的特征参数用于对海洋哺乳动物分类。采用6个海洋哺乳动物种类共4 042个样本进行测试,和单分类模型识别率最高的SVM模型相比,该方法的识别率提升了3.30%,且在精准率、召回率、F1值等分类评估指标中也有更好的表现。  相似文献   

19.
针对垃圾邮件过滤过程中分类模型难以个性化、难以适应用户兴趣动态变化的问题,提出了一种基于用户行为的个性化邮件分类算法.算法通过分析朴素贝叶斯分类算法的原理,改造朴素贝叶斯的算法使其具有动态调整能力.实验结果表明此算法具有较高的分类精度.  相似文献   

20.
针对传统网页分类中存在的准确率和查全率不高、分类效率低的情况,提出一种基于朴素贝叶斯分类的网页预分类算法.算法根据用户的网上活动情况提取相关网址,分析网页内容和网页关键词,利用朴素贝叶斯分类算法进行分类,根据用户对各类网页的浏览情况分析用户的行为特征.采用改进的文本权值计算方法,并引进网址预分类机制,提高数据的处理效率以及分类的准确率.结果表明,网址分类算法准确,能够充分发掘用户的兴趣喜好,可以作为用户行为分析的数据算法进行商业推广和司法取证.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号