首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
文本分类是数据挖掘领域中重要的研究分支.通过对自适应遗传算法和朴素贝叶斯分类器的研究,提出一种基于自适应遗传算法的朴素贝叶斯分类算法.将该算法应用于中文文本分类中,可以生成最优贝叶斯分类器及最优属性集合,提高分类精度.  相似文献   

2.
保持隐私的朴素贝叶斯分类   总被引:3,自引:0,他引:3       下载免费PDF全文
隐私保护是数据挖掘中很有意义的研究方向。本文所关心的问题是如何在两个私有数据库的联合样本集上施行数据挖掘算法,同时保证不向对方泄露任何与结果无关的数据库信息。这种情形在科研合作等领域已经屡见不鲜。针对数据分类算法中应用非常普遍的朴素贝叶斯分类算法,我们利用安全两方计算协议,给出一个保持隐私的朴素贝叶斯分类协议,在保持计算隐私性的同时,协议在计算复杂度和传输复杂度与一般的贝叶斯分类非常接近,协议是高效可行的。  相似文献   

3.
为了提高电子邮件中垃圾邮件的过滤准确率和效率,以x-依赖的贝叶斯分类模型为基础,提出了一种新的N平均1-依赖邮件过滤模型.该模型利用N个1-依赖贝叶斯分类的平均概率估计值来对邮件的类别进行判别.实验证明,该模型可大幅度提高分类精度,得到更低的分类错误率,分类速度也令人满意.  相似文献   

4.
模式分类旨在依据识别对象特征的观察值将其归并至某个类别,贝叶斯分类决策可实现模式分类.给出一类遵从特征观察量独立性假设的贝叶斯分类器即朴素贝叶斯分类器设计.并给出朴素贝叶斯分类器的分类误差估计方法.理论分析与实验结果表明,朴素贝叶斯分类器设计方案可行,且其分类误差估计方法有效,可用于模式分类事务处理.  相似文献   

5.
基于朴素贝叶斯算法的垃圾邮件过滤器是目前比较高效、经济的垃圾邮件过滤技术之一,它已经广泛应用到垃圾邮件过滤领域。文章在对朴素贝叶斯过滤器分析的基础上,针对朴素贝叶斯算法的缺陷结合损失最小化的思想,并根据垃圾邮件的特性对朴素贝叶斯算法做了改进,提出了改进朴素贝叶斯算法,该算法能够通过调整k值,降低合法邮件被错判为垃圾邮件的概率,从而最大程度减少用户的损失。  相似文献   

6.
提出使用朴素贝叶斯作为核心算法来产生自动化测试用例的方法,将分类的思想引入到自动化测试用例的生成中.通过实验验证此生成测试用例方法的可行性.  相似文献   

7.
针对朴素贝叶斯算法应用于反垃圾邮件过滤时,其有效性十分依赖于对邮件内容的有效建模,而邮件内容建模方面研究尚不成熟限制了贝叶斯方法在垃圾邮件过滤中的性能.采用了三种概率分布对邮件内容进行建模,据此提出了3种概率分布下的朴素贝叶斯算法.为了提高训练效率,算法采用了一种增量式的垃圾邮件过滤方法.在trec05p-1、trec06p两个公开数据集上对这3种贝叶斯算法进行了实验对比,分析出三种贝叶斯分布的适用范围.从不同分布的邮件内容建模角度出发,为过滤垃圾邮件的方法选择提供了有效依据.  相似文献   

8.
针对武器装备试验数据挖掘问题,在朴素贝叶斯预测的基础上,引入遗传算法修正影响因素水平的权重系数,构建一种基于改进朴素贝叶斯的武器装备性能预测模型.通过某地面突击装备火力打击毁伤概率预测案例,验证改进朴素贝叶斯预测模型与传统贝叶斯性能预测模型相比具备更高的预测准确性,可为装备试验数据挖掘提供更为可靠的方法.  相似文献   

9.
针对传统单点串行的分类算法在面对新闻数据规模较大、分类属性较多时存在效率低的问题,本文研究了朴素贝叶斯分类算法在MapReduce下的并行实现方法.首先对新闻信息进行分词、格式转换等预处理,然后进行特征提取、分类模型构造;最后进行了分类测试.测试结果表明,在大数据量的情况下,并行化的贝叶斯算法较传统的贝叶斯算法具有更好的执行效率和较高的扩展性.  相似文献   

10.
基于粗糙集和朴素贝叶斯的垃圾邮件过滤系统   总被引:1,自引:1,他引:0  
提出了基于粗糙集理论和贝叶斯分类算法的垃圾邮件过滤方法。利用粗糙集约简算法对邮件样本集进行特征约简,删除对邮件过滤结果影响不大的冗余特征,从而降低了输入样本集的维数,解决了贝叶斯分类器训练时间长,样本集占用的存储空间过大的问题。实验证明,该方法可以提高邮件过滤  相似文献   

11.
基于知识语义权重特征的朴素贝叶斯情感分类算法   总被引:1,自引:0,他引:1  
针对文档级情感分类的准确率低于普通文本分类的问题, 提出一种基于知识语义权重特征的朴素贝叶斯情感分类算法.首先, 通过特征选择的方法, 对情感词典中的词进行重要度评分并赋予不同权重.然后, 基于词典极性的分布信息与文档情感分类的相关性, 将情感词的语义权重特征融合到朴素贝叶斯分类中, 实现了新算法.在标准中文数据集上的实验结果表明, 提出的算法在准确率、召回率和F1测度值上都优于已有的一些算法.  相似文献   

12.
SVM回归与朴素贝叶斯分类相结合的变压器故障诊断   总被引:1,自引:0,他引:1  
针对传统变压器故障诊断中的对于原始测试数据完备性和准确性的限制,提出并构建用于变压器故障诊断的NB模型;并在此基础上针对NB模型缺失关键属性时诊断性能大大降低的弱点,提出用SVM回归法填补缺失属性,构建SVM回归预测与NB相结合的变压器故障诊断模型。实验表明在属性缺失多及缺失关键属性时,SVM回归预测的应用能够明显提高诊断的正判率。  相似文献   

13.
QPSO算法在朴素贝叶斯分类上的应用研究   总被引:1,自引:0,他引:1  
朴素贝叶斯分类假定类条件独立,使得所选数据集的条件属性集在预处理时必须进行属性约简,如果处理不当,就会造成分类的不准确.本文分别对在训练集上随机选取的属性子集组成粒子,构造适应度函数,从而构建了朴素贝叶斯分类器,并利用量子粒子群算法对分类效果进行择优操作.实验证明,其分类效果优于传统的朴素贝叶斯分类方法.  相似文献   

14.
针对正交空时分组码(O-STBC)达不到满速率的情况,基于Tarokh的空时编码设计准则,提出了一种新的满速率准正交空时编码(Q-O-STBC)矩阵,再经过适当的调制星座旋转得到满分集Alamouti空时星座旋转(A-STCR)分组码.介绍了A-STCR编码的编码结构与译码方法,证明了该编码的有效性.对A-STCR编码的性能进行了Matlab仿真,并与其他空时分组码作了比较,证实了A-STCR分组码的性能优越型.  相似文献   

15.
一种基于朴素贝叶斯的中文评论情感分类方法研究   总被引:1,自引:1,他引:1  
提出一种新的基于朴素贝叶斯的中文文本情感分类方法。该方法用情感短语作为文本特征,通过情感词典与否定副词相结合,提取情感短语,通过CHI统计法设定阈值进行特征提取,再利用朴素贝叶斯分类器进行情感分类计算。对不同CHI阈值、不同语料库、以情感短语为特征和以情感词为特征进行分类实验。实验表明,以情感短语作为特征进行朴素贝叶斯分类,在不同领域的评论中均获得了较高的查准率和查全率,证明了该方法的可行性。  相似文献   

16.
基于可信列表的启发式流量检测模型   总被引:1,自引:0,他引:1  
在分析了现有流量检测技术不足的基础上提出了一种基于可信列表的启发式流量检测方法。该方法采用了“记忆”技术,通过将已识别的连接加入到一个可信列表中,并实时优化该列表,使得比较活跃的网络连接始终能够在列表中优先被检测到,从而加快流量检测速度,提高准确度。实验证明,该方法对加密流量的检测效果非常理想,相比于现有检测方法更具效率,识别率可达到95%以上。  相似文献   

17.
基于朴素贝叶斯的电网用户行为分析   总被引:1,自引:0,他引:1  
针对电网数据利用率低、精度低、分析结果粗糙和分析层面浅等问题,提出了一种基于朴素贝叶斯分析的电网用户行为分析方法.使用模糊C均值聚类将电网用户的用电数据聚类为不同的用电模式,使用朴素贝叶斯分类器将用户的用电行为分为不同的类别,提取出其中主要的用电模式.某纺织企业的48点负荷数据仿真与测试结果表明,所提出方法在分析用户用电模式时的有效性良好,为电力系统的调控与运行提供了一种合理、有效的方法.  相似文献   

18.
为解决路面积雪状态(轻微、严重)检测问题以保证行车安全,利用监控视频得到路面实时状态,采用朴素贝叶斯分类方法进行积雪状态检测。首先利用机器视觉和视频目标分割方法提取视频中路面视觉特征,然后采用朴素贝叶斯分类方法进行路面积雪状态分类,通过实验,综合比较了朴素贝叶斯分类与KNN分类、人工神经网络(ANN)、支撑向量机(SVM)在路面积雪状态检测问题中的有效性,结果表明,朴素贝叶斯分类器更适合积雪状态的分类。  相似文献   

19.
为了更高效准确地检测到P2P数据流,将目前在数据挖掘等领域比较成熟的决策树分类技术应用到截包分析研究中.在实际应用中,通过对流的特征属性进行计算统计处理作为训练样本集建立决策树,并对建立的决策树进行剪技优化,实验表明决策树分类技术更能快速准确地定位P2P数据流,在实时处理大量数据方面更能体现决策树分类技术的效率与准确度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号