首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
贝叶斯算法在文本自动分类系统中的应用   总被引:3,自引:0,他引:3  
文本自动分类系统是信息处理的重要研究方向。它是指在给定的分类体系下,根据文本的内容自动判别文本类别的过程。本文将基于贝叶斯算法的文本分类技术。应用于Web文档进行自动分类,实验结果表明效果显著。  相似文献   

2.
针对传统贝叶斯分类算法无法满足复杂网络文本过滤需求,提出一种多词 贝叶斯分类算法(Multi Word-Bayes,MWB)。该算法一方面引入了特征权重(Term Frequency-Inverse Document Frequency,TF-IDF)的计算思想,优化了传统贝叶斯分类算法只考虑词频不考虑文本间关系的问题;另一方面将词与词间的关系作为文本分类的重要参考项,克服了传统贝叶斯分类算法在分类器训练上对语义分析的忽视。实验结果表明,MWB在垃圾文本过滤上具有更好的分类性能。  相似文献   

3.
针对标准遗传算法的不稳定性、准确性低等问题,为了提高遗传分类算法的稳定性和准确性,基于贝叶斯算法的有关理论,提出一种新的遗传算法分类方法.将初始样本集随机的分成数量相等的几组,通过朴素贝叶斯算法从初始样本集中选出部分“区分度”比较高的样本作为新的样本集,通过改进的遗传算法对选出的新样本集进行处理,从而得到最优分类规则.通过两种算法的组合对数据分类时,使分类的稳定性和准确性得到了明显的改善.仿真实验结果表明,该算法有较高的稳定性和准确性.  相似文献   

4.
根据分类技术建立入侵检测系统的思路,构造了一个基于贝叶斯分类的入侵检测系统模型。本文提出了利用未标记数据提高贝叶斯分类器性能的方法,可以大大提高入侵检测系统准确率和效率。  相似文献   

5.
提出一种改进的数据挖掘算法。首先采用ICTCLAS系统进行文本预处理,以词频特征构建词条向量;然后融合词频特征和词频-逆向文件频率特征,构建训练样本集的特征矩阵;接着对该矩阵进行奇异值分解变换,得到语义空间,用于对文本特征向量进行语义空间变换,得到语义向量;最后构建联合支持向量机分类器,实现中文书目所对应的语义向量的自动分类。最后做了大量的仿真实验,实验结果表明,本文方法的分类准确率高于现有方法。  相似文献   

6.
徐冰  郭绍忠  黄永忠 《计算机应用》2007,27(6):1548-1550
研究了利用朴素贝叶斯分类算法对电子邮件进行分类处理,引入了活跃网络和活跃度的概念,提出了犯罪组织通讯网络的描述算法以及组织结构的挖掘算法,实验证明了算法的有效性。  相似文献   

7.
针对朴素贝叶斯分类算法中缺失数据填补问题,提出一种基于改进EM(Expectation Maximization)算法的朴素贝叶斯分类算法。该算法首先根据灰色相关度对缺失数据一个估计,估计值作为执行EM算法的初始值,迭代执行E步M步后完成缺失数据的填补,然后用朴素贝叶斯分类算法对样本进行分类。实验结果表明,改进算法具有较高的分类准确度。并将改进的算法应用于高校教师岗位等级的评定。  相似文献   

8.
贝叶斯网络的结构学习是贝叶斯网络理论模型的核心,而现有的贝叶斯网络结构学习算法一般存在效率偏低的问题.针对此问题,文中提出基于混合差分蜂群算法的贝叶斯网络结构学习算法.该算法首先利用最大生成树准则得到初始种群,然后利用差分进化算法中的交叉、变异规则优化初始种群.在使用差分进化算法的过程中,分别将蜂群算法应用于变异阶段和优化改进交叉阶段,并且将云自适应理论应用于选择阶段选择生成个体.在经典贝叶斯网络上的仿真实验证明,文中算法在贝叶斯网络结构学习中具有较强的寻优能力.  相似文献   

9.
客户关系管理以客户为中心,通过再造企业组织体系和优化业务流程,展开系统的客户研究,最大程度地改善、提高了整个客户关系生命周期的绩效,从而提高客户的满意度和忠诚度,提高运营效率和利润收益。该文研究和探讨了客户关系管理系统开发的技术环节及实现过程,并对基于贝叶斯分类算法的客户流失分析模型的建立进行了分析。  相似文献   

10.
针对传统计算机杀毒产品对木马程序识别问题上存在的资源消耗和杀毒滞后问题,结合网络流量的分类算法提取各种应用服务流量的特征属性,文章采用朴素贝叶斯分类算法对网络中木马程序流量进行识别。这种方法可以在一定程度上解决现有计算机杀毒产品资源消耗和杀毒滞后的问题。实验结果表明,对于网络中处在待机状态下的木马程序产生的数据流识别效果明显,只需较少量的训练样本即可获得较高的识别率。  相似文献   

11.
随着移动通信技术的不断发展,手机的普及率在不断上升,而短信作为传统的移动通信服务,长久以来一直在人们的日常生活中占据着极为重要的位置。可以说,短信在一定程度上记录了人们生活的轨迹。但是,现有的短信管理系统仅对短信进行以联系人为特征分类、以时间为顺序显示的简单非智能化的管理,导致了用户手机中各类短信混杂不清,短信的管理效率极低。通过研究短信的特征,分析传统的基于文档频率的特征值提取方法和基于互信息的特征值提取方法的优势与不足,提出了一种适用于短信的基于词频和互信息的特征值提取方法,并结合短信长度实现了一种改进的贝叶斯分类算法。实验证明,算法在进行短信分类时可以得到相当可观的召回率和准确率。  相似文献   

12.
摘 要: 多维分类根据数据实例的特征向量将数据实例在多个维度上进行分类,具有广泛的应用前景。在多维分类算法的模型学习过程中,海量的训练数据使得准确的分类算法需要很长的模型训练时间。为了提高多维分类的执行效率,同时保持高的预测准确性,本文提出了一种基于贝叶斯网络的多维分类学习方法。首先,将多维分类问题描述为条件概率分布问题。其次,根据类别向量之间的依赖关系建立了条件树贝叶斯网络模型。最后,根据训练数据集对条件树贝叶斯网络模型的结构和参数进行学习,并提出了一种多维分类预测算法。大量的真实数据集实验表明,本文提出的方法与当前最好的多维分类算法MMOC相比,在保持高准确性的同时将模型的训练时间降低了两个数量级。因此,本文提出的方法更适用于海量数据的多维分类应用中。  相似文献   

13.
一种基于贝叶斯和神经网络的医学图像组合分类方法   总被引:1,自引:0,他引:1  
医学图像分类是当前医学图像自动诊断和模式识别领域的一个新的研究热点,其任务是从给定的医学图像训练样本中提取能反映图像内容的特征,并根据这些特征进行图像分类,实现医学图像中病变组织的自动识别,以保证临床医学诊断更客观、准确和科学.通过对医学图像分类中的一些关键问题分析和研究,提出一种基于贝叶斯和神经网络的医学图像组合分类方法,并据此构造出医学图像组合分类器.这种组合分类器能够充分发挥各个分类器的优点,获得较好的图像分类结果.  相似文献   

14.
基于云仿真环境数据挖掘的服务分类方法   总被引:2,自引:0,他引:2  
服务分类已成为影响服务发现和服务组合优化性能与效率的重要因素,为了有效实现Web服务分类,提出了一种云仿真环境的服务分类方法,采用三种服务特征向量提取方式,获取服务语法和语义的服务特征向量集,并在五种经典分类算法上训练特征向量集,生成最优的服务分类模型.仿真云模型环境服务的随机分布,由最优服务分类模型判定云平台中的服务类别.改进方法在1007个标准OWL-S描述的语义Web服务中进行了实验.实验结果表明,以综合服务特征提取方式,利用SVM分类算法训练的服务分类模型优于其它服务分类器.  相似文献   

15.
本文采用深度学习算法中的卷积神经网络对细胞图像进行识别, 实现对宫颈细胞图像的自动分类. 首先对宫颈细胞进行预处理, 通过细胞核裁剪解决图像输入尺寸不一的问题, 对图像进行翻转平移, 对数据集进行扩充, 并解决样本量不均衡的问题; 接着选取VGG-16网络进行改进, 使用改进后的VGG-16网络进行特征提取, 以及细胞分类; 并采用迁移学习的方法加载预训练网络参数, 进而加快参数收敛速度, 提高分类准确率; 最终通过对网络的训练, 得到了较好的分类结果, 将分类结果与人工提取特征设计分类器的方法相比, 分类的准确率有所提高, 二分类的准确率达97.3%, 七分类的准确率达89%. 实验结果表明: 卷积神经网络对宫颈细胞图像进行自动分类, 分类准确率相比较人工提取特征分类器效果较好, 且分类结果不受分割图像准确率的影响.  相似文献   

16.
低层特征的选择与提取是自动图像分类的基础,一方面,所选择的图像特征应能代表各种不同的图像属性,利于不同类别图像之间的区分;另一方面,为了提高后续模型的计算效率,需要减少噪声特征、冗余特征.提出了一种基于特征加权的自动图像分类方法.该方法根据图像低层特征分布的离散程度来衡量特征相对于类别的重要性,增加相关度高的特征的权重,降低相关度低的特征权重,从而避免后续模型被弱相关或不相关的特征所支配.所提的特征加权算法主要考察的是特征相对某个具体类别的重要程度,可以为每个类别选择出适合自身的特征权重.然后,将加权特征嵌入到支持向量机算法中用于自动图像分类,在Corel图像数据集上的实验结果表明,基于特征加权的自动图像分类算法可以有效地提高图像分类的准确性.  相似文献   

17.
分类问题是数据挖掘的一个重要研究课题.朴素贝叶斯分类器是分类问题中一种简单高效的分类学习技术.该分类器假定给定类标时属性之间相互条件独立,然而现实中属性之间往往具有一定的依赖关系.“属性-值”序偶构成的模式在分类问题中具有关键作用,许多研究者利用这种特定模式构造分类器,而特定模式所包含的属性与其他属性之间的依赖关系,将对分类结果产生重要影响.通过对属性间的依赖关系进行深入研究,提出基于选择性模式的贝叶斯分类算法,既利用了基于贝叶斯网络分类器的优秀分类能力,又通过进一步分析模式中属性之间的依赖关系,削弱了属性条件独立假设的限制.实验证明:根据数据集特点,深入挖掘高区分能力的模式,合理构建属性之间的依赖关系,有助于提升分类精度.实验分析表明:与基准算法NB,AODE相比,提出的分类算法在10个数据集上的平均精度分别提升了1.65%和4.29%.  相似文献   

18.
张娟  曾茂林 《软件》2011,(3):113-115,120
入侵检测技术越来越受到人们的关注。提出了一种用于入侵检测中警报分类的改进自适应贝叶斯算法,该算法减少了入侵检测中的积极错误。通过对标准数据测试集KDD99进行实验,证明了此方法在短应答时间里拥有极高的分类效率,而且只需要极少的计算资源来减少积极错误。  相似文献   

19.
一种基于类支持度的增量贝叶斯学习算法   总被引:1,自引:0,他引:1       下载免费PDF全文
丁厉华  张小刚 《计算机工程》2008,34(22):218-219
介绍增量贝叶斯分类器的原理,提出一种基于类支持度的优化增量贝叶斯分类器学习算法。在增量学习过程的样本选择问题上,算法引入一个类支持度因子λ,根据λ的大小逐次从测试样本集中选择样本加入分类器。实验表明,在训练数据集较小的情况下,该算法比原增量贝叶斯分类算法具有更高的精度,能大幅度减少增量学习样本优选的计算时间。  相似文献   

20.
张亚萍  胡学钢 《微机发展》2007,17(11):33-35
将K-means算法引入到朴素贝叶斯分类研究中,提出一种基于K-means的朴素贝叶斯分类算法。首先用K-means算法对原始数据集中的完整数据子集进行聚类,计算缺失数据子集中的每条记录与k个簇重心之间的相似度,把记录赋给距离最近的一个簇,并用该簇相应的属性均值来填充记录的缺失值,然后用朴素贝叶斯分类算法对处理后的数据集进行分类。实验结果表明,与朴素贝叶斯相比,基于K-means思想的朴素贝叶斯算法具有较高的分类准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号