首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 734 毫秒
1.
Bayes文本分类器的改进方法研究   总被引:4,自引:2,他引:4  
鲁明羽 《计算机工程》2006,32(17):63-65
在文本分类领域,Bayes分类器是一种常用且效果较好的、基于概率的分类器,具有较严密的理论基础。该文对朴素Bayes文本分类器进行了分析,提出了利用权值调整机制改善其分类性能的方法,以及在缺乏大量训练文本的情况下,利用EM算法进行非监督Bayes分类的方法,并讨论了如何运用启发式方法确定Bayes网络结构,在更贴近真实环境的情况下进行文本分类。  相似文献   

2.
基于模糊聚类和Naive Bayes方法的文本分类器   总被引:3,自引:0,他引:3       下载免费PDF全文
本文提出一种文本分类的新方法,该方法将模糊聚类与基于Naive Bayes的EM分类算法相结合,从而大大提高了EM分类算法的准确性,并解决了使用字符匹配引起的不完整性和不准确性问题。该方法首先给出每个类的一些关键词,并把这些关键词作为聚类中心进行聚类,然后使用距离聚类中心较近的文档启动一个引导过程。  相似文献   

3.
为提高分类精度,提出一种基于最大期望(EM)与遗传(GA)算法的多尺度SAR图像无监督分类方法.利用多尺度自回归(MAR)模型描述SAR图像中不同尺度之间的统计相依性,提取多尺度特征.应用混合模型描述多尺度特征,并将GA算法与EM算法相结合给出混合模型的参数估计算法,利用最小描述长度(MDL)准则选择模型的分量教.最后使用Bayes分类器实现了图像的分类与分割.该方法集EM算法和GA算法结合后的优点,对设定初值有较少的敏感性,因而避免了局部最优解.应用于SAP图像的实验表明,在分割精度上GA-EM方法优于MAR模型的算法.  相似文献   

4.
文本自动分类中的词权重与分类算法   总被引:19,自引:2,他引:17  
本文详细阐述了自动分类中的词与文献的相关权重的经典计算方法IDF(Inverse Document Frequency) ,进一步总结了两种典型的分类算法——Bayes判别准则与向量空间模型(VSM) ,并提出结合词权重和分类算法进行分类的具体公式以及相关实验结果。  相似文献   

5.
TFIDF_NB协同训练算法   总被引:2,自引:0,他引:2  
采用少量已标记和大量未标记文档进行文本分类已成为一种重要研究趋势 .在分析了 EM和联合训练 (Co-training)两类算法的基础上 ,提出一种新的协同训练算法 .该算法利用 Bayes和 TFIDF两种分类器结合少量已标记和大量未标记文档协同增量训练 .实验结果表明 ,协同训练算法正确率较高 ,平均错误率较 EM和联合训练低 ,具有较好的性能  相似文献   

6.
借鉴半监督分类的思想,本文提出一种基于改进EM算法的贝叶斯分类模型,对移动通信网络中存在的大量随机缺失的非平衡数据进行分类。首先,从实际数据中经过初步统计分析得到能在一定程度上反应变量状态的先验概率,并以此作为贝叶斯分类模型的初始值进行EM迭代训练,从而减少EM算法的迭代次数并改善EM算法对初始值的敏感性以及局部收敛的缺陷;然后,利用对历史移动通信数据进行训练得到的叶斯网络分类模型,对测试数据进行预测分类。实验结果表明,该方法大大提高了移动通信数据中负类样本的预测成功率,与传统的数理统计分析方法相比较,表现出了更好的性能。  相似文献   

7.
基于危险理论的动态垃圾邮件过滤模型   总被引:1,自引:1,他引:0       下载免费PDF全文
基于危险理论,建立了一个垃圾邮件过滤模型DTDEF,对过滤垃圾邮件具有一定的动态性、学习的自适应性和分类的有效性,给出了该模型的基本架构及其具体实现算法,并通过与Bayes算法比较,表明该模型相对Bayes方法在邮件过滤时具有更好的动态性和有效性。  相似文献   

8.
针对朴素贝叶斯分类算法中缺失数据填补问题,提出一种基于改进EM(Expectation Maximization)算法的朴素贝叶斯分类算法。该算法首先根据灰色相关度对缺失数据一个估计,估计值作为执行EM算法的初始值,迭代执行E步M步后完成缺失数据的填补,然后用朴素贝叶斯分类算法对样本进行分类。实验结果表明,改进算法具有较高的分类准确度。并将改进的算法应用于高校教师岗位等级的评定。  相似文献   

9.
基于相似粗集理论模型,对加权朴素Bayes算法进行了扩展,同时改进了传统不完备信息系统中缺失信息的弥补方法,并由此提出了基于不完备信息系统的加权Bayes分类算法,阐述了其对于不完备系统数据挖掘的重要意义,通过计算机仿真实验验证了该方法的有效性.  相似文献   

10.
刘保利 《计算机应用》2008,28(4):990-992
基于最大期望(EM)算法与遗传算法(GA),提出一种有效的多尺度SAR图像无监督分割方法。该方法首先利用混合多尺度自回归(MMAR)模型描述SAR图像中由于雷达斑点所引起的不同尺度和同一尺度内像素之间的统计相依性; 然后将GA与EM结合给出MMAR模型的参数估计算法。这种算法利用最小描述长度(MDL)准则,能够选择模型的分量数;最后利用Bayes分类器实现图像的分割。该方法集遗传算法和EM算法的优点,对初始值有较少的敏感性,避免局部最优解,提高了分割精度。实验结果表明GA EM方法优于EM算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号