首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
惠孛  吴跃  陈佳 《计算机科学》2006,33(5):110-112
使用朴素的贝叶斯(NB)分类模型对邮件进行分类,是目前基于内容的垃圾邮件过滤方法的研究热点。朴素的贝叶斯在参数之间联系不强的时候分类效果简单而有效。但是朴素的贝叶斯分类模型中对特征参数的条件独立假设无法表达参数之间在语义上的关系,影响分类性能。在朴素的贝叶斯分类模型的基础上,我们提出了一种双级贝叶斯分类模型(DLB,Double Level Bayes),既考虑到了参数之间的影响又保留了朴素的贝叶斯分类模型的优点。同时时DLB模型与朴素的贝叶斯分类模型的性能进行比较。仿真实验表明,DLB分类模型在垃圾邮件过滤应用中的效果在大部分条件下优于朴素的贝叶斯分类模型。  相似文献   

2.
贝叶斯分类在入侵检测中的应用研究   总被引:2,自引:0,他引:2  
根据分类技术建立入侵检测模型的思路,构造了一个基于贝叶斯分类的入侵检测原型系统。为了解决该方法存在的训练数据集问题,本文改进了现有的贝叶斯分类算法,提出了利用未标记数据提高贝叶斯分类器性能的方法。实验表明,这种方法取得了很好的效果。  相似文献   

3.
基于稀疏贝叶斯分类器的汽车车型识别   总被引:2,自引:0,他引:2  
稀疏贝叶斯方法在处理分类问题上具有良好的推广性,并且使用较少的核函数,介绍了一个实时的车型识别系统.它以每点色彩信息的高斯混合模型来实现对视频图像的背景估计,从而实现对汽车的检测;利用稀疏贝叶斯分类器对检测到的汽车进行车型分类,实验结果表明稀疏贝叶斯分类器不仅具有支持向量机的性能,而且比SVM使用更少的核函数.实验取得了较好的分类效果.  相似文献   

4.
本文对诗词采用向量空间模型来表示,基于机器学习中的朴素贝叶斯等方法,首次提出了古典诗词的豪放和婉约风格判别计算模型,并用遗传算法对模型进行改进,取得较好的诗词风格判别结果。该模型已经在精典诗词语料的机器学习基础上得以实现,并且获得较好的诗词风格判别效果。  相似文献   

5.
近年来,概率逻辑学习研究取得了很大进展,已经提出各种不同的形式化方法和学习方法,包括概率关系模(PRMs)、贝叶斯逻辑程序(BLPs)、逻辑贝叶斯网络(LBNs)和随机逻辑程序(SLPs)等。文章重点介绍了贝叶斯网络与一阶逻辑的结合,并以PRMs、BLPs和LBNs为例,描述了基于贝叶斯网络的概率逻辑模型(PLMs)的知识表示方法,给出了此类PLMs一般使用的参数估计方法和结构学习方法,并给出了建议的研究方向。  相似文献   

6.
覃俊  肖荣 《计算机应用》2012,32(4):1086-1089
对搜索引擎用户行为进行聚类分析有利于为用户提供个性化的服务。为了能准确地刻画用户行为的动态性,提出利用马尔可夫混合模型,对电子商务搜索引擎的用户行为模式聚类。模型假设每一类用户行为可表示为一个马尔可夫模型,当用户使用搜索引擎时,每个用户以一定的概率属于某一聚类;该用户的行为序列,由对应的马尔可夫模型产生。同时,为了解决参数估计和模型自动选择的问题,将贝叶斯阴阳和谐学习理论应用于该混合模型,提出针对该模型的和谐度函数及自适应梯度算法。仿真实验结果表明,与传统的最大期望(EM)算法相比,基于贝叶斯阴阳机的自适应梯度算法能更高效和准确地同时进行参数学习和模型选择。最后,将所提出的聚类方法应用于真实的电子商务搜索引擎点击日志,初步验证了本模型的有效性。  相似文献   

7.
朴素贝叶斯分类模型一种简单而高效的分类模型.但它的条件独立性假设使其无法将属性间的依赖表达出来,影响了它分类的正确率。属性间的依赖关系与属性本身的特性有关,有些属性的特性决定了其他属性必然依赖于它.即强属性。文中通过分析属性相关性的度量和贝叶斯定理的变形公式,介绍了强属性的选择方法,通过在强弱属性之间添加增强弧以弱化朴素贝叶斯的独立性假设.扩展了朴素贝叶斯分类模型的结构。在此基础上提出一种基于强属性限定的贝叶斯分类模型SANBC。实验结果表明,与朴素贝叶斯分类模型相比,SANBC分类模型具有较高的分类正确率。  相似文献   

8.
贝叶斯网络及其在决策支持系统中的应用   总被引:5,自引:0,他引:5  
以贝叶斯概率和贝叶斯网络基本理论为基础,主要研究了贝叶斯网络的结构学习和使用贝叶斯网络进行知识发现和决策支持的方法。利用WILD算法对防洪数据进行了属性离散化,采用K2算法在防洪决策中建立了一种贝叶斯网络模型,并对该模型进行了概率依赖关系描述。说明了贝叶斯网络对数据库进行知识发现和决策支持的有效性。  相似文献   

9.
反垃圾邮件技术已成为人们关注的一个焦点。基于贝叶斯理论的垃圾邮件过滤技术有着独特的优势,而其中的朴素贝叶斯模型具有算法简单、有效,易于实现等优点而成为最常用的模型。本文系统地介绍了朴素贝叶斯及其扩展模型的核心思想,并对朴素贝叶斯模型的发展作了大胆的预测,这对贝叶斯垃圾邮件过滤技术具有理论和现实的意义。  相似文献   

10.
根据软件项目的特点以及软件项目进度的安排,本文提出了基于贝叶斯网络的软件项目进度管理模型,在PERT图的基础上构造贝叶斯网络模型,由专家判断和工程经验确定网络中的概率参数。该模型可实现对项目进展情况的监控和控制,识别开发中对项目影响的不确定性因素,并进行反向参数学习,从而可以及时地调整不合理的开发进度,以达到优化的作用。仿真实验结果表明,该模型与实际情况相符合,应用于实际项目开发中取得了很好的效果。  相似文献   

11.
Finite mixture is widely used in the fields of information processing and data analysis. However, its model selection, i.e., the selection of components in the mixture for a given sample data set, has been still a rather difficult task. Recently, the Bayesian Ying-Yang (BYY) harmony learning has provided a new approach to the Gaussian mixture modeling with a favorite feature that model selection can be made automatically during parameter learning. In this paper, based on the same BYY harmony learning framework for finite mixture, we propose an adaptive gradient BYY learning algorithm for Poisson mixture with automated model selection. It is demonstrated well by the simulation experiments that this adaptive gradient BYY learning algorithm can automatically determine the number of actual Poisson components for a sample data set, with a good estimation of the parameters in the original or true mixture where the components are separated in a certain degree. Moreover, the adaptive gradient BYY learning algorithm is successfully applied to texture classification.  相似文献   

12.
文章针对统一背景模型与群模型两种反模型进行了分析,在基于统一背景模型与群模型的改进说话人确认模型的基础上,将贝叶斯自适应算法引入到基于高斯混合统一背景模型的说话人确认系统,解决了说话人确认中存在的模型不匹配问题,通过文本无关的测试语音库进行的实验和分析显示,改进算法具有更好的识别效果。  相似文献   

13.
Mixture model based clustering (also simply called model-based clustering hereinafter) consists of fitting a mixture model to data and identifying each cluster with one of its components. This paper tackles the model selection and parameter estimation problems in model-based clustering so as to improve the clustering performance on the data sets whose true kernel distribution functions are not in the family of assumed ones, as well as with inherently overlapped clusters. Being tailored to clustering applications, an effective model selection criterion is first proposed. Unlike most criteria that measure the goodness-of-fit of the model only to generate data, the proposed one also evaluates whether the candidate model provides a reasonable partition for the observed data, which enforces a model with well-separated components. Accordingly, an improved method for the estimation of mixture parameters is derived, which aims to suppress the spurious estimates by the standard expectation maximization (EM) algorithm and enforce well-supported components in the mixture model. Finally, the estimation of mixture parameters and the model selection is integrated in a single algorithm which favors a compact mixture model with both the well-supported and well-separated components. Extensive experiments on synthetic and real-world data sets are carried out to show the effectiveness of the proposed approach to the mixture model based clustering.  相似文献   

14.
准确获取相互遮挡粘连目标的位置特征,是在视野有重叠区域条件下进行相机间目标识别的关键。提出首先构造人体模型,利用贝叶斯模型将粘连目标的分割问题转换为求解最大后验概率问题,然后依据获得的目标轴线特征,在不同的相机间按照最小距离原则进行相同目标的匹配识别。结果表明,利用人体模型进行人群分割的抗干扰能力强,目标识别的准确率较高。  相似文献   

15.
朱杰  陈黎飞 《计算机应用》2017,37(4):1026-1031
针对类属型数据聚类中对象间距离函数定义的困难问题,提出一种基于贝叶斯概率估计的类属数据聚类算法。首先,提出一种属性加权的概率模型,在这个模型中每个类属属性被赋予一个反映其重要性的权重;其次,经过贝叶斯公式的变换,定义了基于最大似然估计的聚类优化目标函数,并提出了一种基于划分的聚类算法,该算法不再依赖于对象间的距离,而是根据对象与数据集划分间的加权似然进行聚类;第三,推导了计算属性权重的表达式,得出了类属型属性权重与其符号分布的信息熵成反比的结论。在实际数据和合成数据集上进行了实验,结果表明,与基于距离的现有聚类算法相比,所提算法提高了聚类精度,特别是在生物信息学数据上取得了5%~48%的提升幅度,并可以获得有实际意义的属性加权结果。  相似文献   

16.
17.
Bayesian inference and prediction for a generalized autoregressive conditional heteroskedastic (GARCH) model where the innovations are assumed to follow a mixture of two Gaussian distributions is performed. The mixture GARCH model can capture the patterns usually exhibited by many financial time series such as volatility clustering, large kurtosis and extreme observations. A Griddy-Gibbs sampler implementation is proposed for parameter estimation and volatility prediction. Bayesian prediction of the Value at Risk is also addressed providing point estimates and predictive intervals. The method is illustrated using the Swiss Market Index.  相似文献   

18.
为提高图像分割的抗噪鲁棒性并解决分割数目的自适应确定问题,通过在聚类标签先验概率的折棍构造过程中建立Markov随机场,将空间相关性约束引入Dirichlet过程混合模型的概率建模,使聚类的空间平滑性得以增强,并采用变分推断方法获得聚类标签的收敛解析解,提出一种基于折棍变分贝叶斯推断的图像分割算法,实现了对像素聚类标签和分割数目的同步自适应学习,避免了传统方法中因引入空间相关性约束而出现的计算复杂问题.基于Berkeley BSD500图像测试数据集的数值实验结果表明,该算法具有比现有的混合模型聚类图像分割算法更高的PRI值,且在低于0.1的噪声方差条件下表现出了更优的抗噪鲁棒性.  相似文献   

19.
层次聚类是一种重要的数据分析技术。传统的层次聚类方法大都采用欧式距离度量类之间相似度,不能有效处理类之间重合和类密度变化大的情况。文中提出一种基于贝叶斯和谐度的层次聚类方法,采用和谐度增幅代替传统层次聚类方法采用的欧式距离。贝叶斯和谐度取自于贝叶斯阴阳和谐学习理论,能衡量整个数据的分布情况和指导选择合适的类别数。文中方法根据和谐度的变化来度量类之间的相似度,能克服传统层次聚类的缺点;同时更易选择阈值终止层次聚类的合并,从而产生合适的类别数。最后通过两个实验验证文中方法的有效性。  相似文献   

20.
对于概率模糊聚类,贝叶斯模糊聚类方法表现出良好的聚类性能,它从先验知识和贝叶斯理论的角度出发,采用最大后验概率理论处理模糊划分,进而获取最终的聚类结果.该方法有效地结合了概率论和模糊论两者的优点,较之传统的模糊聚类算法(如FCM算法),该方法能够获取全局最优解并估计聚类个数.但在大数据时代,该方法较高的时间复杂度限制了它的实用性.针对此问题,首先在贝叶斯模糊聚类中引入加权机制,提出了加权贝叶斯模糊聚类算法;然后将其与单趟聚类框架相结合,提出了面向大规模数据的快速单趟贝叶斯模糊聚类算法,并从理论上对相关性质进行了较为深入的分析.所提出的单趟贝叶斯模糊聚类新算法较之贝叶斯模糊聚类算法在时间复杂度和收敛性上均有着不同程度的性能提升,同时继承了贝叶斯模糊聚类的良好的聚类性能.最后,相关实验结果亦验证了所提方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号