首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 156 毫秒
1.
具有丢失数据的贝叶斯网络结构学习研究   总被引:40,自引:0,他引:40       下载免费PDF全文
王双成  苑森淼 《软件学报》2004,15(7):1042-1048
目前主要基于EM算法和打分-搜索方法进行具有丢失数据的贝叶斯网络结构学习,算法效率较低,而且易于陷入局部最优结构.针对这些问题,建立了一种新的具有丢失数据的贝叶斯网络结构学习方法.首先随机初始化未观察到的数据,得到完整的数据集,并利用完整数据集建立最大似然树作为初始贝叶斯网络结构,然后进行迭代学习.在每一次迭代中,结合贝叶斯网络结构和Gibbs sampling修正未观察到的数据,在新的完整数据集的基础上,基于变量之间的基本依赖关系和依赖分析思想调整贝叶斯网络结构,直到结构趋于稳定.该方法既解决了标准Gi  相似文献   

2.
潜变量模型在刻画因子之间的相互关系以及因子与观测变量之间的关联性时具有重要作用。在实际应用中,观测数据往往呈现出时序变异、多峰、偏态等特性,因此将经典的潜变量模型延伸到非齐次隐马尔可夫潜变量模型,并且为避免对完全数据的积分计算,将期望最大化(expectation-maximization,EM)算法引入到似然函数的计算上;采用Akaike信息准则和Bayes信息准则选择合适的模型,提出了相应的统计计算和检验方法,有效解决了隐马尔可夫模型中的最大估算似然函数问题;最后选择心理.健康数据进行了实验,实验结果表明该方法是有效的。  相似文献   

3.
目前,学习具有丢失数据的贝叶斯网络结构主要采用结合EM算法的打分-搜索方法和基于依赖分析的思想,其效率和可靠性比较低.本文针对此问题建立一个新的具有丢失数据的贝叶斯网络结构学习算法.该方法首先根据贝努里分布来表示数据库中变量结点之间的关系,并用Kullback-Leibler(KL)散度来表示同一结点的各个案例之间的相似程度,然后根据Gibbs取样来得出丢失数据的取值.最后,用启发式搜索完成贝叶斯网络结构的学习.该方法能够有效避免标准Gibbs取样的指数复杂性问题和现有学习方法存在的主要问题.  相似文献   

4.
贝叶斯网络结构模型的构建   总被引:1,自引:0,他引:1  
贝叶斯网络结构是一种将贝叶斯概率方法和有向无环图的网络拓扑结构有机结合的表示模型,它描述了数据项及其依赖关系,并根据各个变量之间概率关系建立图论模型,但是如何获取具有丢失数据的网络结构是一个急需解决的问题.本文提出一个基于Kullback-Leibler(KL)散度的贝叶斯网络结构学习的KLBN(Kullback-Leibler Bayesian Network)算法.实验结果表明,KLBN算法在可靠性方面明显优于传统的具有丢失数据的贝叶斯网络结构学习算法.  相似文献   

5.
目前,学习具有隐藏变量的贝叶斯网络结构主要采用结合EM算法的打分-搜索方法,其效率和可靠性低.本文针对此问题建立一种新的具有隐藏变量贝叶斯网络结构学习方法.该方法首先依据变量之间基本依赖关系、基本结构和依赖分析思想进行不考虑隐藏变量的贝叶斯网络结构学习,然后利用贝叶斯网络道德图中的Cliques发现隐藏变量的位置,最后基于依赖结构、Gibbs sampling和MDL标准确定隐藏变量的取值、维数和局部结构.该方法能够避免标准Gibbs sampling的指数复杂性问题和现有学习方法存在的主要问题.实验结果表明,该方法能够有效进行具有隐藏变量的贝叶斯网络结构学习.  相似文献   

6.
研究变量之间的预测能力在许多领域都有重要意义,通过这种研究,能够揭示变量之间的制约机制,贝叶斯网络是研究变量之间预测能力的有力工具.本文使用依赖分析方法建立基于贝叶斯网络的马尔科夫毯预测,其核心问题是贝叶斯网络结构学习.目前,基于依赖分析的贝叶斯网络结构学习方法主要存在三个问题:(1)需要进行大量的高维条件概率计算,(2)容易丢失弱联合依赖边,(3)对边的方向的确定具有局限性.针对这些问题,本文提出了首先进行递推条件独立性检验,然后进行因果语义定向,最后进行冗余边检验的贝叶斯网络结构学习方法.该方法能够有效地避免这些问题,更准确地建立马尔科夫毯预测.  相似文献   

7.
针对现有动态贝叶斯网络结构学习方法具有低效率和低可靠性等问题,基于变量之间的基本依赖关系和依赖分析方法进行动态贝叶斯网络结构学习。建立变量之间依赖关系草图,通过条件独立行检验去除多余的边,使用碰撞识别和条件相对预测能力确定边的方向,便可得到构成动态贝叶斯网络结构的先验网和转换网。该方法在效率和可靠性方面均具有优势。  相似文献   

8.
用于风险管理的贝叶斯网络学习   总被引:1,自引:0,他引:1       下载免费PDF全文
结合专家知识和数据进行贝叶斯网络学习.首先利用专家知识建立初始贝叶斯网络结构和参数;然后基于变量之间基本依赖关系、基本结构和依赖分析方法,对初始贝叶斯网络结构进行修正和调整,得到新的贝叶斯网络结构;最后将由专家和数据确定的参数合成为新的参数,得到融合专家知识和数据的贝叶斯网络.该方法可避免现有的贝叶斯网络学习过于依赖数据、对数据的数量和质量要求过高等问题.  相似文献   

9.
基于贝叶斯网络理论的TAN分类器无向依赖扩展   总被引:3,自引:0,他引:3  
基于贝叶斯网络理论,对TAN分类器进行无向网络依赖扩展,把属性变量之问的树结构扩展成可分解马尔科夫网络.使经过依赖扩展得到的分类器能够充分利用属性变量之间的依赖信息,提高分类能力,并能够通过调节阚值大小避免过度拟舍.  相似文献   

10.
对于存在噪声的可分解马尔可夫网络参数学习.目前可通过调整可分解马尔可夫网络的结构来增强其抗噪声能力,但调整后的结构往往会降低网络的有效性和可靠性,而且不能从源头上减少噪声对参数的影响.针对该问题,首先建立基于可分解马尔可夫网络理论的邻域最优预测;然后以变量为基本单位,使用预测值平滑噪声.实验结果显示,使用平滑后的数据进行参数学习,其可靠性能够得到显著的改进.  相似文献   

11.
马尔科夫网络中的隐藏变量学习   总被引:2,自引:0,他引:2  
吗尔科夫网络中的隐藏变量学习是一个重要而困难的研究课题.关于隐藏变量需要解决三个问题,它们是隐藏变量的位置,维数和取值,局部结构.根据马尔科夫网络中的Clique确定隐藏变量的位置;然后基于依赖结构和Gibbs sampling确定隐藏变量的取值和维数;最后利用MDL标准进行局部打分确定局部结构.试验结果表明,该方法能够有效地进行马尔科夫网络的隐藏变量学习.  相似文献   

12.
小数据集的贝叶斯网络结构学习   总被引:4,自引:0,他引:4  
针对直接基于小数据集贝叶斯网络结构学习不可靠, 以及目前对小数据集的处理只强调扩展而忽略对扩展数据的修正等, 提出了将扩展与修正相结合的小数据集处理机制, 以及在此基础上的基于结点排序和局部打分--搜索的贝叶斯网络结构学习方法. 可不需要完全结点顺序的先验知识, 但能够结合专家的部分结点顺序信息. 实验结果显示了这种方法的有效性和可靠性.  相似文献   

13.
Classification trees: an alternative to traditional land cover classifiers   总被引:1,自引:0,他引:1  
Classification trees are a powerful alternative to more traditional approaches of land cover classification. Trees provide a hierarchical and nonlinear classification method and are suited to handling non-parametric training data as well as categorical or missing data. By revealing the predictive hierarchical structure of the independent variables, the tree allows for great flexibility in data analysis and interpretation. In this Letter, we compare a tree' s performance to that of a maximum likelihood classifier using a 1° by 1° global data sel. The tree's accuracy in classifying a validation dala set is comparable to that when using maximum likelihood (82 per cent). The tree also may be used to reduce the dimensionality of data sets and to find those metrics that are most useful for discriminating among cover types.  相似文献   

14.
现有的关系学习研究都是基于完备数据进行的,而现实问题中,数据通常是不完备的.提出一种从不完备关系数据中学习概率关系模型(probabilistic relational models,简称PRMs)的方法——MLTEC(maximum likelihood tree and evolutionary computing method).首先,随机填充不完备关系数据得到完备关系数据.然后从每个随机填充后的数据样本中分别生成最大似然树并作为初始PRM网络,再利用进化过程中最好的网络结构反复修正不完备数据集,最后得到概率关系模型.实验结果显示,MLTEC方法能够从不完备关系数据中学习到较好的概率关系模型.  相似文献   

15.
Efficient Markov Network Structure Discovery Using Independence Tests   总被引:1,自引:0,他引:1  
We present two algorithms for learning the structure of a Markov network from data: GSMN* and GSIMN. Both algorithms use statistical independence tests to infer the structure by successively constraining the set of structures consistent with the results of these tests. Until very recently, algorithms for structure learning were based on maximum likelihood estimation, which has been proved to be NP-hard for Markov networks due to the difficulty of estimating the parameters of the network, needed for the computation of the data likelihood. The independence-based approach does not require the computation of the likelihood, and thus both GSMN* and GSIMN can compute the structure efficiently (as shown in our experiments). GSMN* is an adaptation of the Grow-Shrink algorithm of Margaritis and Thrun for learning the structure of Bayesian networks. GSIMN extends GSMN* by additionally exploiting Pearl's well-known properties of the conditional independence relation to infer novel independences from known ones, thus avoiding the performance of statistical tests to estimate them. To accomplish this efficiently GSIMN uses the Triangle theorem, also introduced in this work, which is a simplified version of the set of Markov axioms. Experimental comparisons on artificial and real-world data sets show GSIMN can yield significant savings with respect to GSMN*, while generating a Markov network with comparable or in some cases improved quality. We also compare GSIMN to a forward-chaining implementation, called GSIMN-FCH, that produces all possible conditional independences resulting from repeatedly applying Pearl's theorems on the known conditional independence tests. The results of this comparison show that GSIMN, by the sole use of the Triangle theorem, is nearly optimal in terms of the set of independences tests that it infers.  相似文献   

16.
王双成  郑飞  张立 《软件学报》2021,32(10):3068-3084
贝叶斯网络是研究变量之间因果关系的有力工具,基于贝叶斯网络的因果关系学习包括结构学习与参数学习两部分,其中,结构学习是核心.目前,贝叶斯网络主要用于发现非时间序列数据中所蕴含的因果关系(非时间序列因果关系),从数据中学习得到的也均是一般变量之间的因果关系.针对这些情况,结合时间序列预处理、时间序列变量排序、转换数据集构建和局部贪婪打分-搜索等进行时间序列的因果关系学习;再将包括分段在内的时间序列预处理、时间序列段的因果关系结构学习、因果关系结构数据集构建、因果关系变量排序和局部贪婪打分-搜索等相结合,来进行元因果关系(因果关系变量之间的因果关系)学习,从而实现两个层次的时间序列因果关系学习,为进一步的量化因果分析奠定了基础.分别使用模拟、UCI和金融时间序列数据进行实验与分析,实验结果显示,基于贝叶斯网络能够有效地进行时间序列的因果关系和元因果关系学习.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号