首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
蔡瑞初  白一鸣  乔杰  郝志峰 《计算机应用》2021,41(10):2793-2798
因果推断方法可以用于在观察数据上发现因果关系。在因果结构含混淆因子的数据上进行因果推断时,可能会受混淆因子的影响而得到错误的因果关系。针对上述问题,提出了一种基于混淆因子隐压缩表示(CHCR)模型的因果推断方法。首先,根据CHCR模型,构造含有对原因变量进行压缩表示的中间隐变量的备选模型;其次,利用贝叶斯信息准则(BIC)计算备选模型评分并选出得分最高的最佳模型;最后,根据最佳模型中的压缩情况判断变量间真正的因果关系。理论分析表明,所提出的方法能够识别经典的基于约束的方法所无法正确分辨的、带有混淆因子的因果结构,且在样本量较小等情况下,BIC评分也可以提高所提方法的表现。实验结果表明,在样本数变化时,所提出的方法在准确率指标上相较于极快因果推断算法(RFCI)等经典方法有显著提升,并适用于各种变量可能取值数不同的情况;在混合不同类型的因果结构时,该方法在准确率指标上高于最大最小爬山算法(MMHC)等经典方法;且该方法能够在Abalone数据集上得到正确的因果关系。  相似文献   

2.
现有级联非线性加性噪声模型可解决隐藏中间变量的因果方向推断问题,然而对于包含隐变量和级联传递因果关系的因果网络学习存在全局结构搜索、等价类无法识别等问题。设计一种面向非时序观测数据的两阶段因果结构学习算法,第一阶段根据观测数据变量间的条件独立性,构建基本的因果网络骨架,第二阶段基于级联非线性加性噪声模型,通过比较骨架中每个相邻因果对在不同因果方向假设下的边缘似然度进行因果方向推断。实验结果表明,该算法在虚拟因果结构数据集的不同隐变量数量、平均入度、结构维度、样本数量下均表现突出,且在真实因果结构数据集中的F1值相比主流因果结构学习算法平均提升了51%,具有更高的准确率和更强的鲁棒性。  相似文献   

3.
因果发现旨在通过观测数据挖掘变量间的因果关系,在实际应用中需要从观测数据中学习隐变量间的因果结构。现有方法主要利用观测变量间的协方差信息(如四分体约束)或引入非高斯假设(如三分体约束)来解决线性因果模型下的隐变量结构学习问题,但大多限定于分布明确的情况,而实际应用环境往往并不满足这种假设。给出任意分布下隐变量结构的识别性证明,指出在没有混淆因子影响的情况下,两个隐变量的因果方向可识别所需要的最小条件是仅需要其中一个隐变量的噪声服从非高斯分布。在此基础上,针对线性隐变量模型提出一种在任意分布下学习隐变量因果结构的算法,先利用四分体约束方法学习得到隐变量骨架图,再通过枚举骨架图的等价类并测量每一个等价类中的三分体约束来学习因果方向,同时将非高斯约束放宽到尽可能最小的变量子集,从而扩展线性隐变量模型的应用范围。实验结果表明,与MIMBuild和三分体约束方法相比,该算法得到了最佳的F1值,能够在任意分布下学习更多的隐变量因果结构信息,且具有更强的鲁棒性。  相似文献   

4.
结构分析的隐变量发现方法难以有效地发现隐变量且可解释性较差。基于因果关系和局部结构的不确定性,提出了一种基于局部因果关系分析的隐变量发现算法(hidden variable discovering algorithm based on local causality analysis,LCAHD)。LCAHD算法给出了因果结构熵的定义,将因果知识和不确定性知识相融合,以因果关系的不确定性程度作为隐变量存在的判定依据,并对这一依据进行了理论上的论证。LCAHD算法首先通过寻找目标变量的马尔科夫毯来提取局部依赖结构,并基于扰动学习获得扰动数据,联合扰动数据和观测数据学习局部依赖结构中的因果关系;然后利用因果结构熵对局部因果结构中因果关系的不确定性进行度量,并利用隐变量和因果关系不确定性之间的相关性判定条件,确定隐变量的存在性。分别针对标准网络和股票网络进行了实验,结果表明,该算法能准确地确定隐变量的位置,具有较好的解释性。  相似文献   

5.
一对观测变量之间的因果关系的推断是科学中的基本问题,基于观测数据分析提出因果关系的方法对于产生假设和加速科学发现具有实用价值。利用传统的因果推断算法从高维数据中学习因果网络结构和提高学习准确率是目前研究的难点。在引入耦合相关系数(copula dependence coefficient,CDC)的基础上,提出了一种适用于高维数据的两步骤因果推断算法。首先该算法利用优于最大信息系数的CDC对变量间的关联度进行检测,寻找目标节点的父子节点集;然后使用非线性最小二乘独立回归算法,为图中的目标节点与其父子节点之间标注因果方向;最后迭代所有的节点完成完整的因果网络结构。实验结果表明,该算法提高了高维数据下因果网络结构学习的准确率。同时在大样本数据集中,该算法的时间复杂度优于传统算法,对异常值具有鲁棒性。  相似文献   

6.
基于约束网络的因果关联规则挖掘研究   总被引:1,自引:0,他引:1  
崔阳  刘长红 《计算机科学》2016,43(Z11):466-468
因果关联规则是知识库中一类特殊且重要的知识类型,相对一般关联规则,其优势在于能够揭示深层知识。首先对因果关系的特征和因果关联规则的挖掘方法进行了简介。针对在挖掘初始阶段如何限定可能导致结果的原因变量集合这一问题,运用了约束网络原理来构建一个实际系统变量间的因果关系结构。通过该因果关系结构可以比较容易地导出原因变量集合及各变量的类型,从而降低挖掘的复杂性,为提高挖掘结果的准确性提供有利条件。约束网络的引入优化了因果关联规则的挖掘过程,使之趋于更完备。  相似文献   

7.
因果推理正在成为机器学习领域一个越来越受关注的研究热点,现阶段的因果发现主要是在研究某一种假设条件下,基于纯粹的观测数据推断变量之间的因果方向。然而在现实世界中观察到的数据往往是由一些假设生成,使得传统因果推断方法的识别率不高、稳定性较差。针对当前的问题,提出了一种基于神经网络来解决混合数据因果推断的方法。该方法在混合加性噪声模型(ANM-MM)的假设下,使用梯度下降法最优化改进的损失函数得到混合数据的抽象因果分布参数,然后将分布参数看作是原因变量和结果变量之间的隐变量,通过比较原因变量和分布参数之间的HilberSchmidt独立性来确定二元变量的因果方向。在理论上证明了该方法的可行性,并通过实验表明该算法在人工数据和真实数据的表现较传统的IGCI,ANM,PNL,LiNGAM,SLOPE方法具有较好的准确率和稳定性。  相似文献   

8.
分布式虚拟环境是模拟现实世界的虚拟空间,对因果一致性控制具有实时性要求,必须在事件生命周期结束前得到维护.然而,在大规模网络条件下,网络传输高延迟和动态性会导致部分事件不能及时到达,使已传到事件间因果关系无法在生命周期限制内有效传递.在现有方法中,部分方法基于所有事件一定能及时传到的假设,没有考虑生命周期对因果关系的制约;而另一部分方法虽然考虑了生命周期的约束,但其因果关系传递要求仿真时钟精确同步,且因果控制效率随系统规模的扩大而快速降低,限制了虚拟环境的普适性和实时性.提出了生命周期约束下的因果一致性控制方法LCO,突破了异步时钟间的时间值比较、多路径因果控制信息选择的终止条件、网络状况敏感的因果控制信息动态调节等关键技术,能够在事件无法及时传到时,仍可以根据已传到的事件计算出因果传递关系.实验证明,LCO既能维护生命周期内的因果一致性,又使因果控制信息量与系统规模无关,降低网络传输和计算开销.  相似文献   

9.
因果结构学习是贝叶斯网络学习中一种重要的结构学习方法,因果关系揭示了系统要素作用的本质。由于 仅利用观测数据很难准确地发现变量间的因果关系,且通常人们仅关心网络中关于某一变量的局部因果关系,因此针 对难以从观测数据中仅获取所感兴趣的变量的局部因果结构的问题,提出了一种局部结构学习方法,即一种基于因果 强度的局部因果结构主动学习方法(CSI-I_CS工力。CSI一工CSI方法融合了马尔可夫毯的结构划分能力和扰动学习的因 果发现能力,并且引入了因果强度进行扰动结点的选择。利用HITON MI3算法寻找目标结点的马尔可夫毯,生成关 于目标结点的局部模型;然后,利用不对称信息墒对局部模型中的每一结点进行因果强度分析,选取因果强度值较大 的结点进行扰动,生成扰动数据;进而,联合扰动数据和观测数据利用准确方法(exact method)学习边的后验概率,从 而获得一个关于目标结点的局部因果网络。利用结构信息嫡对CSI-LCSL方法的学习结果进行评估。在标准网络上 的实验结果证实了CSI一LCSI、算法的有效性。  相似文献   

10.
因果自回归流模型已经在非独立噪声等场景的因果方向推断问题上取得了一定的进展,但在多个结点的场景下仍存在全局结构搜索带来的准确度低和计算时间复杂度高的问题。面向非时序观察数据设计一种两阶段因果结构学习算法。在第一阶段,基于观测数据的条件独立性,对完全无向图通过条件独立性检验得到基本的因果骨架;在第二阶段,基于因果自回归流模型,通过标准化流的方法计算骨架中每条无向边在不同方向上的边缘似然概率,进而通过比较边缘似然概率进行因果方向推断。实验结果表明:该算法在多组不同参数生成的仿真因果结构数据集上均有较好的表现,与现有的主流因果结构学习算法相比,F1值平均提升15%~28%;在真实因果结构数据集实验中,该算法能够较为完整准确地学习到变量间的因果关系,与主流的因果结构学习算法相比,F1值平均提升28%~48%,具有更强的鲁棒性。  相似文献   

11.
因果知识的表示和推理   总被引:2,自引:0,他引:2  
林海  孙吉贵 《计算机科学》2004,31(5):123-126
本文介绍了因果推理的两个主要应用:预测行为的间接结果,找出给定事实的真正原因,指出了用逻辑描述的因果关系在解决这两个问题中存在的不足。本文也简单地介绍了J.Pearl提出的因果推理方法,该方法的基本思想是把因果推理看成是一种“计算模式”,而这种把智能归结为“计算模式”的想法正是认知科学中的核心思想。本文最后比较了基于逻辑的方法和基于认知科学的方法实现智能的区别,指出了因果推理应该在认知科学的框架内得到解决。  相似文献   

12.
In recent years, people have begun to pay more and more attention to the effect of news on financial instrument markets (i.e., the markets for trading financial instruments). Researchers in the financial domain have conducted many studies demonstrating the effect of different types of news on trade activities in financial instrument markets such as volatility in trade price, trade volume, trading frequency, and so on. In this paper, an ontology for knowledge about news regarding financial instruments is provided. The ontology contains two parts: the first part presents a hierarchy framework for the domain knowledge that primarily includes classes of news, classes of financial instrument markets participants, classes of financial instruments, and primary relations between these classes. In the second part, a causal map is used to demonstrate how classes of news are causally related with classes of financial instruments. Finally, a case concerning the “9/11 American terror attack” is analyzed. On the basis of the ontology, it is first comprehensive to understand the knowledge about news in financial instrument markets; second, it helps building trading models based on news in the financial instrument markets; third, systems (e.g., systems for prediction of stock price based on news, systems for supporting financial market participants to search relevant news) design and development in this domain are facilitated and supported by this ontology.  相似文献   

13.
Current constraint-based approaches to the discovery of causal structure in statistical data are unable to discriminate between causal models which entail identical sets of marginal dependencies. Often, marginal dependencies between observed variables are the result of complex causal connections involving observed and latent variables. This paper shows that, in such cases, the latent causal structure in a model often entails properties which can be tested against empirical evidence, and thus used to discriminate between equivalent alternative models of an empirical phenomenon under study.  相似文献   

14.
知识与粒度相关,在不同粒度上对现象的解释不同,而因果性描述的是现象的本质特征。因果性与粒度之间存在着怎样的关联,一个粒度上的因果关系是否可移植到其他不同粒度上,是目前人工智能研究亟待解决的问题。针对由观测数据构成的信息系统,从数据中直接抽取因果变量所需满足的基本图形结构,估算变量间的因果关系;再通过向系统中添加新属性以及合并多个信息系统,改变原系统中信息的粒度,研究所识别的因果关系在新系统中的可迁移性。若新属性作用于结果变量,则原系统中的因果关系不可迁移至新系统;若新属性对结果变量无影响,则原系统中的因果关系可移植至新系统。  相似文献   

15.
The development of high quality large-scale software systems within schedule and budget constraints is a formidable software engineering challenge. The modification of these systems to incorporate new and changing capabilities poses an even greater challenge. This modification activity must be performed without adversely affecting the quality of the existing system. Unfortunately, this objective is rarely met. Software modifications often introduce undesirable side-effects, leading to reduced quality. In this paper, the software modification process for a large, evolving real-time system is analysed using causal analysis. Causal analysis is a process for achieving quality improvements via fault prevention. The fault prevention stems from a careful analysis of faults in search of their causes. This paper reports our use of causal analysis on several significant modification activities resulting in about two hundred defects. Recommendations for improved software modification and quality assurance processes based on our findings are also presented.  相似文献   

16.
We further develop the mathematical theory of causal interventions, extending earlier results of Korb, Twardy, Handfield, & Oppy, (2005) and Spirtes, Glymour, Scheines (2000). Some of the skepticism surrounding causal discovery has concerned the fact that using only observational data can radically underdetermine the best explanatory causal model, with the true causal model appearing inferior to a simpler, faithful model (cf. Cartwright, (2001). Our results show that experimental data, together with some plausible assumptions, can reduce the space of viable explanatory causal models to one.
Kevin B. KorbEmail:
  相似文献   

17.
18.
Internet延迟瓶颈的测量与分析   总被引:11,自引:1,他引:11  
网络速度一直是人们非常关注的问题,而包延迟是评价网络速度的一个重要参数。该文对路由中延迟最大的链路——延迟瓶颈——进行了研究。文章首先提出了延迟瓶颈的计算方法和两个必要的修正算法,通过对世界范围内的47个节点之间的延迟进行一个月测量和进一步的深入分析,得到了如下结论:(1)Internet中绝大多数路径的延迟瓶颈消耗了端到端延迟的1/3或更多。(2)路径中存在多个延迟瓶颈,90%的路径存在一个出现次数超过一半的延迟瓶颈,同一路径中不同瓶颈延迟的差异较小。(3)延迟瓶颈较多出现在传输网,且多出现在AS内部。(4)目前Internet中的绝大多数路径处于轻负载状态,瓶颈延迟主要由传播延迟造成。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号