首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
关于关联规则挖掘和因果关系发现之间的关系,较为全面地分析比较结果目前尚不多见.本文在说明关联规则与因果规则各自特点的基础上,从方向性、对人类行为的指导意义以及如何将他们联系起来三个方面进行了理论上的分析比较.分析结果表明因果发现能够找出事物间的内在机制性联系,并且可以据此对关联规则进行推理和检验.最后,将两种数据挖掘方法应用于一个人口统计数据集,并比较了挖掘结果,从而进一步验证理论分析的结论.  相似文献   

2.
基于因果建模的强化学习技术在智能控制领域越来越受欢迎.因果技术可以挖掘控制系统中的结构性因果知识,并提供了一个可解释的框架,允许人为对系统进行干预并对反馈进行分析.量化干预的效果使智能体能够在复杂的情况下(例如存在混杂因子或非平稳环境)评估策略的性能,提升算法的泛化性.本文旨在探讨基于因果建模的强化学习控制技术(以下简称因果强化学习)的最新进展,阐明其与控制系统各个模块的联系.首先介绍了强化学习的基本概念和经典算法,并讨论强化学习算法在变量因果关系解释和迁移场景下策略泛化性方面存在的缺陷.其次,回顾了因果理论的研究方向,主要包括因果效应估计和因果关系发现,这些内容为解决强化学习的缺陷提供了可行方案.接下来,阐释了如何利用因果理论改善强化学习系统的控制与决策,总结了因果强化学习的四类研究方向及进展,并整理了实际应用场景.最后,对全文进行总结,指出了因果强化学习的缺点和待解决问题,并展望了未来的研究方向.  相似文献   

3.
因果关联规则是知识库中一类重要的知识类型,具有重要的应用价值。首先对因果关系的特殊性质进行了分析,然后基于语言场和广义归纳逻辑因果模型,从表示、挖掘、评价和应用几方面,对因果关联规则的研究进行了详细论述。并在此基础上提出了隐含因果关联规则的概念。通过语言场和推理机制的运用,使因果关联规则这一重要知识形式的挖掘和评价过程具有良好的逻辑性和扩张性。  相似文献   

4.
从数据中发现与一个变量有直接因果关系的其它变量是一种非常有价值的技术.本文针对回归分析中的逐步回归算法和贝叶斯网络学习中的SGS算法、PC算法应用于变量选择的不足,提出了一种新的因果关系发现算法STEPCARD,并将其与STEPWISE算法和SGS算法进行了实验比较分析.实验表明,STEPCARD算法能够和SGS算法一样从初始自变量集合中找出与因变量有因果相邻关系的变量,而STEPWISE算法只能找出与因变量显著相关的变量.其次,当初始自变量集合较大,而最后输出的自变量集合较小时,STEPCARD算法的计算量比SGS算法的计算量小得多.而且,当初始自变量个数接近或大于事例个数时,SGS算法将无法应用,而STEPCARD算法依然可以得到可信的结果.  相似文献   

5.
RWCES是我们研制的一个试验系统,它把人工智能技术中的知识表示和演绎推理应用到CRDBMS,能够表达数据间的因果语义。通过RWCES,可对因果联系作推导判断,从原因找出结果,或从结果找出原因。 CRDBMS是在PDP-11/23计算机、操作系统RSX-11M支持下,由本文作者设计,在本校实现的小型关系数据库管理系统,可对数据库中的关系进行传统的数据操作和关系运算。  相似文献   

6.
基于数据融合的知识发现方法在网络管理中的应用   总被引:2,自引:0,他引:2  
提出用于网络管理的基于数据融合的知识发现系统框架,研究数据融合技术在知识发现的数据准备和预处理阶段的应用,研究关联规则在表达网络管理知识方面的适用性并针对网络管理数据时序性的特点,引入情景规则来表示期望发掘的知识,指出网络故障管理中关联规则和情景规则的挖掘算法以及知识增量式更新的算法,并简介了原型系统的实现方法。  相似文献   

7.
随着数据库的规模和存储的数据量越来越大,许多知识发现方面的应用不得不面对大量的数据。这就迫切需要找出降低知识发现查询计算的复杂性的方法。以往的语义查询优化工作都是利用领域知识进行查询优化。主要是靠重写查询语句为一个等价的、高效的查询来降低费用。本文介绍了一种利用三类领域知识进行优化处理、缩小搜索范围、降低查询费用、提高被发现知识的质量的方法。  相似文献   

8.
KDD中知识评价的研究综述   总被引:12,自引:1,他引:11  
在知识发现过程中,通过挖掘算法产生大量的模式,但是大多数用户对此不感兴趣。如何对它们进行评价,选取出用户感兴趣的和有用的知识成为至关重要的一环,故对知识评价的研究具有重要的意义。首先分析了评价过程与知识发现的结合方式;针对评价的综合度量标准(感兴趣度),从客观性和主观性两个方面分别进行了介绍;并针对因果关联规则概述了我们提出的一种新的评价方法。  相似文献   

9.
数据挖掘与知识发现   总被引:5,自引:0,他引:5  
随着数据积累的增长,充分利用大量数据(即对数据进行分析来指导工作),并从大量数据中挖掘出有用的信息和知识,找出未知的规律,已成为人类急需解决的问题。本文就数据挖掘技术、知识发现系统这一热点问题阐述其成功的关键、面临的问题及所采用的技术。  相似文献   

10.
霍晓钢 《计算机时代》2013,(4):12-14,17
对于教育测评所积累的大量数据,通过数据挖掘技术能产生出对学生、教师、教育管理者有用的知识。为此,从教育测评的目的、数据准备、数据积累方法,到数据的知识挖掘等几个方面,系统地研究了教育测评的知识发现的过程,并分别就三种需求的知识发现方法进行探讨,以改变教育测评仅能提供定性的结论而不能发现知识的状况,丰富教育测评的内涵。  相似文献   

11.
现有的因果关系发现算法主要基于单个观察变量本身之间的因果关系,无法适用于多组观察变量,为此提出了一种多组典型相关变量的因果关系发现算法。首先,引入多组典型相关变量建立多组典型相关变量的线性非高斯无环模型并提出对应的目标函数;然后,采用梯度上升的方法求解目标函数,构建多组典型相关变量的因果关系网络。模拟实验验证了该算法的有效性,并在移动基站数据上发现了一批有价值的多组无线网络性能指标间的因果关系。  相似文献   

12.
从多元时间序列观测数据中学习多个变量之间的因果关系是许多专业领域中的重要基本问题。现有的多元时间序列因果关系发现方法通常从每个个体的观测数据中学习个体因果关系,没有考虑部分个体之间可能存在相同的因果关系,导致样本利用不足。提出一种面向多元时间序列的群体因果关系发现算法。该算法分为2个阶段:第一阶段基于因果关系对个体之间的相似性进行度量,并把多个个体划分成多个群体,且无须指定群体的个数;第二阶段基于变分推断方法充分利用每个群体内的所有个体数据,从而学习群体因果关系。实验结果表明,该算法在多组不同参数生成的仿真数据上均具有较好的表现,与对比算法相比,AUC评分提升了5%~20%。在真实数据集中,该算法能够较好地区分具有不同因果关系的群体,并且能够学习到不同群体之间不同的因果关系,表明算法不仅具有因果关系发现能力,而且还具有多元时间序列聚类能力。  相似文献   

13.
因果发现旨在通过观测数据挖掘变量间的因果关系,在实际应用中需要从观测数据中学习隐变量间的因果结构。现有方法主要利用观测变量间的协方差信息(如四分体约束)或引入非高斯假设(如三分体约束)来解决线性因果模型下的隐变量结构学习问题,但大多限定于分布明确的情况,而实际应用环境往往并不满足这种假设。给出任意分布下隐变量结构的识别性证明,指出在没有混淆因子影响的情况下,两个隐变量的因果方向可识别所需要的最小条件是仅需要其中一个隐变量的噪声服从非高斯分布。在此基础上,针对线性隐变量模型提出一种在任意分布下学习隐变量因果结构的算法,先利用四分体约束方法学习得到隐变量骨架图,再通过枚举骨架图的等价类并测量每一个等价类中的三分体约束来学习因果方向,同时将非高斯约束放宽到尽可能最小的变量子集,从而扩展线性隐变量模型的应用范围。实验结果表明,与MIMBuild和三分体约束方法相比,该算法得到了最佳的F1值,能够在任意分布下学习更多的隐变量因果结构信息,且具有更强的鲁棒性。  相似文献   

14.
KDD中因果关联规则的评价方法   总被引:17,自引:0,他引:17  
杨炳儒  綦艳霞 《软件学报》2002,13(6):1142-1147
在KDD(knowledge discovery in database)中,对所发现的知识进行评价是一个很重要的环节.提出了一种针对KDD中因果关联规则的自动评价方法.该评价方法采用了全新的、有效的知识表示方法(语言场和语言值结构)和推理机制(因果关系定性推理机制),并且具有通用性和交互性的特征.给出了此评价方法的理论依据和构造过程,并提供了相应的算法.通过对具体实例的运行检验,证明了此评价方法的有效性.通过与相关工作的比较,证明了其先进性.  相似文献   

15.
从观察数据中发现因果关系在近年来得到了越来越多学者的关注,其中外生变量在理解因果机制中扮演者重要的角色。然而,现有的因果发现方法大多假设观察变量就是真实发生的因(果)变量,忽略了测量误差带来的影响。为此,提出了一种解决测量模型下的外生变量估计方法。通过引入triad约束,根据此约束来找出与其余所有相关成对变量都满足triad约束的变量,即外生变量。该算法不仅能够解决含有测量误差数据的估计问题,而且对于没有测量误差的数据仍然适用。实验将该算法应用于真实网络产生的数据中,结果表明,无论变量是否含有测量误差,提出方法均优于现有的其他算法。同时,基于移动基站的真实数据实验也验证了算法的有效性。  相似文献   

16.
This paper presents a simple, efficient computer-based method for discovering causal relationships from databases that contain observational data. Observational data is passively observed, as contrasted with experimental data. Most of the databases available for data mining are observational. There is great potential for mining such databases to discover causal relationships. We illustrate how observational data can constrain the causal relationships among measured variables, sometimes to the point that we can conclude that one variable is causing another variable. The presentation here is based on a constraint-based approach to causal discovery. A primary purpose of this paper is to present the constraint-based causal discovery method in the simplest possible fashion in order to (1) readily convey the basic ideas that underlie more complex constraint-based causal discovery techniques, and (2) permit interested readers to rapidly program and apply the method to their own databases, as a start toward using more elaborate causal discovery algorithms.  相似文献   

17.
因果推理正在成为机器学习领域一个越来越受关注的研究热点,现阶段的因果发现主要是在研究某一种假设条件下,基于纯粹的观测数据推断变量之间的因果方向。然而在现实世界中观察到的数据往往是由一些假设生成,使得传统因果推断方法的识别率不高、稳定性较差。针对当前的问题,提出了一种基于神经网络来解决混合数据因果推断的方法。该方法在混合加性噪声模型(ANM-MM)的假设下,使用梯度下降法最优化改进的损失函数得到混合数据的抽象因果分布参数,然后将分布参数看作是原因变量和结果变量之间的隐变量,通过比较原因变量和分布参数之间的HilberSchmidt独立性来确定二元变量的因果方向。在理论上证明了该方法的可行性,并通过实验表明该算法在人工数据和真实数据的表现较传统的IGCI,ANM,PNL,LiNGAM,SLOPE方法具有较好的准确率和稳定性。  相似文献   

18.
如何利用人工智能技术回答标准测试题目是一项具有挑战性的任务,吸引了人工智能领域的广泛研究。该文聚焦在高中地理的因果简答题求解任务,求解因果简答题需要进行知识集成和多跳因果推理,最终生成一段长文本作为答案。为此,该文定义了抽象事理图谱(AEG)来表示因果等关系,并利用预训练语言模型从语料中自动抽取一个面向高中地理因果简答题的抽象事理图谱,实现了多源知识集成。基于抽象事理图谱,该文利用图神经网络技术来融合结构化和非结构化知识,实现了多跳因果推理。该文在包含真实的高中地理因果简答题的数据集GeoCEQA上开展实验,结果表明,无论是ROUGE、BLEU指标还是人工评价的得分,该文提出的方法都取得了最佳结果,在ROUGE指标上,相比最优基线方法提升0.8%~1.4%;在BLEU指标上,相比最优基线方法提升0.4%;在人工评价得分上,相比最优基线方法提升4.2%。  相似文献   

19.
Social media, especially Twitter is now one of the most popular platforms where people can freely express their opinion. However, it is difficult to extract important summary information from many millions of tweets sent every hour. In this work we propose a new concept, sentimental causal rules, and techniques for extracting sentimental causal rules from textual data sources such as Twitter which combine sentiment analysis and causal rule discovery. Sentiment analysis refers to the task of extracting public sentiment from textual data. The value in sentiment analysis lies in its ability to reflect popularly voiced perceptions that are stated in natural language. Causal rules on the other hand indicate associations between different concepts in a context where one (or several concepts) cause(s) the other(s). We believe that sentimental causal rules are an effective summarization mechanism that combine causal relations among different aspects extracted from textual data as well as the sentiment embedded in these causal relationships. In order to show the effectiveness of sentimental causal rules, we have conducted experiments on Twitter data collected on the Kurdish political issue in Turkey which has been an ongoing heated public debate for many years. Our experiments on Twitter data show that sentimental causal rule discovery is an effective method to summarize information about important aspects of an issue in Twitter which may further be used by politicians for better policy making.  相似文献   

20.
离散时序数据的格兰杰因果关系发现算法具有重要应用价值。现有方法主要采用霍克斯过程建模,无法适用于非独立同分布数据和带有时间误差的数据。为此,提出了一种融合先验约束的拓扑霍克斯过程格兰杰因果关系发现算法(PTHP)。首先,使用基于约束的方法筛选出一批显著性水平较高的因果边,提升算法对故障发生时间误差的容忍性;随后,将上一步获取的边作为先验约束融合到拓扑霍克斯过程中,解决序列间的非独立同分布问题。模拟数据和真实数据的实验证明了该方法的有效性,并获得了PCIC 2021因果推理大赛第一名。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号