首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
在基于Web数据集成的3点研究假设的前提下,探讨了基于规则树的包装器(Wrapper)生成模型。它包括预处理、生成HTML树、生成模式树、获取映射规则、生成规则树、修复规则树和执行Wrapper。详细介绍了该系统中映射规则的实现和规则树生成算法。通过实验测试,证明该方法适合Web数据的抽取。  相似文献   

2.
赵赛  陈松乔  邓莎莎 《微机发展》2006,16(6):242-244
在基于Web数据集成的3点研究假设的前提下,探讨了基于规则树的包装器(Wrapper)生成模型。它包括预处理、生成HTML树、生成模式树、获取映射规则、生成规则树、修复规则树和执行Wrapper。详细介绍了该系统中映射规则的实现和规则树生成算法。通过实验测试,证明该方法适合Web数据的抽取。  相似文献   

3.
适用于扫描测试中的测试响应压缩电路设计   总被引:1,自引:0,他引:1  
测试向量响应压缩电路分为组合压缩电路和时序压缩电路两种.提出一种新的时序压缩电路:锥一压缩器.由于该电路是单输出的,所以总能保证最大压缩率.根据扫描测试中故障出现的特点,通过引入等价概念和两条设计规则来保证该响应压缩电路能够避免2,3和任何奇数个错误位抵消的情况.这两条设计规则同样适用于处理测试响应中出现未知位的情况.提出的基于随机选取生成算法可以自动生成该压缩电路.最后用实验数据从性能和代价两方面分析了锥一压缩器的适用性.  相似文献   

4.
空间分类数据同位规则挖掘算法   总被引:3,自引:0,他引:3  
针对空间分类数据的特性,提出一种空间分类数据同位规则挖掘算法.利用空间关系定义数据挖掘中事务的概念,采用多层参与索引搜索空间同位规则,从而实现了对空间分类数据的有效处理.采用文中算法对杭州地区119火灾数据进行实验,并验证了该算法的适用范围和性能.实验表明,该算法可以有效地处理经过离散化后的连续数据.  相似文献   

5.
Visual FoxPro中保证数据完整有效性的机制与实现方法   总被引:1,自引:0,他引:1  
1.引言数据库的完整有效性是指数据的正确性和相容性。作为一个共享资源,其提供的信息必须准确、有效、为了防止出现不符合语义的数据,防止错误信息的输入和输出所造成的无效操作和错误结果。数据库管理系统(DBMS)必须提供一种功能来保证数据库中数据的完整有效性。作为一个功能强大的关系数据库开发系统。VFP提供了多种完整性规则来保证数据库中数据的完整性和有效性。根据这些规则的作用范围和特点,可分为两大类:关系完整性规则和域完整性规则。下面针对这两类完整性规则介绍VPP中保证数据完整有效性的机制与实现方法。…  相似文献   

6.
大量分散的形式及不同格式的数据给现代数据处理带来了越来越大的困难。为统一数据形式以利于数据操作和处理,讨论了将形式多样的数据格式转换成统一的XML(Extemible Markupbnguage)格式的问题。对数据源中不同格式文件数据.按照预先定义的XML模板,以格式说明文件结构统一描述.并提取数据或作进一步的处理.最后转换为XML格式输出。文中论述了从数据库中提取数据转换为XML格式的方法及步骤,并且方法简单实用.可以推广到对所有格式数据的提取。  相似文献   

7.
空时间数据和零数字数据的输出处理@张国忠@汪同庆¥武汉水利电力大学空时间数据和零数字数据的输出处理张国忠汪同庆(武汉水利电力大学,武汉430072)在用FoxPro开发工程管理信息系统过程中,曾面临着录入数据时有的时间和数字数据不确定,没有输入数据的情况。...  相似文献   

8.
甘昕艳  唐晓年 《计算机仿真》2021,38(3):282-285,326
传统的挖掘模型未能有效提取时序数据的特征,导致计算开销较大,挖掘准确率以及效率偏低.为此,研究结合卷积神经网络设计并组建一种新的时序数据关联规则挖掘模型.通过连续模板匹配技术分析时序数据的分布式数据结构,然后结合匹配相关检测技术对时序数据展开融合处理,通过频繁项检测提取其中的关联规则特征.对提取的关联规则通过CNN分类器进行属性划分,结合特征压缩方法对分类输出的时序数据进行降维处理,再利用模糊聚类算法构建时序数据关联规则挖掘模型.仿真结果表明:模型能够有效降低挖掘过程的计算开销,并提升了挖掘结果的准确率以及挖掘效率.  相似文献   

9.
一种高效的维内关联规则挖掘算法研究   总被引:1,自引:0,他引:1  
通过对数据立方体的结构特征进行深入分析,结合传统的关联规则挖掘算法.提出了一种在数据立方体中进行维内关联规则挖掘的新颖算法,该算法通过有效组织挖掘过程中的数据结构,降低对立方体的扫描次数,并充分利用联机分析处理技术.从而大大降低了执行时间,提高了执行效率.  相似文献   

10.
基于关联规则的通信网络告警相关性分析模型   总被引:4,自引:0,他引:4  
在通信网络运行过程中.每天都会产生大量告警,将数据挖掘中的关联规则发现技术用于分析历史告警数据,可发现告警相关性规则。这些规则可辅助故障定位和告警过滤,以减轻网络管理员的工作强度,提高工作效率。本文分析了通信网络原始告警信息的特点,提出了一个基于关联规则的通信网络告警相关性分析模型,该模型通遏对原始告警数据进行预处理,不仅有效地解决了网络告警时间不同步问题,使得处理后的告警数据可直接用一般的关联规则挖掘工具发现告警相关规则,还大大地压缩了挖掘结果,提高了规则的准确率。初步的实验表明这种分析模型具有实用价值。  相似文献   

11.
周进登  王晓丹 《控制与决策》2011,26(9):1295-1302
构造输出编码矩阵是将多类分类问题分解为多个两类分类问题的有效方法之一,如何判断一个编码阵的好坏是此类问题的关键.提出以最小庇近邻错分率作为评价标准,把构造问题简化为一个搜索问题.在M类的所有二类划分空间中,通过行交换规则和有限启发式搜索策略搜索出南近邻错分率最小的l个二类划分,并依据编码规则得到最终输出编码矩阵.实验中用人工数据集和UCI数据集分别测试,通过与几种经典的编码方法比较,结果表明该编码方法能在编码长度较小情况下得到更好的分类效果.  相似文献   

12.
提出了一个基于时间窗口的数据预处理算法.面向具体应用,根据已有知识,此算法可以智能化地滤去一些“噪声”数据.与一般的定义不同.本文所谓的“噪声”数据是指那些由一些已知的规则决定性地影响着的数据,研究显示它们会对进一步的数据挖掘形成极大干扰.实际测试结果表明,本算法能够改善一些已有数据挖掘算法的执行效果.  相似文献   

13.
基于规则引擎的数据清洗   总被引:9,自引:0,他引:9       下载免费PDF全文
叶舟  王东 《计算机工程》2006,32(23):52-54
以往的数据清洗研究存在以下缺陷:检测和修复动作要么使用灵活性差的硬编码,要么依靠灵活却低效的人工判断。该文提出了一个使用规则来描述清洗逻辑,使用规则引擎来执行清洗逻辑,从而能够处理各种数据质量问题的数据清洗架构REBDCA,解决了该问题。展示了REBDCA和一个ETL工具的集成,测试了REBDCA的性能,并和用硬编码完成相同逻辑的方案进行了性能对比。  相似文献   

14.
数据驱动的扩展置信规则库专家系统能够处理含有定量数据或定性知识的不确定性问题.该方法已被广泛地研究和应用,但仍缺乏在不完整数据问题上的研究.鉴于此,针对不完整数据集上的问题,提出一种新的扩展置信规则库专家系统推理方法.首先提出基于析取范式的扩展规则结构,并通过实验讨论了在新的规则结构下,置信规则前提属性参考值个数对推理...  相似文献   

15.
针对智能网络大数据分布正则性差的问题,提出基于动态可重用性结构化分区融合的大数据清洗规则链自动生成方法。先基于动态配置网络构建规则类型分布集,采用动态编译方法实现对数据的语义特征检测和稀疏参数辨识,采用多维关系网络分组检测方法进行数据的局部谱密度聚类。建立数据规则链的实体结构模型,通过数据聚类的张量表达实现动态可重用性结构化分区处理和信息融合,通过网络大数据的多维尺度扩展聚类处理,实现对干扰数据的分组滤波,基于链路的聚类方法实现对网络大数据的结构化数据重排,实现智能网络大数据清洗规则链自动生成。仿真测试结果表明,采用该方法进行网络大数据清洗的抗干扰性较好,清洗的准确回填性高于95%,且100条数据的平均清洗用时为12.6 ms,性能优于对比方法,提高了网络大数据信息提取和辨识能力,具有较大的应用价值。  相似文献   

16.
数据时效性是影响数据质量的重要因素,可靠的数据时效性对数据检索的精确度、数据分析结论的可信性起到关键作用.数据时效不精确、数据过时等现象给大数据应用带来诸多问题,很大程度上影响着数据价值的发挥.对于缺失了时间戳或者时间不准确的数据,精确恢复其时间戳是困难的,但可以依据一定的规则对其时间先后顺序进行还原恢复,满足数据清洗及各类应用需求.在数据时效性应用需求分析的基础上,首先明确了属性的时效规则相关概念,对属性的时效规则等进行了形式化定义;然后提出了基于图模型的时效规则发现以及数据时序修复算法;随后,对相关算法进行了实现,并在真实数据集上对算法运行效率、修复正确率等进行了测试,分析了影响算法修复数据正确率的一些影响因素,对算法进行了较为全面的分析评价.实验结果表明,算法具有较高的执行效率和较好的时效修复效果.  相似文献   

17.
含XPath的表达式的解析与应用   总被引:5,自引:0,他引:5  
提出了在应用XML数据中的一类普遍性问题,指出通过定义、处理含XPath的规则式可有效地提高软件的可扩展性.阐述如何运用JavaCC实现对XPath规则式的解析处理,以及扩展的思路。  相似文献   

18.
传统的基于事件驱动的滑动窗口清洗方法只能处理理想的匀速RFID数据流,然而在实际应用中处理非匀速数据流时却会产生较大的输出延迟.为了解决滑动窗口清洗方法的输出延迟和海量中间数据,提出了一种基于伪事件的数据清洗方法PSCleaning.该方法通过在滑动窗口中增加伪事件处理机制,有效地减小了数据的输出延迟;通过对错读和重复读进行的一次性处理,明显缩减了数据量,提高了数据清洗的效率.  相似文献   

19.
针对一类不确定非线性多输入多输出复杂系统,根据系统的输入输出数据对,提出一种基于聚类的超闭球模糊神经网络系统.该系统通过改进的模糊聚类方法(FCM)确定模糊规则数,采用高维隶属度函数取代常规的单维隶属度函数,并对隶属度函数中心值和隶属度函数参数采用一步通过算法,所提方法可降低系统的模糊规则数,简化网络计算.此外,当系统的输入输出发生变化时,可实现模糊规则库的在线修改.仿真实例验证了所提方法的有效性.  相似文献   

20.
张星  郝伟 《福建电脑》2007,(4):32-33
本文总结了缺失数据产生的原因及处理缺失数据的重要性,分析讨论了针对不同缺失数据类型的处理方法、策略;给出了缺失数据填补的标准原则,即填补数据应当使决策表尽量产生高支持度、高置信度的规则  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号