首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
在已有的多种决策树测试属性选择方法中,未见将属性值遗漏数据处理集成在测试属性选择过程中的报道,而现有的属性值遗漏数据处理方法都会不同程度地带入偏置。基于此,提出了一种将基于联合墒的信息增益率作为决策树测试属性选择标准的方法,用以在生成决策树的过程中消除值遗漏数据对测试属性选择的影响。在WEKA机器平台上进行了对比实验,结果表明,改进算法能够从总体上提高算法的执行效率和分类精度。  相似文献   

2.
在已有的多种决策树测试属性选择方法中,来见将属性值遗漏数据处理集成在测试属性选择过程中的报道,而现有的属性值遗漏数据处理方法都会不同程度地带入偏置.基于此,提出了一种将基于联合熵的信息增益率作为决策树测试属性选择标准的方法,用以在生成决策树的过程中消除值遗漏数据对测试属性选择的影响.在WEKA机器平台上进行了对比实验,结果表明,改进算法能够从总体上提高算法的执行效率和分类精度.  相似文献   

3.
VFP应用程序在运行过程中动态设置的属性值当应用程序运行完毕并退出后,这些动态设置的属性值就不再保存,本文给出了程序运行后保存动态设置的属性值的方法。  相似文献   

4.
基于粗糙集理论的属性值约简算法研究   总被引:1,自引:0,他引:1  
对基于粗糙集的属性值约简算法及相关理论进行研究,并针对启发式值约简算法进行了性能测试和分析。在数据规模不是很大的情况下,启发式值约简算法与一般值约简算法相比,具有较好的执行效率。  相似文献   

5.
用交点属性值法处理多边形符号轮廓的裁剪   总被引:1,自引:0,他引:1  
近年来一种处理隐藏线的方法,即在用计算机进行图形隐藏线处理时,为方便起见给所求的交点按其所处理位置赋从不同的属性值标志(我们称它交点属性值法)。在绘图输出时只考虑交点属性累加值及其所在位置从而决定是否输出的方法。该方法的优点是计算方法简单,因而能提高绘图速度。但该方法多用在符号或多边形内填晕线上。本文着重讨论将该方法运用在任意多边形轮廓线的裁前上。经过作者多次试验,其结果是成功的。  相似文献   

6.
为了给邮件网络分析提供预处理后规范、简约的数据集,提出了基于粗糙集的邮件系统相关定义。将邮件对象集按邮件收发时间属性分类,并描述了基于邮件属性值支持度的属性值约简方法。该方法成功运用在Enron公司邮件包中部分邮件数据的预处理上。实验表明,处理后的邮件分析数据更加规范化,并且极大地缩减了邮件对象集的大小。  相似文献   

7.
基于属性值信息熵的KNN改进算法   总被引:3,自引:0,他引:3  
为了克服传统KNN算法;距离加权-KNN算法在距离定义及投票方式上的不足;提出了一种基于属性值对类别重要性的改进算法Entropy-KNN。首先定义两个样本间的距离为相同属性值的平均信息熵;此距离可通过重要属性值有效度量样本之间的相似程度;其次算法Entropy-KNN根据上述定义的距离选取与待测试样本距离最小的K个近邻;最后根据各类近邻样本点的平均距离及个数判断待测试样本的类别。在蘑菇数据集上的实验表明;Entropy-KNN算法的分类准确率高于传统KNN算法和距离加权KNN算法。  相似文献   

8.
一种连续条件属性值的决策表的归纳学习方法   总被引:1,自引:0,他引:1  
对由连续条件属性值和离散决策属性值组成的决策表,提出了一种归纳学习方法。把决策表中的连续条件属性值看作一矩阵,进行矩阵的奇异值分解,以确定决策表条件属性的数目。用模糊C均值聚类的方法对连续条件属性值进行不同聚类数目的聚类,得到不同聚类数目下的离散决策表,对这些决策表进行条件属性简化,从而得到不同的条件属性数目。比较矩阵奇异值分解后决策表条件属性的数目和上述不同聚类数目下的离散决策表简化后的条件属性的数目,并考虑决策属性的数目,确定最终的聚类数目。在此基础上,给出了由连续条件属性值和离散决策属性值组成的决策表的归纳学习方法,并验证了其有效性。  相似文献   

9.
为了提高对物联网多媒体音视频数据的检测识别能力,提出基于分段聚类的物联网多媒体音视频数据并行聚类挖掘方法.对采集的物联网多媒体音视频数据进行分段检测和连续谱密度特征分解,采用子空间匹配降噪方法进行多媒体音视频数据的滤波提纯处理,建立物联网多媒体音视频数据的多载波分析模型,结合频谱融合和连续细节特征分解方法进行物联网多媒...  相似文献   

10.
实例扩展与属性值扩充是Web抽取与集成领域中的一个重要研究课题,将Web数据列表和实例建模成二分图,根据扩展实例的质量分数,对扩展集合进行迭代更新直到扩展集合的质量分数最大,且扩展集合不再更新来实现实例的扩展。同时,为了完善扩展实例的属性信息,对结构化数值属性或离散属性进行抽取,提出了基于整数线性规划的属性值扩充方法。实验表明,与以前的方法相比,本方法能更好地处理含有噪声数据的Web网页,并提高了抽取的准确率和召回率。  相似文献   

11.
Continuous Query Processing of Spatio-Temporal Data Streams in PLACE   总被引:1,自引:0,他引:1  
The tremendous increase in the use of cellular phones, GPS-like devices, and RFIDs results in highly dynamic environments where objects as well as queries are continuously moving. In this paper, we present a continuous query processor designed specifically for highly dynamic environments (e.g., location-aware environments). We implemented the proposed continuous query processor inside the PLACE server (Pervasive Location-Aware Computing Environments); a scalable location-aware database server developed at Purdue University. The PLACE server extends data streaming management systems to support location-aware environments. These environments are characterized by the wide variety of continuous spatio-temporal queries and the unbounded spatio-temporal streams. The proposed continuous query processor includes: (1) New incremental spatio-temporal operators to support a wide variety of continuous spatio-temporal queries, (2) Extended semantics of sliding window queries to deal with spatial sliding windows as well as temporal sliding windows, and (3) A shared-execution framework for scalable execution of a set of concurrent continuous spatio-temporal queries. Experimental evaluation shows promising performance of the continuous query processor of the PLACE server. This work was supported in part by the National Science Foundation under Grants IIS-0093116, IIS-0209120, and 0010044-CCR.  相似文献   

12.
基于滑动窗口的数据流压缩技术及连续查询处理方法   总被引:8,自引:0,他引:8  
基于滑动窗口的连续查询处理是数据流研究领域的一个热点问题.已有的研究工作均假设滑动窗口内的数据能够全部保存在主存中,若滑动窗口内的数据量超过了可用主存空间,已有的查询处理方法则无法正常工作.提出两种数据流上的滑动窗口压缩技术,有效地降低了滑动窗口的存储空间需求.同时,给出了基于压缩滑动窗口的连续查询处理算法,理论分析和实验结果表明,这些算法具有很好的性能,能够满足数据流连续查询处理的实时性要求.  相似文献   

13.
罗德安 《计算机工程》2004,30(3):162-163,168
就建立铁路滑坡信息管理系统的必要性、管理系统的数据组织、系统的结构及其构建方法等进行了讨论,并对系统开发中涉及的一些关键技术作了讨论,通过实际应用证明该系统设计的有效性和实用性,并指出了该类系统今后的发展方向。  相似文献   

14.
海量数据持续数据保护技术研究及实现   总被引:2,自引:0,他引:2  
持续数据保护(continuous data protection,CDP)是一种在不影响主要业务系统运行的前提下,可以实现持续捕捉或跟踪目标系统所发生的任何改变,并且能够恢复到此前任意时间点的方法.提出了一种新的可扩展的海量数据持续数据保护技术;设计基于块级的海量数据持续数据保护技术的体系架构、关键技术.最后对系统性能进行了对比分析,并进行了总结和展望.  相似文献   

15.
连续数据保护(CDP)已成为业界备受关注的数据保护方式.提出了一种基于群组的CDP服务架构,通过组副本管理提供高效的块数据存取;采用B+树实现对元数据的快速查找;结合恢复分支文件以及增量、全量恢复算法找到最短恢复路径,并通过协同恢复以最少的资源快速完成恢复请求;通过资源分配器的调度提供及时响应、公平的CDP服务.基于群组的CDP服务架构充分利用单机存储和局域网的优势,较好地解决了现有的大多数CDP或是将数据保存到专用存储库,或是依靠受保护的主机使用远程存储空间所造成的成本较高、效率较低、扩展不方便等问题,大大提高了CDP的服务效率.  相似文献   

16.
数据流上的连续预测聚集查询   总被引:3,自引:0,他引:3  
提出了一种数据流上未来值的连续查询,称为连续预测查询.采用数理统计的方法给出了带有COUNT聚集函数的连续预测聚集查询实现算法.通过采用TPC-H标准测试数据和随机生成的模拟数据进行了实验.理论和实验结果表明,给出的带有COUNT的连续预测聚集查询实现算法具有很高的性能和精度.  相似文献   

17.
本文以铸坯连铸生产现况为背景,在连铸结晶器振动在线检测系统功能的基础上,结合虚拟仪器与LabVIEW的优势,详细阐述了系统对结晶器振动信号的实时采集方案与实现步骤。同时,文章还对振动信号的数据处理做了详细说明,给出了数字滤波器的实现程序,以及通过傅立叶变换实现的频谱分析图。文章最后给出的实际工程应用中系统采集到的振动信号时域波形和处理得到的频域频谱,充分证明了用LabVIEW实现的振动信号实时数据采集与处理取得了良好效果。  相似文献   

18.
简单介绍了物业管理系统的软件开发环境,讨论了ADO.NET的体系结构以及ASP.NET环境下利用ADO.NET访问数据库的技术,并给出了部分的实现代码.利用ASP.NET和ADO.NET技术开发的物业管理系统,实现了物业的动态管理,使得对物业信息的管理更加及时、高效,提高了工作效率.  相似文献   

19.
三峡滑坡仿真系统中的关键技术   总被引:11,自引:0,他引:11  
“三峡工程库区滑坡计算机智能仿真系统”是国内外第一个实时滑坡仿真系统。该文简要介绍了该系统的总体思路,及其参数化建模工具、工程数据库、数学力学分析、专家系统、智能化实时仿真等关键技术。  相似文献   

20.
王伟  高亮  吴涛 《微机发展》2008,18(3):53-55
由于粗糙集只能对离散属性进行处理,因而连续属性的离散化也就成了粗糙集的主要问题之一。提出了一种从模糊聚类出发的离散化方法,并给出了一个判别函数,由该函数从聚类结果中选择最优的一个解,因而是一种自寻优的求解过程,避免了人为划分类数的主观影响。最后进行了实验比较,证实了该方法的有效性和合理性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号