首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 281 毫秒
1.
在分析数据预处理的意义基础上,提出了一种基于最大距离算法的模式聚类的数据预处理方法,该方法不依赖任何数学模型,通过对某造纸厂制浆蒸煮过程中采集的大量现场数据的仿真处理,研究表明本文提出的方法能在保留原始数据的有用信息的基础上剔除冗余数据,侦破过失误差,减少随机误差。  相似文献   

2.
Web日志数据挖掘的数据预处理方法研究   总被引:17,自引:1,他引:17  
主要介绍了Web用户访问日志数据挖掘数据预处理过程,综述了国际上的研究现状。流行的预处理方法。在对用户访问行为的合理假定基础上,最后提出了基于综合最大前向参引模型和时间窗口模型的新方法。  相似文献   

3.
编译预处理是C/C++语言提供的一种重要而又特殊的功能。,文章在总结了编译预处理优缺点的基础上,结合实例介绍了利用编译预处理在可执行文件中嵌入大批量数据的一种方法,并讨论了这种方法实现数据嵌入程序的优点,  相似文献   

4.
模糊聚类在数据预处理中的应用研究   总被引:1,自引:1,他引:0  
在分析工业过程数据测量误差源的基础上,提出了一种基于模糊聚类的数据预处理方法.该方法不依赖于任何数学模型,通过对某造纸厂的大量数据的仿真处理,表明该方法能在保留原始数据有用信息的基础上剔除冗余数据,侦破过失误差,减少随机误差.并将该方法用于某造纸厂制浆蒸煮过程的数据预处理中,得到了良好的效果.  相似文献   

5.
大规模网络环境和大数据相关技术的发展对传统数据融合分析技术提出了新的挑战。针对目前多源数据融合分析过程灵活性差、处理效率低的问题,提出了一种基于相似连接的多源数据并行预处理方法,该方法采用了分治和并行的思想。首先,通过对多源数据中的相似语义进行统一、对个性语义进行保留的预处理方法提高了灵活性;其次,提出了一种改进的并行MapReduce框架,提高了相似连接的效率。实验结果表明,所提方法在保证数据完整性的基础上,使总的数据量减小了32%。与传统的MapReduce框架相比,改进后的框架在耗费时间方面减小了43.91%,因此该方法可以有效提高多源数据融合分析的效率。  相似文献   

6.
针对常见的图像预处理系统中由上位机实现图像预处理的过程。利用FPGA并行处理的特点,提出了将基于摄像头的图像获取与基于FPGA的图像预处理技术相结合的方法。在图像获取阶段,通过摄像头进行图像数据的获取并将图像数据传输给SDRAM存储,同时在FPGA中实现图像预处理,以及使用以太网将图像数据传输给上位机,最终实现图像获取、预处理与传输。仿真结果表明,该方法相较于传统的图像预处理与传输方法能够实现稳定,实时的图像预处理与传输。  相似文献   

7.
针对硬件木马检测中数据预处理效果不佳的问题,提出了小波变换的数据降噪预处理的硬件木马检测的优化方法。在对提取的功耗信息进行小波变换数据降噪预处理基础上,利用马氏距离进行硬件木马的判别。对基于FPGA实现的含有木马的ISCAS’89系列的基准电路进行检测,并进行后续的数据处理实验。实验结果表明,采用小波变换的数据降噪预处理的硬件木马检测优化方法,可检测出占母本电路面积为0.24%的硬件木马。  相似文献   

8.
利用图片类日志信息改进会话识别质量   总被引:2,自引:0,他引:2  
范纯龙  姜宏飞  李华 《计算机应用》2010,30(4):1056-1058
数据预处理是Web日志挖掘的基础,而会话识别则是数据预处理的关键步骤,其质量严重影响Web日志挖掘的结果。在分析现有会话识别方法的基础上,提出了利用数据预处理中废弃的图片等日志数据,并结合扩展Web图结构,从页面分组规则和路径补全算法两个方面改进会话识别质量,并通过实验证实该方法对改善会话识别质量是有效的。  相似文献   

9.
入侵检测中的数据预处理问题研究   总被引:6,自引:0,他引:6  
本文重点讨论入侵检测中的数据预处理问题。针对数据预处理的主要内容,给出了聚类要素的格式化处理方法,并将数据约简和规则提取结合到一起,提出了一种基于粗糙聚类方法的入侵检测预处理聚类器。最后用同一个入侵检测系统对预处理后与预处理前的检测结果进行了对比,结果表明该聚类器可有效提高入侵检测的效果。  相似文献   

10.
近年来,数据挖掘技术的应用越来越广泛。本文研究了空间挖掘技术的理论、过程及方法.并在此基础上提出了一种基于MapX的空间数据挖掘系统结构,以及挖掘过程中所需的数据预处理方法和挖掘算法,为数据挖掘与GIS的集合找到了一种解决方法。  相似文献   

11.
Data mining-based analysis methods are increasingly being applied to data sets derived from science and engineering domains that model various physical phenomena and objects. In many of these data sets, a key requirement for their effective analysis is the ability to capture the relational and geometric characteristics of the underlying entities and objects. Geometric graphs, by modeling the various physical entities and their relationships with vertices and edges, provide a natural method to represent such data sets. In this paper we present gFSG, a computationally efficient algorithm for finding frequent patterns corresponding to geometric subgraphs in a large collection of geometric graphs. gFSG is able to discover geometric subgraphs that can be rotation, scaling, and translation invariant, and it can accommodate inherent errors on the coordinates of the vertices. We evaluated its performance using a large database of over 20,000 chemical structures, and our results show that it requires relatively little time, can accommodate low support values, and scales linearly with the number of transactions.  相似文献   

12.
安卓开发者需要通过不断地经验积累来提升其设计安卓界面及行为交互的能力.在数据驱动的软件开发中,代码推荐是其中一个关注热点.在此背景下,本文提出了一种安卓应用界面交互模式抽取与检索方法,提供面向安卓应用的界面相关代码查询与推荐能力,从而降低开发者在选择、试用、学习安卓应用所带来的人工成本.以安卓活动(Activity)为单元的界面交互模式代表了活动的界面构成及交互行为.本方法以此为分析目标,从一组开源的安卓应用项目中抽取出每一个活动的界面交互模式.在此基础上,支持用户通过检索的方式获取与其需求相关的活动设计细节.该方法被实现为一组工具链,为抽取与检索提供自动化支持.最后,通过两个案例对本方法的准确性与有效性进行验证.  相似文献   

13.
极光卵对于研究磁层结构和能量存储是非常重要的。提出一种基于区域生长的极光图像分割算法。首先根据极光图像的特点,对原始图像进行预处理,根据预处理后图像的灰度特性,选取一组能正确代表目标区域的种子像素;其次,在分析像素邻域灰度特性的基础上,采用最大类间方差法求得自适应最佳阈值,从而代替传统区域生长算法手动选取阈值时造成的系统误差,再采用基于区域灰度差的方法,制定出区域生长的停止条件;最后,利用数学形态学的方法进行分割后修正,消除了由于噪声而造成生长后的区域中出现的空洞和不连续现象。实验结果表明,相对于已有的极光卵分割方法,基于区域生长的方法改善了图像的分割质量。  相似文献   

14.
中文文本自动校对中的语法错误检查   总被引:5,自引:1,他引:5  
文章将中文文本的语法错误分为搭配错误和与句型成分相关的错误两大类。分别采用模式匹配的方法和基于句型成分分析的进行检查,这两种方法的结合,可以同时考虑局部和全局的语法限制信息,并且降低了语法检查的复杂度。通过对实验结果的分析和评测,证明文章所述的方法是可行的。  相似文献   

15.
如果工业测量数据中存在显著误差,则传统的数据协调模型会将显著误差分散到各个测量值中去.针对于传统数据协调模型的缺陷,本文通过添加一个基于测量值比例关系上下限的约束条件,并利用罚函数的概念将物料平衡的约束条件以软约束的形式表示,建立一种新的数据协调模型.改进后的数据协调模型只会对含有显著误差的测量值给予较大的协调量,而使得显著误差对其他测量值协调结果的影响较小,具有较高的鲁棒性.基于工业实际生产模型的仿真试验证明基于该数据协调模型的协调结果,可直接利用测量残差检测法进行显著误差检测,具有较高的错误检出率,且第Ⅰ类错误率较低.  相似文献   

16.
计算机网络的安全在当今社会起着举足轻重的作用。该文将基于分类器选择的模式识别方法应用于入侵检测,提出了一种基于静态分类器选择的网络入侵检测方法。该方法对经过聚类获得的各个区域采用新的策略进一步划分,在划分后的子区域上选择分类器,结合了最近邻规则,减小静态分类器选择方法的误差,提高了检测性能。聚类选择(CS)是典型的静态分类器选择方法,在KDD’99的入侵检测数据集上的实验表明,该方法的性能优于基于聚类选择的网络入侵检测方法。  相似文献   

17.
The timing information contained in the on/off paper motions of handwriting is analyzed for its applicability to the problem of handwriter identification. Three different experiments on a data base of ten signatures from nine individuals are analyzed in terms of Type I and Type II error probabilities. Type I errors are found to be high (30–50%) while Type II errors are found to be low (4–12%). Analysis of the results suggests that one-bit pressure patterns are usable in a sequential handwriter recognition scheme for first stage screening of incoming signatures.  相似文献   

18.
徐霞  李培峰  朱巧明 《计算机科学》2015,42(2):253-255,262
事件模板是指导事件抽取工作的依据,半监督方法下模板的准确性显得尤为重要.目前,基于双视图的“触发词-论元”模板的中文信息事件抽取系统不能有效地解决触发词一词多义的现象和模板稀疏现象.提出了一种借助论元进行触发词语义消歧的方法,并利用该方法进行模板过滤以消除无效模板的影响.另外,针对几种特殊的中文句型,根据句法结构提出了模板转换规则,从而提高了模板的适用性.在ACE2005中文语料上的测试表明,该方法可有效地提高半监督中文信息事件抽取系统的性能.  相似文献   

19.
显著误差检测是数据校正技术中必不可少的一环,以往的显著误差检测方法绝大多数都是基于测量残差和约束残差这两个统计量展开研究的.基于测量残差的检测方法首先需要对测量数据进行数据协调,这就会将显著误差分散到各个测值中去,从而会对显著误差的位置做出错误的判断.基于约束残差的检测方法只能对节点的平衡性进行判断,而无法确定显著误差的具体发生位置.为此,本文通过构造一个基于测量值比例关系的F统计量,并与约束残差统计量相结合,对稳态过程中出现的显著误差进行检测.通过对工业数据的仿真结果表明此方法对显著误差十分敏感,其各项性能指标均符合实际工业要求,具有较高的可信度和可应用性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号