共查询到20条相似文献,搜索用时 468 毫秒
1.
数据的质量直的好坏接关系到数据挖掘的结果,因此数据预处理是Web日志数据挖掘首要的步骤,基于前期提出的几种数据预处理方法,提出了通用的Web日志挖掘的数据预处理模型,将Web日志数据的预处理分为5个步骤:数据清理、用户标识、会话标识、路径补充和格式化,并结合旅游网站进行了实例验证。证明该数据预处理模型是完全可行,并且具有良好的通用性和可扩展性。 相似文献
2.
介绍了遥感图像处理软件选取、数据预处理的影像裁剪、投影设置、分类前预处理,给出了遥感图像数据预处理的研究方法。 相似文献
3.
4.
针对传统方法存在数据预处理时间长、无法消除冗余数据等问题,提出一种基于变分率时域技术的光通信数据预处理方法。首先采用变分率时域技术提取光通信中的冗余数据特征,然后运用线性频谱分析法对冗余数据特征进行分类,根据分类结果可实现冗余数据消除和处理,最后进行了光通信数据预处理仿真实验,结果表明,本文方法对源数据影响较低,运算过程简单,提高了光通信数据预处理效率,为提升光通信冗余数据的消除效率提供了有力的依据。 相似文献
5.
6.
针对桥梁健康监测的海量数据在预处理及存储方面的问题,结合当前大数据的分布式处理思想、数据流的滑动窗口处理技术以及小波包降噪方面的优势,提出了一种桥梁健康监测海量数据预处理及存储模型,该模型不仅可以有效保存桥梁监测的原始数据,而且把数据的预处理融入其存储过程,并可根据传感器是否工作而进行报警。结果证明了该模型应用在桥梁健康监测海量数据预处理及存储上的可行性。 相似文献
7.
大规模网络分层后进行数据预处理是其搜索最短路径的加速方法,现有的分层网络数据预处理存在以下问题:随着网络规模越来越大,数据预处理计算量也越来越大;预处理完的数据需要大量储存空间。针对上述问题提出一种基于深度优先搜索的分层网络最短路径搜索算法,该算法将每簇网络抽象成“一个高级节点”组成高级网络,在高级网络上利用深度优先搜索去掉冗余的簇完成数据预处理后,再利用Dijkstra算法搜索最短路径。采用该算法在大规模树形分层通信网络上进行最短路径搜索实验,结果表明该算法比基于关键点数据预处理的最短路径算法平均搜索时间稍长,但在数据预处理时间和存储空间上大大降低。 相似文献
8.
9.
10.
《电子技术与软件工程》2017,(4)
本文主要介绍了TEQC软件在GPS点位数据质量检查与预处理中的功能优势。文中分别从GPS数据格式转换、GPS数据分割与合并预处理与GPS数据质量检查三方面,针对点位数据质量分析与处理中,TEQC软件的具体应用相关内容展开分析。 相似文献
11.
大数据背景下,Web使用挖掘的目的是通过识别Web数据使用模式更好地为Web应用需求提供服务,高效地处理大数据并从中找到有用的信息,数据预处理是保证Web使用挖掘数据质量的必要阶段。首先,论述了Web使用挖掘数据预处理领域的相关工作;其次提出了在数据挖掘开始之前的接入流数据预处理技术,这项技术能通过识别单独用户和会话来提高数据预处理的性能;最后进行了实验验证。结果表明,文中方法有助于发现来自于用户数据流的有意义的模式和关系,因此具有可行性和有效性。 相似文献
12.
《电子技术与软件工程》2017,(2)
基于云计算技术的电力大数据预处理属性约简是当前电力企业数据处理的主要发展方向。文中对其发展进行了简单介绍,并对Map Reduce在电力大数据预处理属性约简中的应用以及基于Map Reduce技术的电力大数据预处理属性约简进行详细分析。 相似文献
13.
14.
15.
在飞行试验过程中,因缺乏对海量试飞原始数据和预处理结果数据的快速检查和故障定位,导致试飞工程师分析数据的难度急剧增加,影响试飞型号任务的高效进行。在此针对上述问题对飞行试验数据进行自检测技术研究,设计了一个基于参数信息专家数据库的原始数据与预处理结果数据的自动化检测系统软件。该软件可对原始数据进行自动化检测,同时依据专家数据库的自定义判据,对预处理结果数据进行自动化检测和计算处理。经过软件测试和应用,该软件能够有效地解决原始数据和预处理结果数据中的数据异常和错误,提高试飞工程师对海量试飞数据的分析效率。 相似文献
16.
《电子技术与软件工程》2017,(15)
在大数据时代,如何使用现有的数据对学员进行培训管理,从而提高培训效率是当前培训管理中所面临的问题。本文分析了数据挖掘在培训管理中的应用主要表现在初步探索、数据预处理以及数据挖掘过程。其中数据预处理和数据挖掘是培训系统的核心功能。 相似文献
17.
高光谱亮温数据的数据量通常十分庞大,其中包含大量冗余信息,直接使用计算量大且冗余信息会对计算结果产生影响,所以需要对数据进行预处理。使用主成分分析法和通道选择方法2种数据预处理方法对根据SeeborV5.0数据集生成的高光谱仿真微波亮温数据进行预处理,将处理后的数据作为神经网络的输入进行大气温度廓线反演。反演实验结果表明,使用主成分分析法的神经网络反演效果更好。 相似文献
18.
19.
由于时序数据的海量、高维等特点,对原始数据进行预处理是实现时序数据挖掘的重要步骤。有效的预处理不仅能去除噪声、冗余,减低数据规模、提升计算效率,还能通过提取数据特征,揭示数据关系,有助于实施时序数据挖掘。本文从数据缺失、数据噪声、离群点/异常值、特征提取和模式表示几个方面,对已有的原理和方法进行分析归纳,为后续时序数据挖掘研究提供参考。 相似文献
20.
数据预处理在Web日志挖掘过程中起着至关重要的作用.论文分析了Web日志挖掘数据预处理的主要步骤,设计了用户识别、访问操作识别和路径完善三个步骤的关键算法.实验结果表明,设计的关键算法是有效的. 相似文献