共查询到20条相似文献,搜索用时 78 毫秒
1.
文章深入分析了局部扫描海量数据库方法,实现了基于函数局部扫描解决海量数据库快速读取的问题.给出了不同类型利用函数实现局部范围扫描的SQL语句写法,总结了函数使用需要注意的问题.文章对在线大数据量快速查询SQL语句的编写有一定的参考做用. 相似文献
2.
3.
随着互联网技术的发展,网络数据变得越来越巨大,如何从中挖掘有效信息成为人们研究的重点。近年来频繁项集挖掘由于其在关联规则挖掘、相关挖掘等任务中的相关重要作用,越来越受到人们的重视。文中针对分布式计算环境下频繁项集挖掘算法的研究,对PFP-Growth算法进行了改进,通过MapReduce编程模型对改进的PFP-Growth算法进行了实现和应用,使用户可以从海量数据中高效地获得所有需要的频繁项集。实验结果表明算法在针对海量数据时具有较高的效率和伸缩性。 相似文献
4.
何文华 《计算机应用与软件》2012,29(4):275-277,296
传统模式匹配算法在面对海量数据和海量关键字时效率都会大幅降低,通过构造关键字状态树,使完成匹配的时间跟关键字的规模无关,在文本内容信息分析客户特征时的速度提升了十万倍.应用该算法开发的触发式营销引擎,通过在特征库获取客户的相关特征和预设的营销激励策略,在适当的时间向适当的客户自动发起营销行为. 相似文献
5.
用分块调度置换算法快速浏览SAR带状海量影像 总被引:1,自引:0,他引:1
遥感影像处理中原始影像数据量大,常呈条带状分布,一般不直接作为各种专业图像处理软件数据源,而是快速浏览影像并从带状分布的影像中提取某一部分(段)作为再处理的数据源。对此应用该文提出了分块调度置换算法快速浏览SAR海量影像数据技术,能实现海量数据快速浏览,实时保存指定范围数据为新影像文件。 相似文献
6.
7.
本文对目前比较优秀的各种分类方法进行了介绍、分析和比较.在此基础上,借鉴决策树方法的快速分类特性,提出了一种基于数据库抽样的海量数据分类算法,给出了算法的设计思想和实现原理,并对多处理环境下的优化进行了探讨.实验研究表明,该算法可以明显提高海量数据库的分类效率. 相似文献
8.
针对传统知识库表示的局限性,通过分解和重组领域知识,建立扩展树状结构的知识库,其中叶结点对应具体知识实例,称为原子知识,非叶结点只对应知识概念。同时提出相关的数据清洗算法,根据用户的选择,自动提取原子知识进行分析,消除重复,按照处理权重建立原子知识序列,然后逐一对数据进行清洗。实验表明,该算法能有效优化用户的请求,减少对海量数据的遍历次数,海量数据的清洗效率明显提高。 相似文献
9.
任欢 《计算机光盘软件与应用》2014,(6):126-126,128
当前,越来越多的业务部门都需要操作海量数据,如规划部门的规划数据,水利部门的水文、水利数据,气象部门的气象数据,这些部门处理的数据量通常都非常大。它包括各种空间数据、报表统计数据、文字、声音、图像、超文本等各种环境和文化数据信息。我们需要从大规模的、没有关系的数据中,在存储、管理、处理、优化等各个环节中注重效率,并提取出所需要的信息。海量数据存储管理在各行业的信息化过程中很重要,受到广泛的关注。本文综述了海量存储管理技术的研究及应用现状,以及结合大型收费系统同,介绍了一些关键的优化技术,包括数据库的存储,数据的管理,SQL语句,页面分割等,最后,结合当前海量数据存储管理技术,指出了海量数据存储管理面临的一些新的发展方向。 相似文献
10.
重复数据检测技术能够大幅降低数据中心的存储量,节省网络带宽,减少建设和运维成本。为了克服基于内容分块(CDC)方法容易出现超长块的缺点,文章提出了基于极值点分块(EDC)的重复数据检测算法。EDC算法先计算出所有右边界在数据块上下限范围内的滑动窗口中数据的指纹,找出最后一个指纹极值,所对应的滑动窗口结束位置作为数据块的分界点,再计算该数据块的哈希值并判断是否重复块。实验结果表明,EDC算法的重复数据检测率、磁盘利用率分别是CDC算法的1.48倍和1.12倍,改进效果显著。 相似文献
11.
针对已有连通域标记算法不能适用于遥感数据等海量灰度图像八连通域快速标记的问题,设计并实现了一种MGSI-8CA标记算法。该算法对传统的八连通域标记算法进行八向变四向优化,采用列表机制解决连通域标记冲突问题,并引入了筛选机制和分块处理机制,实现了对海量灰度图像八连通域标记的快速处理,同时也得到了灰度图像连通域的正确划分及精确的连通域数目。实验结果证明,MGSI-8CA标记算法运行效率高,更能适应海量灰度图像处理的要求。 相似文献
12.
Tescher提出的OSH碰撞检测算法,因算法的有效性被应用在需要提供空间映射对的各种场合。但算法仅仅通过求解重心坐标的权值来判断是否侵入,而无法测试侵入深度和求解接触法线,造成算法对于形成合理碰撞响应有一定限制。针对这一问题,提出使用SDM方法求解侵入参数,加入惩罚力提供变形体碰撞响应,结合约束力保证距离面积体积的守恒,从而形成有效的OSH碰撞检测环境。 相似文献
13.
14.
15.
杨朝辉 《计算机工程与设计》2012,33(5):1923-1927
为有效解决SAR图像道路检测算法中阈值优化的问题,提出了一种不需要固定阈值的检测方法.该方法由不同阈值组合的Tupin边缘检测算法得到边缘检测结果图集,并逐像素统计得到边缘密度图;引入卡方检验计算边缘密度图与边缘检测结果图集之间的相似性度量参数,优化得到最佳边缘相关等级;根据最佳等级得到最终的道路边缘检测结果.实验结果表明,该方法有较强的开放性与目标适应性,自动化程度高,有很强的工程实用性. 相似文献
16.
针对海量图片中的去除重复图片效率低的问题,提出一种基于图片特征的并行化海量图片快速去重技术。首先,对图片提取图片颜色、纹理、形状等特征,用来全面描述图片;其次,使用度量标准对图片之间的特征距离进行度量计算;最后,利用如果两个点到任意一点距离相等则这两点有可能是同一个点的思想实现根据特征距离对重复图片的快速定位,达到重复图片检测与去重的目的。结合实验数据分析验证该技术不仅能够准确地去重图片,且采用i5四核处理器的单机计算方式仅10 min左右即可处理500万级图片量,与一般的两两计算相比,提高了海量图片去重的时效性,使得计算时间大幅度缩短。 相似文献
17.
18.
基于图像分块的多尺度Harris角点检测方法 总被引:4,自引:0,他引:4
Harris角点检测是一种经典的角点检测算法,在现实中应用广泛,但不具有尺度变化特性。为了改变其单一尺度的特性,使得角点提取更加精确和有效,将多尺度的概念和图像分块方法引入到Harris算法中,在多个尺度下对角点进行提取。将每个尺度上的角点响应值的本地最大值作为该尺度上的候选角点,并同时对图像进行分块;最后,沿小尺度到大尺度方向判断候选角点是否是真实角点,剔除伪角点,使得角点检测更加精确。通过对比实验,新算法明显地提高了图像角点的检测性能。 相似文献
19.
20.
针对图像显著区域检测区域轮廓不明确,抗噪能力弱的问题,提出一种基于分块对比的多尺度图像显著区域检测。该方法以Itti模型为基础,在多尺度下提取图像特征以更全面地表现图像的总体特征;以图像块为单位计算图像的局部对比度作为图像的显著值;用自适应阈值法从显著图中提取显著区域。仿真实验结果表明,该方法能够准确地提取图像的显著性区域,使区域具有明确的边界。 相似文献