首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 99 毫秒
1.
基于对象的 OpenXML 复合文件去重方法研究   总被引:3,自引:0,他引:3  
现有的重复数据删除技术大部分是基于变长分块(content defined chunking ,CDC)算法的,不考虑不同文件类型的内容特征。这种方法以一种随机的方式确定分块边界并应用于所有文件类型,已经证明其非常适合于文本和简单内容,而不适合非结构化数据构成的复合文件。分析了 OpenXML 标准的复合文件属性,给出了对象提取的基本方法,并提出基于对象分布和对象结构的去重粒度确定算法。目的是对于非结构化数据构成的复合文件,有效地检测不同文件中和同一文件不同位置的相同对象,在文件物理布局改变时也能够有效去重。通过对典型的非结构化数据集合的模拟实验表明,在综合情况下,对象重复数据删除比 CDC 方法提高了10%左右的非结构化数据的去重率。  相似文献   

2.
张飞  刘珂 《测控技术》2016,35(5):87-91
传感节点的感测数据易受到污染,导致大量传感节点的观察数据出错.为此,提出基于二元数据的多目标容错定位BMSFTL算法.BMSFTL算法考虑传感节点的差错概率的情况,利用传感节点的二元观察数据对目标源进行识别及定位.在目标源识别阶段,采用分布式竞争领导者(DCL)算法产生领导者(leader)节点,在理想状态下,leader节点数等于目标源的个数.然后,再利用基于网格投票(GBV)机制对目标源进行定位.仿真结果表明,提出的BMSFTL算法在噪声和差错情况,保持高的定位性能,在差错概率为0.25的环境,均方根误差小于8 m,远优于最大似然估计ML.  相似文献   

3.
为克服片上网络链路永久性错误带来的路由问题,提出一种基于前缀的片上网络容错源路由算法PFTSR。该算法适用于二维mesh片上网络,采用预测路径并根据反馈信息调整路径的方法进行路由探测。在仿真平台NIRGAM上进行仿真,实验结果表明,与传统片上网络容错源路由算法SRN相比,PFTSR极大降低了片上系统的功耗,并且在大多数情况下能减少探测到第一条路径的时间。  相似文献   

4.
韩京宇  陈可佳 《计算机科学》2014,41(11):247-251,255
Web文档内容数据质量评估决定获取数据的有用性。基于词法或用户交互进行质量评估的方法缺乏通用性,也不能获取内容的事实内涵。因此提出基于事实的质量评估方法(Fact-based Quality Assessment,FQA)。首先在Web上构建目标文档上下文,并抽取Web文档内容的事实;然后分别采用投票和图迭代策略,构建准确性和完整性维度的参照;最后,比对目标文档和维度参照的事实,量化准确性和完整性。该方法不依赖特定特征,基于事实内涵量化数据质量维度,可取得高的评估精度。实验结果证明了FQA方法的优越性。  相似文献   

5.
研究了基于数据重构的宽带相干源最小方差无畸变响应(MVDR)算法, 以采样定理为基础, 将同一时刻不同阵元的输出看做是连续线列阵的采样, 将时域的数据重构方法引入空间的阵元域数据, 从而实现宽带相干源的方位估计, 并提出了一种聚焦误差求取方法, 用于分析宽带相干源MVDR算法的性能。计算机仿真了FFT插值法和数据重构法的方位估计结果, 表明对于宽带MVDR算法, 数据重构方法比起FFT插值法具有更好的分辨概率和更低的均方根误差。  相似文献   

6.
研究航迹数据异值识别方法,给出了一种适应于含有大量斑点型异常信息识别的滑动容错辨识算法。飞行试验数据处理结果表明,该方法对含有斑点型异值的航迹测量数据有很好的处理效果。  相似文献   

7.
网格结构是并行与分布式处理中最流行的一种网络拓扑结构。在存在故障的情况下,如何设计具有最优性的容错路由算法一直是研究的热,点问题。本文研究了采用故障块模型的二维网格的最小路由问题,提出存在最小通路的一个充分必要条件。基于最小通路区(RMP)的概念,提出一种自适应的最小容错路由算法。如果源节点和目的节点之间存在最小通路区,则在最小通路区中进行自适应最小容错路由;反之,则采用多阶段最小容错路由。主要思想就是在存在故障的情况下,尽量保证路由算法能走最短路径。因为只要求知道每个节点的局部信息,故算法是分布式的。  相似文献   

8.
在可扩展标记语言(XML)无线数据广播中,数据以XML文档为基本单位进行广播,然而XML文档间的冗余信息会降低带宽资源的利用率。为解决该问题,提出一种有效的调度算法,分析文档合并对数据广播的性能影响,得出文档间亲密度的衡量标准,并将亲密度高的文档进行合并以减少冗余信息。实验结果证明,该算法可以提高无线数据广播性能,节约带宽资源。  相似文献   

9.
针对一类带有多源干扰和常值故障的随机系统,研究其抗干扰和故障诊断问题.多源干扰包括由外源系统生成的部分信息已知的干扰和白噪声干扰两类.第1类干扰包含状态和干扰耦合,不仅可以代表一类部分信息已知的干扰,还可以代表一类随机干扰,且耦合增加了系统的复杂性,导致必然等价原则的无效.为了解决这个问题,提出复合极点配置和线性矩阵不等式(LMI)方法相结合的策略.首先,设计随机干扰观测器来估计第1类干扰;其次,设计随机故障诊断观测器来估计系统故障.基于此,结合容错控制和随机控制,提出基于观测器的复合容错控制策略,在满足一定条件下,该策略可以保证复合系统满足依均方渐近有界.最后,通过仿真验证所提出策略的正确性与有效性.  相似文献   

10.
在以无线网络为代表的移动计算环境中,数据广播是一种有效的数据访问方式。为响应最多用户数据请求,提出了优先级计算模型,进而提出了一种基于优先级的广播内容选择算法。该算法综合考虑了事务存取多个数据项和满足定时限制的要求,根据用户请求队列状态动态选择广播内容,并应用剪枝机制减少了选择开销。实验结果表明它比现有算法有明显的优越性。  相似文献   

11.
针对处理大于2GB的数据所面临的困难,提出一种利用内存映射文件实现数据读写的标准方法.该方法具有处理数据更加快速、灵活和高效等优点.实践证明,该方法在大容量采编数据的读取、处理和显示等方面的应用中,取得了良好效果.  相似文献   

12.
目的 针对影像匹配时提取特征线断裂而影响匹配结果及可靠性的问题,提出多重约束条件下的近景影像线特征匹配方法。方法 首先,采用SIFT算法获取同名点,并使用RANSAC算法进行优化,通过同名点计算仿射变换矩阵;建立格网点,利用仿射变换、Harris兴趣值及最小二乘法提高密集匹配结果的精度;其次,采取Freeman链码优先级算法提取直线,根据搜索区域内密集匹配点与直线位置关系完成特征线的初始匹配;最后通过线段重合度对初始匹配结果进行优化,并利用核线约束确定同名直线端点。结果 选取存在旋转、尺度、遮挡的近景影像进行线特征匹配实验,结果表明,与其他直线匹配方法相比,本文方法不仅在直线匹配成功数目上约为经典算法的1.07~4.1倍,而且直线匹配正确率也提升0.6%~53.3%,具有较好的准确性和鲁棒性。结论 通过多重约束有效地减小了立体影像中线特征匹配时的搜索范围,提高了直线匹配速率,且该方法适用于不同类型几何变化下的近景影像数据,并能较好地改善直线断裂及遮挡问题。  相似文献   

13.
基于PSO的多QoS约束路由问题研究   总被引:1,自引:1,他引:0  
刘钊  陈建勋 《计算机工程与设计》2006,27(9):1586-1587,1594
研究了计算机网络在多QoS约束条件下的路由问题。针对该问题的特点,改进了粒子群优化算法(Particle Swarm Op-timization algorithm,PSO),采用了新的粒子速度更新策略和粒子抗拥塞策略,使之成为一种解决多QoS约束路由问题的新算法。在一个8×8网状拓扑结构的仿真网络里对该算法进行了仿真实验,实验结果表明新算法对于多QoS约束路由问题可行且收敛快。  相似文献   

14.
iPhone短信删除数据恢复方法的研究   总被引:1,自引:0,他引:1  
SQLite是一款轻型的数据库引擎,资源耗损低、运行速度快、功能强大、支持Windows/Linux/UNIX等主流的操作系统,被广泛应用于通信录、通话记录、手机短信、QQ聊天记录等多种应用中。通过分析iOS系统SQLite数据库的文件格式和数据记录的寻址方式,提出一种iPhone手机删除短信的恢复方法。结果表明,这种恢复删除数据的方法可以用于恢复iPhone短信数据库中的文本数据。  相似文献   

15.
约束数据域的Delaunay三角剖分算法研究及应用   总被引:6,自引:0,他引:6  
研究了一种约束Delaunay三角网生成算法,它充分利用分治算法与生长算法的优点,对离散点、构网中实时生成的边及三角形采用分块进行网格索引,有效地减少了搜索目标点、边及三角形的时间,从而提高了构网速度,并将该算法用于地面模型的构建中,实现了地形三维可视化。  相似文献   

16.
水文观测数据是进行流域水文科学及相关科学研究的基础。在回顾国内外水文信息系统及水文数据共享现状的基础上,通过系统收集和整理黑河流域水文观测数据,利用协同促进水文科学发展大学联盟水文信息系统(Consortium of Universities for the Advancement of Hydrologic Science,Inc.-Hydrologic Information System,CUAHSI\|HIS)提供的水文服务器(HydroServer)组件进行了黑河流域水文数据共享发布平台的设计与实现。系统主要采用了观测数据库模型、WebGIS地图缓存技术和Web Service技术,建立了一个具有水文观测数据检索与浏览\,在线服务与分析功能的水文信息共享发布系统。  相似文献   

17.
One of the drawbacks of Data Envelopment Analysis (DEA) is the problem of lack of discrimination among efficient Decision Making Units (DMUs) and hence, yielding large number of DMUs as efficient ones. The main purpose of this paper is to overcome this inability. One of the methods for ranking efficient DMUs is minimizing the Coefficient of Variation (CV) for inputs-outputs weights, which, was suggested by Bal et al. (2008). In this paper, we modify the model and introduce two new models for ranking efficient DMUs based on Norm 1 and using means of inputs-outputs weights. To illustrate purpose, numerical examples are given.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号