排序方式: 共有4条查询结果,搜索用时 0 毫秒
1
1.
数据分析和清理中相关算法研究 总被引:4,自引:0,他引:4
数据清理的一个主要作用是识别重复的记录.结合过滤算法和启发式剪枝算法提出了启发式剪枝改进算法.然后,针对重复记录的特点提出了长度约束条件,能有效地提高比较字段不等长时的执行速度.数据库中经常会出现各种形式不同的缩写,而启发式剪枝算法等无法识别缩写情况下的重复记录,本文因此提出了基于动态规划的缩写发现算法,该算法既可以用于缩写发现也可用于缩写存在时的重复记录识别.另外,重复记录的甄别目前必须人工处理,传统方式下用户不得不逐条浏览和分析,工作时间冗长而且乏味,容易引入新的数据质量隐患,作者提出了聚类清除方案和聚类闭包算法,它将重复的记录聚类显示,用户一次可以处理完一个重复聚类,在有效提高速度的同时方便了用户. 相似文献
2.
双抽供热机组的变工况分析 总被引:1,自引:0,他引:1
本文使用循环函数对苏联BПT-50-2机组进行变工况分析,并探讨了变工况运行后经济性的变化情况,区别于传统 的热平衡分析,这里提出了一个新的特性-热量多耗系数,借助于它的变化,可以直接获得热电联产节煤量分析结果。 相似文献
3.
XML已经广泛地应用于数据描述及数据交换,然而日常数据的大部分依旧存放在关系型数据库里,因此转换关系数据到XML文档的需求日益增长,如何高效生成用户满意的XML模式是其中的关键。NeT&CoT算法2是近年来提出的可根据给定的关系模式生成具有层次特征的XML的自动转换算法,然而它存在效率不高的问题。因此,该文在NeT&CoT算法的基础上提出了简化算法,通过引入四个简化性质,避免了费时的nest操作,提高了转换效率。 相似文献
4.
1