排序方式: 共有47条查询结果,搜索用时 15 毫秒
42.
周星刁兴春曹建军李鑫王芳潇 《数据采集与处理》2017,32(5):931-938
实体识别常利用分类器根据记录对的字段相似度向量将记录对分为匹配、不匹配和可能匹配,因此分类器的准确性与实体识别的准确性直接相关。为提高分类准确性,本文基于重采样和集成选择技术构建一个多分类器系统。充分利用实体识别的特点,在分类之前发现分类困难的样本,并使重采样比率在一个区间内变化,生成一组重采样样本;然后用重采样后的样本训练分类器构建一个并行多分类器系统,强调分类器之间的差异度和稀疏度,从该多分类器系统中选择最优分类器子集,即最优的重采样比率组合,分别用非线性规划和极值方法求解该集成选择模型。实验结果表明,本方法与现有的多分类器系统相比具有更高的准确性。 相似文献
43.
k近邻(kNN)算法是缺失数据填补的常用算法,但由于需要逐个计算所有记录对之间的相似度,因此其填补耗时较高。为提高算法效率,提出结合局部敏感哈希(LSH)的kNN数据填补算法LSH-kNN。首先,对不存在缺失的完整记录进行局部敏感哈希,为之后查找近似最近邻提供索引;其次,针对枚举型、数值型以及混合型缺失数据分别提出对应的局部敏感哈希方法,对每一条待填补的不完整记录进行局部敏感哈希,按得到的哈希值找到与其疑似相似的候选记录;最后在候选记录中通过逐个计算相似度来找到其中相似程度最高的k条记录,并按照kNN算法对不完整记录进行填补。通过在4个真实数据集上的实验表明,结合局部敏感哈希的kNN填补算法LSH-kNN相对经典的kNN算法能够显著提高填补效率,并且保持准确性基本不变。 相似文献
44.
3~+网速度快、功能强,但它的最大缺点是实时性差。本文作者利用3~+网支持的NETBIOS和操作系统提供的最新功能,采用分布式、模块化设计思想,设计了一套3~+网工作站之间点对点实时通讯软件,它可支持多种网板、多种机型、多种网络软件版本,而且功能强、配置灵活、稳定可靠,极大地丰富了3~+网的功能。 相似文献
45.
46.
现有的实体分辨方法在准确性和效率上各有所长,将易分辨和难分辨的记录对分开,为下一步分别应用不同分辨方法提供基础。对待划分的记录对,利用变精度邻域粗糙集分别计算相似记录对和不相似记录对的上下近似集,得到全体记录对的上下近似集及对应的边界,处于边界域的记录对即为难分辨的记录对,其余为易分辨的记录对。分析了变精度邻域粗糙集中的包含度阈值和距离阈值对于记录对划分的影响。利用实验比较难分辨、易分辨和原始记录对在利用相似度阈值分类和利用KNN分类时的准确性,说明了划分的有效性。 相似文献
47.
网络物理拓扑发现对网络管理与规划、性能预测、网络模拟与安全等都有很重要的意义和作用,基于地址转发表的物理拓扑发现是目前学术界研究的热点问题.定义了单子网和多子网交换域的最小约束,并证明了所提出的AFT基本推导规则BRR的完备性.此外,还对基于不完整AFT进行拓扑发现的NP难问题进行了讨论,深入剖析了任意实际的局域网络的不完整AFT通过BRR推导完成后的各种可能情况,并分析了单纯依靠AFT进行拓扑发现的局限性.该工作对于基于AFT进行物理拓扑发现具有重要的理论指导意义,同时,也为进一步发掘新的物理拓扑发现方法奠定了坚实的理论基础. 相似文献