排序方式: 共有62条查询结果,搜索用时 22 毫秒
1.
针对优化几何集成方法(optimized geometric ensembles, OGE)在计算特征边界点集合的过程中包含大量冗余运算且效率较低的缺陷,分别利用Gabriel近邻规则及其启发式搜索法加速特征边界点的选取过程,提出了两种改进的几何集成方法--Gabriel OGE和启发式OGE,并与OGE进行比较实验。实验结果表明,虽然Gabriel OGE中计算特征边界点的时间复杂度与OGE一样,但是因为减少了大量数学运算,计算速度明显提高;而启发式OGE不仅将平均时间复杂度降低为O(dM2),而且在处理大数据集时,计算效率最高。Gabriel OGE和启发式OGE在保证分类结果的同时有效提高了特征边界点集合的计算速度,大幅度减少时间消耗。 相似文献
2.
非凸在线支持向量机(LASVM-NC)具有抗噪能力强和训练速度快的优点,而词频相关频率积(tf.rf)则是一种自适应能力很强、分类性能非常好的文本特征。通过把非凸在线支持向量机和词频相关频率积相结合,提出了一种新的文本分类方法,即LASVM-NC+tf.rf。实验结果表明,这种方法在LASVM-NC与多种其他特征的结合中性能是最好的,且与SVM+tf.rf相比,不仅所产生的分类器具有泛化能力更强、模型表达更稀疏的优点,而且在处理含噪声的数据时具有更好的鲁棒性,在处理大规模数据时具有快得多的训练速度。 相似文献
3.
利用树大小和树编辑距离的简单函数提出了一种归一化树编辑距离,在权重函数具有度量性质且所有插入和删除操作的权重都相等时,不仅能完全满足三角不等式,而且是一种取值在[0,1]的度量.这种距离可以由树编辑距离直接计算得到,其计算时间复杂度与树编辑距离相同.通过手写数字识别实验说明,AESA算法利用该距离获得的识别率为91.6%,比其他2种归一化树编辑距离分别高0.2%和0.8%. 相似文献
4.
在机器翻译系统中,模板可以作为一种知识表示的方法,其规模的大小和组织的策略将极大地影响系统的整体性能.本文对英汉翻译模板的标准化问题进行了探讨,提出了一个初步方案,并将其应用于英汉翻译系统的设计与实现中,取得了初步的成功,验证了该方案的可行性,从而为在大规模模板库的基础上开发高质量的英汉翻译系统提供了可能性.在2005年举行的863评测中,本文开发的英汉翻译系统达到的水平对话翻译人工评测忠实度和流利度分别为73.62和68.16,篇章翻译人工评测忠实度和流利度分别为41.16和31.45. 相似文献
5.
初始化卷积神经网络的主成分洗牌方法 总被引:1,自引:0,他引:1
为了更好地初始化卷积神经网络,提出了一种初始化卷积核的有效方法,称为主成分洗牌方法.该方法首先对第1个卷积层的每个输入特征图的所有感受野进行采样,再对采样得到的图像块按输入特征图分别进行主成分分析,利用主成分分析得到的投影矩阵初始化该层卷积核,最后按上述过程依次对各层卷积核进行初始化.使用该方法在MNIST与CIFAR-10数据集上进行卷积层初始化实验.实验结果表明:与目前常用的随机初始化算法、Xavier初始化算法相比,该方法在提高网络的训练速度和测试集正确率方面均具有优越性. 相似文献
6.
基于正交Haar变换(orthogonal Haar transform,OHT)的模板匹配算法在处理二维图像时采用条形和来替代积分图,从而获得了较高的运行效率,但它要求模板必须是标准大小的,即模板的高和宽必须相等且为2的幂次.为解决OHT算法的这一问题,提出了另一种基于拟Haar变换(quasi Haar transform,QHT)的模板匹配算法,它使用树分解策略来加速非标准模板时的匹配处理.QHT算法不仅能处理非标准模板的情况,也同样能处理标准模板的情况.在标准模板情况下,实验结果表明,QHT算法在低噪声等级时比OHT算法拥有更快的运行速度. 相似文献
7.
在文本分类中,最近邻搜索算法具有思想简单、准确率高等优点,但通常在分类过程中的计算量较大。为克服这一不足,提出了一种基于最近邻子空间搜索的两类文本分类方法。首先提取每一类样本向量组的特征子空间,并通过映射将子空间变换为高维空间中的点,然后把最近邻子空间搜索转化为最近邻搜索完成分类过程。在Reuters-21578数据集上的实验表明,该方法能够有效提高文本分类的性能,具有较高的准确率、召回率和F1值。 相似文献
8.
针对传统学习图匹配在抗形变和抗噪声方面性能不够稳定的问题,提出一种有监督的逐次非凸凹过程学习图匹配方法.首先通过逐次非凸凹过程(GNCCP)求解一系列二次分配问题以估计训练目标函数的上界,并采用Bundle方法对上界进行优化,完成图匹配模型的训练;其次,使用GNCCP对图匹配模型进行求解,获得匹配结果.在CMU的House/Hotel数据集以及3个具有旋转、切变和加噪的人工合成数据集上的实验结果表明,文中方法可以大幅提升匹配精度,甚至达到零错误率;在WILLOW数据集上,结合形状上下文边特征描述,也得到了令人满意的效果. 相似文献
9.
李玉鑑 《北京工业大学学报》2007,33(3):331-336
为了简单有效地对数据集进行结构分析,提出了一种基于最小树进行聚类的算法(MSTCA).其基本思想是在最小树中切割所有大于一定阈值的边,对数据集进行子类划分,同时对较小的子类进行合并.MSTCA产生的聚类结果在不考虑子类次序时是唯一的。对它的递归调用还可在若干不同粒度层次上形成数据集的聚类结构.计算实验表明,MSTCA不仅能为具有各种不同聚类形状的数据集自适应地选择较好的聚类个数,而且只需简单的参数选择就能准确地分析出数据中存在的合理聚类和例外样本. 相似文献
10.
不加权算术平均组对方法的改进及应用 总被引:2,自引:0,他引:2
为了解决传统不加权算术平均组对方法(unweighted pair group method with arithmetic mean,简称UPG- MA)存在的"tie trees"问题,通过改进UPGMA,提出了不加权算术平均组群方法(unweighted multiple group method with arithmetic mean,简称UMGMA),从理论和应用上证明了UMGMA能产生唯一的进化树,并且在UPGMA树唯一时,UMGMA树和UPGMA树在不计分支次序时完全相同,解决了UPGMA树的唯一性问题.与UPGMA不同之处在于,UMGMA反复利用极大紧邻子树上的顶点把多个距离最近的种群进行合并,因此在UPGMA产生的二叉树不唯一时,UMGMA能产生一棵具有唯一拓扑结构的多叉树.通过适当选择大于0的容差参数,UMGMA还可以在不同的宏观层次上产生容差进化树,以突出物种较多时进化树的整体脉络. 相似文献