期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王和勇樊泓坤姚正安李成安《计算机应用研究》2008,25(5):1301-1303

传统的分类算法在处理不平衡数据分类问题时会倾向于多数类,而导致少数类的分类精度较低。针对不平衡数据的分类,首先介绍了现有不平衡数据分类的性能评价;然后介绍了现有常用的基于数据采样的方法及现有的分类方法;最后介绍了基于数据采样和分类方法结合的综合方法。相似文献

2.

基于数据源向图的数据项的表示与获取方法

下载免费PDF全文

陈冰川吴向军王和勇李磊《电子学报》2012,40(11):2239-2246

如何清晰的表示数据项之间的关系,进而了解数据之间更深层的内在关系,在当前的需求分析中没有明确的方法,但是其对于软件需求中数据的获取和数据关系的表示具有重要作用.如何通过数据本身采用推导的方法获取软件系统所必须的数据以及数据项,在当前的需求分析和获取方法中也没有直接方法和思路.本文采用数据源向图的方法,通过推导的方法获取必要的数据和数据项,并通过它来表示数据中各个数据项之间的关系,使得数据项之间关系的表示更加清晰,数据项的获取更加容易. 相似文献

3.

基于聚类的核主成分分析在特征提取中的应用 总被引：10，自引：1，他引：9

王和勇姚正安李磊《计算机科学》2005,32(4):64-66

本文分析了一般主成分分析在处理非线性问题上的不足,阐述了核主成分分析方法及其计算速度的缺陷,提出了基于聚类的核主成分分析方法。试验结果显示:基于聚类的核主成分分析方法具有好的特征提取性能,相比核主成分分析大大提高了特征提取的速度。相似文献

4.

SMOTE和Biased-SVM相结合的不平衡数据分类方法 总被引：3，自引：0，他引：3

王和勇樊泓坤姚正安《计算机科学》2008,35(5):174-176

针时不平衡数据集的分类问题,本文利用支持向量机推广能力强的优良特性,提出了SMOTE(Synthetic Minority Over-sampling Technique,SMOTE)和Biased-SVM(Biased SuIpport Vector Machine,Biased-SVM)相结合的方法.该方法首先对原始数据使用Biased-SVM方法,然后对求出的支持向量使用SMOTE向上采样方法进行采样,最后再使用Biased-SVM方法进行分类.实验结果表明,本文采用的SMOTE和Biased-SVM相结合的方法可提高不平衡数据集分类精度. 相似文献

5.

基于聚类和改进距离的LLE方法在数据降维中的应用 总被引：1，自引：1，他引：1

王和勇郑杰姚正安李磊《计算机研究与发展》2006,43(8):1485-1490

局部线性嵌入算法(locally linear embedding, LLE)是解决降维的方法,针对LLE计算速度和近邻点个数K的选取,研究了该方法的扩展,提出了基于聚类和改进距离的LLE方法.基于聚类LLE方法大大缩减了计算LLE方法的时间;改进距离的LLE方法在近邻点个数取值比较小时的情况下,可得到良好的效果,而原始的LLE方法要达到相同的效果,近邻点个数K的取值通常要大很多.同时,改进距离的LLE方法可以模糊近邻点个数选取.实验结果表明,基于聚类和改进距离相结合的LLE方法相比原来的LLE方法大大提高了降维速度和扩大了参数K的选取. 相似文献

6.

基于加速度趋势比较的异常数据清洗研究

王和勇吕威陈冰川《计算机应用与软件》2010,27(8)

针对数据集成过程中存在异常数据的问题,提出了加速度趋势比较清洗方法,即比较数据集成过程中某些字段的变化趋势来发现数据的异常.通过加速度趋势比较清洗,提高了数据集成的异常记录检测,改变了数据集成过程中的数据质量,增强了数据的可利用性.最后给出了具体算法的描述. 相似文献

7.

综合利用纹理和中心特征的图像检索

王和勇姚正安李磊《计算机应用与软件》2004,21(7):80-81

基于特征的图像检索在多媒体数据库管理和多媒体通信传输中得到越来越多的重视。本文介绍了基于纹理特征的特征提取方法和中心特征的提取方法,并进而提出了一种综合利用上述两个特征共同进行检索的方法。对真实图像库的检索实验表明,综合特征检索比单一特征检索更符合人的视觉特性,检索效果更好。相似文献

8.

基于纹理的图像检索 总被引：3，自引：1，他引：3

王和勇李磊姚正安《计算机应用研究》2002,19(10):82-83

基于特征的图像检索在多媒体数据库管理和多媒体通信传输中得到越来越多的重视。介绍了基于纹理特征的特征提取方法 ,并对提取出的特征进行维数缩减。对真实图像库的检索实验表明 ,用此方法检索出的图像更符合人的视觉特性。相似文献

9.

改进嵌入维数和时间延迟计算的GP预测算法 总被引：1，自引：0，他引：1

吕威王和勇姚正安李磊《计算机科学》2009,36(5):187-190

改进了混沌系统中的两个重要特征量:嵌入维数和时间延迟的计算,根据计算得出的上述两个参数重构相空间;然后在相空间中作轨迹的线性拟合,选择轨迹中的最近邻点作一次性的预测.提出的算法在相空间中很好地把轨迹的线性拟合与最近邻方法结合起来,解决了现有的时间序列分析和预测算法中主观性太强的缺点,通过对话务量时间序列和太阳黑子时间序列的验证,与其它算法相比,该算法的分析结果稳定而准确、预测精度高、运行时间比较短. 相似文献

10.

权重润饰和改进的分类对不平衡数据的处理 总被引：1，自引：0，他引：1

王和勇《计算机应用与软件》2009,26(8):144-146,161

不平衡数据集是指某类样本数量明显少于其它类样本数量的数据集,传统的分类算法在处理不平衡数据分类问题时会倾向于多数类,而导致少数类的分类精度较低.针对文本数据的不平衡情况,首先采用权重润饰(Weight-retouching)的方法进行特征提取,然后采用欠取样(Under sampling)的支持向量机SVM(Support Vector Machine)方法进行文本分类.通过实验发现,使用权重润饰和欠取样的SVM方法可以提高处理不平衡数据的分类精度. 相似文献