共查询到16条相似文献,搜索用时 609 毫秒
1.
不良文本识别的实际应用中,大多数文本之间总有交界甚至彼此掺杂,这种非线性不可分问题给不良文本识别带来了难度。应用 SVM 通过非线性变换可以使原空间转化为某个高维空间中的线性问题,而选择合适的核函数是 SVM 的关键。由于单核无法兼顾对独立的不良词汇和词汇组合的识别,使识别准确率不高,而且也无法兼顾召回率。针对不良文本识别的特定应用,依据 Mercer 定理结合线性核与多项式核提出了一种新的组合核函数,这种组合核函数能兼顾线性核与多项式核的优势,能够实现对独立的不良词汇以及词汇组合进行识别。在仿真实验中评估了线性核、齐次多项式核以及组合核函数,实验结果表明组合核函数的识别准确率与召回率都比较理想。 相似文献
2.
3.
4.
面向特定领域文本分类的实际应用,存在大量样本相互掺杂的现象,使其无法线性表述,在SVM中引入核函数可以有效地解决非线性分类的问题,而选择不同的核函数可以构造不同的SVM,其识别性能也不同,因此,选择合适的核函数及其参数优化成为SVM的关键.本文基于单核核函数的性质,对多项式核函数与径向基核函数进行线性加权,构建具有良好的泛化能力与良好的学习能力的组合核函数.仿真实验结果表明,在选择正确参数的情况下,组合核函数SVM的宏平均准确率、宏平均召回率及宏平均综合分类率都明显优于线性核、多项式核与径向基核,而且能够兼顾准确率与召回率. 相似文献
5.
核函数是支持向量机(SVM)的重要部分,它直接影响到SVM的各项性能。当前SVM在金融时间序列分析中,基本上采用高斯径向核函数(RBF),其次才是多项式核函数。然而,每种核函数都有它的优势和不足,整合两个或多个核函数对于学习能力和泛化能力的提高是一个有效的途径。采用高斯径向核函数与多项式核函数的混合核函数运用于金融时间序列预测中,且与其单个核函数的支持向量机的实验结果进行了比较。结果表明,混合核函数具有更好的性能。 相似文献
6.
地铁中站点客流量为地铁运营调度部门提供实时调度管理依据。将径向基核函数与多项式核函数线性组合,构建了混合核支持向量回归机(SVM)预测模型。采用基于黄金分割的混沌粒子群(GCPSO)对混合核SVM的参数进行寻优,得到最佳的参数组合。利用该混合核SVM预测广州地铁3号线站点短期客流量。结果表明,GCPSO优化的混合核SVM预测模型对地铁站点的短期客流的预测精度高,预测数据和实测数据拟合良好,相对误差较小,明显优于SVM其他三种预测方法及Elman神经网络预测方法。 相似文献
7.
崔炳德 《计算机工程与应用》2011,47(27):189-191
SVM分类器核函数的选择以及参数的设置直接影响系统的泛化能力和运行速度。引入交叉验证技术和栅格搜索技术,对径向基核、多项式核和Sigmoid核函数应用于图像多类别分类的性能进行理论推导、测试及分析,求得三种核函数应用于SVM分类器的性能,并证明了栅格搜索寻找最优参数的有效性。最后通过对TM 6波段BSQ格式遥感图像进行分类对比证明了SVM分类器核函数用于TM图像分类的可行性及高效性。 相似文献
8.
标准的SVM分类计算过程中有大量的支持向量参与了计算,导致了分类速度缓慢。该文为提高SVM的分类速度,提出了一种快速的多项式核函数SVM分类算法,即将使用多项式核的SVM分类决策函数展开为关于待分类向量各分量的多项式,分类时通过计算各个多项式的值而得到分类结果,使分类计算量和支持向量数量无关,又保留了全部支持向量的信息。当多项式核函数的阶数或待分类向量的维数较低而支持向量数量较多时,使用该算法可以使SVM 分类的速度得到极大的提高。针对实际数据集的实验表明了该算法的有效性。 相似文献
9.
10.
本文在传统的支持向量机(SVM)分类算法中采用核主成分分析(KPCA)对网络数据进行特征抽取,将高维输入特征转化为新的低维特征;并对SVM的核函数进行改进,采用多项式核函数和径向基核函数混合的组合核函数,具有良好的学习能力和外推能力。最后在KDDCUP1999数据集上进行实验,证明了本文方法能够有效的减少学习样本数及训练时间,在网络危险因素识别中具有更高的检测率和更强的泛化能力。 相似文献
11.
The kernel function method in support vector machine (SVM) is an excellent tool for nonlinear classification. How to design a
kernel function is difficult for an SVM nonlinear classification problem, even for the polynomial kernel function. In this paper,
we propose a new kind of polynomial kernel functions, called semi-tensor product kernel (STP-kernel), for an SVM nonlinear
classification problem by semi-tensor product of matrix (STP) theory. We have shown the existence of the STP-kernel function
and verified that it is just a polynomial kernel. In addition, we have shown the existence of the reproducing kernel Hilbert
space (RKHS) associated with the STP-kernel function. Compared to the existing methods, it is much easier to construct the
nonlinear feature mapping for an SVM nonlinear classification problem via an STP operator. 相似文献
12.
Nicola Ancona Author Vitae Rosalia Maglietta Author VitaeAuthor Vitae 《Pattern recognition》2006,39(9):1588-1603
This paper focuses on the problem of how data representation influences the generalization error of kernel based learning machines like support vector machines (SVM) for classification. Frame theory provides a well founded mathematical framework for representing data in many different ways. We analyze the effects of sparse and dense data representations on the generalization error of such learning machines measured by using leave-one-out error given a finite amount of training data. We show that, in the case of sparse data representations, the generalization error of an SVM trained by using polynomial or Gaussian kernel functions is equal to the one of a linear SVM. This is equivalent to saying that the capacity of separating points of functions belonging to hypothesis spaces induced by polynomial or Gaussian kernel functions reduces to the capacity of a separating hyperplane in the input space. Moreover, we show that, in general, sparse data representations increase or leave unchanged the generalization error of kernel based methods. Dense data representations, on the contrary, reduce the generalization error in the case of very large frames. We use two different schemes for representing data in overcomplete systems of Haar and Gabor functions, and measure SVM generalization error on benchmarked data sets. 相似文献
13.
14.
15.
针对说话人识别实际应用中训练数据不足的问题,选取GMM-UBM作为基准系统模型,用EigenVoice对其作自适应,应用泛化能力较强的多项式核函数和学习能力较强的径向基核函数进行线性加权组合后的组合核函数进行模型参数优化,并用多重网格搜索法确定核函数的最优参数,采用DAG方法实现SVM核函数的多元分类.在仿真实验中评估了线性核、多项式核、径向基核以及组合核函数,实验结果表明,在采用正确的参数前提下,在不同的多分类策略、自适应时间、信噪比和不同的说话人数量的情况下,组合核函数的识别性能明显都优于其它三个单核函数. 相似文献
16.
一种具有普适性的功放线性化预失真方案 总被引:1,自引:1,他引:0
为解决功率放大器的非线性问题,提高功放效率,提出了一种能够应用于多种类型功放的间接结构多项式数字基带预失真方案。采取间接预失真结构规避了功放的辨识过程,选择记忆多项式模型作为预失真器能够线性化多种类型的功放,同时采用改进的抑制牛顿算法减少了参数的迭代次数和运算量。以64QAM信号作为输入,对几种典型的功放模型进行数字预失真处理,通过MATLAB仿真分析预失真前后信号的功率谱变化以及ACPR值的改变,表明该方案能够取得比较理想的预失真效果,同时证明了此预失真方案具有一定的普适性。 相似文献