共查询到18条相似文献,搜索用时 140 毫秒
1.
2.
针对文本自动分类问题,提出了一种基于模糊向量空间模型和径向基函数网络的分类方法.网络由输入层、隐层和输出层组成.输入层完成分类样本的输入,隐层提取输入样本所隐含的模式特征,将分类结果在输出层表现出来.该方法在特征提取时充分考虑了特征项在文档中的位置信息,构造出模糊特征向量,使自动分类更接近手工分类方法.以中国期刊网全文数据库部分文档数据为例验证了该方法的有效性. 相似文献
3.
开放网络环境下存在大量的信息文档,如何判断文档内容的可信性、安全性一直是一个值得深入研究的问题。论文研究了可信文本分类的方法,收集了体现文本可信性的点滴素材,建立了文本的信任特征向量,并结合已有的特征选择方法,实现了一个基于向量空间模型的文本可信性分类算法,实验表明该方法具有较好的分类效果。 相似文献
4.
5.
针对文本自动分类问题,提出一种基于概率型神经网络(PNN)和学习矢量量化(LVQ)相结合的文本分类算法,该方法借助TFIDF方法提取文本特征及特征值,形成文本分类特征向量,利用概率型神经网络构建分类模型,并利用LVQ学习算法对神经网络模型竞争层网络进行学习,使相应模式向量相互靠拢,远离其他模式,从而实现文本分类.实验结果表明,提出的该方法在文本分类中表现了很好的效果,不仅具有很好的分类准确率,还表现出很好的学习效率. 相似文献
6.
7.
退化交通标志图像的RBPNN分类算法研究 总被引:1,自引:0,他引:1
为了识别退化的交通标志图像,采用模糊-仿射联合不变矩直接提取图像的特征,并针对各阶模糊-仿射联合不变矩数量级差异较大问题,提出一种数量级标准化算法,避免了需要较大计算量的图像复原处理过程。同时在深入研究径向基概率神经网络的基础上,采用全局K-均值算法优化其网络结构,并将其用于交通标志图像的分类识别。仿真结果表明,模糊-仿射联合不变矩是一种有效的处理退化交通标志图像的方法,所设计的径向基概率神经网络分类器不仅具有精简的结构而且有较好分类精度和推广性能。 相似文献
8.
训练集中文本质量的好坏直接决定着文本分类的结果。实际应用中训练集的构建不可避免地会产生噪声样本,从而影响文本分类方法的实际应用效果。为此,针对文本分类中的噪声问题,本文提出一种基于概率主题模型的噪声处理方法,首先对训练集中的每个样本计算其类别熵,根据类别熵对噪声样本进行过滤;然后利用主题模型进行数据平滑,进一步减弱噪声样本的影响。这种方法不但能够减弱噪声样本对分类结果的影响,同时还保持了训练集的原有规模。在真实数据上的实验表明,该方法对噪声样本的分布具有较好的鲁棒性,在噪声比例较大的情况下仍能保持较好的分类结果。 相似文献
9.
10.
提出一种基于非负矩阵分解(NMF)和径向基概率神经网络的掌纹识别方法。NFM是一种有效的图像局部特征提取算法,用于图像分类时能得到较高的识别率。考虑PolyU掌纹图像数据库,应用NMF、局部NMF(LNMF)、稀疏NMF(SNMF)和具有稀疏度约束的NMF(NMFSC)算法分别对掌纹图像进行特征提取,并对提取到的局部特征基图像进行分析对比;在特征提取的基础上,应用径向基概率神经网络(RBPNN)模型对掌纹特征进行分类,分类结果表明了RBPNN模型对掌纹特征具有较好的识别能力。实验对比结果证明了基于RBPNN的NMF掌纹识别方法在掌纹识别中的有效性,具有一定的理论研究意义和实用性。 相似文献
11.
基于向量空间模型的贝叶斯文本分类方法 总被引:2,自引:0,他引:2
提出基于向量空间模型的贝叶斯文本分类方法。首先提取出文本训练集的特征词,建立特征向量空间模型。然后采用贝叶斯文本分类方法对未知类别文档进行分类。给出了贝叶斯文本分类方法过程的详细描述和文本分类的一个测试实例。 相似文献
12.
13.
14.
特征选择在文本分类中是非常必要的,这是由于它可以使分类更加有效与准确。本文根据特征选择方法χ2统计方法的不足,对χ2统计进行改进,并在支持向量机分类算法上进行实验。实验结果表明改进的方法可以提高分类的准确度。 相似文献
15.
16.
17.
基于加权词向量和卷积神经网络的新闻文本分类 总被引:1,自引:0,他引:1
在文本分类中,基于Word2Vec词向量的文本表示忽略了词语区分文本的能力,设计了一种用TF-IDF加权词向量的卷积神经网络(CNN)文本分类方法.新闻文本分类,一般只考虑正文,忽略标题的重要性,改进了TFIDF计算方法,兼顾了新闻标题和正文.实验表明,基于加权词向量和CNN的新闻文本分类方法比逻辑回归分类效果有较大提高,比不加权方法也有一定的提高. 相似文献