首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
微博由于字数的限制,当用户需要发较多内容时通常以附图的形式给出,识别包含文本内容贴图的长微博能够为微博研究提供更多有用的数据.在支持向量机(SVM)的基础上结合粒子群算法(PSO)提出了一种识别长微博贴图的PSO-SVM算法.该方法提取长微博贴图的颜色矩和灰度共生矩阵特征,然后利用PSO算法对SVM模型中的误差惩罚参数和核函数进行优化得到最佳分类模型,其最优参数将被用作长微博贴图和非长微博贴图进行分类.实验表明,与传统的基于网格搜索法优化的SVM算法相比,PSO-SVM算法对长微博贴图识别具有更高的准确率和召回率.  相似文献   

2.
提出一种基于文本分类技术的评审专家自动推荐模型,通过文本分类技术对评审专家所发表的论文进行所属学科领域的分类,进而判断出评审专家的主要研究领域。模型采用了基于TF/IDF特征权重阈值的向量空间模型算法和改进后的ATSVM分类算法。实验结果表明,改进后的ATSVM分类算法可以增加交互的过程使训练得到的分类器具备自学习的能力,改进后的主动学习SVM分类器在多类别的分类上能够精确分类并且提高分类速度。  相似文献   

3.
魏博识    卢涛   《武汉工程大学学报》2021,43(4):455-461
针对现有数值型作物推荐算法忽略了文本域数据对于作物推荐的指导性意义,无法挖掘数值域数据与文本域数据之间的内在关联,导致推荐模型预测精度较低的问题,提出了一种基于土壤数据广度与深度模型的作物推荐算法。对残缺、重复、不平衡的土壤数据进行数据预处理,采用数值归一化和向量嵌入的方法融合数值域数据与文本域数据,然后使用广度与深度模型联合训练的方法挖掘其内在关联,改进多分类激活函数实现多分类。实验结果表明:该方法的预测精度优于现有数值型作物推荐算法。  相似文献   

4.
为解决地板块纹理分类难度大的问题,提出了一种基于Kmeans-GMM模型的地板块纹理分类方法.在阐述混合高斯模型GMM及参数估计算法原理的基础上,采用灰度共生矩阵提取地板块纹理特征,结合Kmeans算法,通过训练得到各类纹理所对应的混合高斯模型GMM的参数,实现对地板块纹理分类.实验结果表明该方法辨识准确率高、识别速度快,优于传统的神经网络分类法以及SVM算法,为地板块纹理分类的研究提供了一个新的思路.  相似文献   

5.
一种用于多分类问题的改进支持向量机   总被引:14,自引:3,他引:14  
针对非均衡分布的多类分类问题,为提高支持向量机(SVM)算法的性能,提出了一种改进的SVM算法. 将遗传算法(GA)与传统SVM算法结合,构造出一种参数最优的进化SVM(GA-SVM), SVM模型采用径向基函数(RBF)作为核函数,利用格雷码编码方式对SVM算法的模型参数进行遗传编码和优化搜索,将搜索到的优化结果作为SVM的最终模型参数. 在两个不同特性的数据集上进行仿真测试,结果表明,与使用交叉验证策略的简单SVM相比,改进后的GA-SVM算法在多类非均衡问题上明显提高了分类正确率,学习速度也有提高.  相似文献   

6.
为了提高支持向量机(SVM)在多类分类中的分类效果,提出了一种基于改进粒子群优化(IMPSO)算法和协作式递归神经网络(CRNN)的多类SVM分类方法(IMPSO_CRNN_SVM算法).首先引入自适应惯性权重及自适应粒子变异,以此改进粒子群优化算法(PSO)在优化SVM参数过程中存在的容易陷入局部最优和早熟等问题; 然后基于多类SVM设计一个CRNN,并利用随机分配的训练集对该网络进行训练并构建最终决策函数,从而实现多类数据的“一次性”分类.最后利用3种数据集和实际应用对IMPSO_CRNN_SVM算法进行验证,结果表明IMPSO_CRNN_SVM算法的分类精度优于未进行参数优化的传统SVM算法、基本PSO 进行SVM参数优化的算法和未进行PSO参数优化的基于CRNN的多类支持向量机算法,因此IMPSO_CRNN_SVM算法具有一定的实用性.  相似文献   

7.
LBP-自适应增强模型的木材纹理分类   总被引:1,自引:0,他引:1  
针对传统木材纹理分类的准确率低且难度大的问题,依据LBP(局部二值)算子和ADABOOST(自适应增强)算法理论,提出了LBP-ADABOOST模型对木材纹理进行识别分类.通过均匀旋转不变特性与原始LBP算子相融合,提取纹理的特征值,结合自适应增强算法,从而训练得到每类纹理所对应的分类器模型参数,构造分类器,实现对木材纹理准确高效分类.实验结果表明相比于BP神经网络,SVM支持向量机等分类算法,该模型的实验结果误差率为4%左右,准确率高,实用性强.  相似文献   

8.
基于遗传算法(GA)优化支持向量机(SVM)分类模型能够显著改善传统SVM的分类精度。以山东大枣、新疆灰枣、新郑大枣以及稷山板枣4类品种的干制红枣为研究对象,首先采用简单线性迭代聚类算法(SLIC)对预处理后的红枣图像进行分割处理;接着针对每类红枣,提取了其6个颜色特征和20个不同角度的纹理特征等26个参数;最后将以上参数输入基于GA优化的SVM分类模型(GA-SVM)。实验结果表明:与传统SVM算法相比,GA-SVM算法对红枣的分类准确率提升了20. 00%。  相似文献   

9.
在文本分类中,应用支持向量机(SVM)算法能使分类在小样本的条件下具有良好的泛化能力,但支持向量机的参数取值决定了其学习性能和泛化能力.为提高支持向量机算法的性能,提出了一种支持向量机优化算法E-SM,引入信息熵来表征惩罚系数C,提出了加权系数,算法实现了SVM训练过程中参数的智能化,减少了对支持向量机参数选择的盲目性,减少了部分训练样本集数目,提高了SVM性能.实验表明,E-SVM算法较传统算法具有更好的分类精度和时间效率.  相似文献   

10.
随着互联网的发展,网上购物成为主流消费方式,随之产生了大量的商品文本数据,需要对商品进行准确而高效的分类。利用机器学习进行文本分类需要进行复杂的人工设计特征和提取特征过程。随着深度学习领域的发展,基于深度学习的文本分类技术效果显著。设计了一个基于长短期记忆网络(LSTM)的中文文本多分类器。首先对数据进行预处理,利用Tokenizer分词技术将文本处理为计算机可理解的词向量传入LSTM网络,并加入Dropout算法以防止过拟合得出最终的分类模型。将该模型与逻辑回归、多项式朴素贝叶斯、线性支持向量机、随机森林模型进行对比发现,基于LSTM的中文文本多分类方法具有较好的效果。  相似文献   

11.
为快速准确地提取和挖掘信息系统运维服务过程中的关键咨询问题,本文利用分布式技术,基于Hadoop的客服运维文本聚类算法,对海量文本数据进行聚类研究。给出了基于Hadoop的运维数据分布式并行计算模型,并在Hadoop框架中对系统中所有运维数据进行分析处理。同时,给出了分布式文本聚类算法,并以10万余条电力信息系统运维数据为数据源,对设计的分布式聚类算法和传统聚类算法进行分析对比。实验结果表明,本文设计的分布式聚类算法所需时间低于传统聚类算法,不仅解决了传统聚类算法在处理海量数据方面由于数据规模过大引起的速度慢、效率低的问题,而且还借助大数据中蕴含的价值和动力,提升了企业运维服务水平。该研究具有较高的实用价值和理论意义。  相似文献   

12.
根据RSS/XML文本格式的博客信息特点,进行了文本解析、中文分词和索引建立,以及基于PageRank算法的搜索排序等研究工作,利用Heritrix爬虫、Lucene全文索引检索工具包开发了RSS博客搜索引擎,并将系统实际应用于Android系统的手机终端。实验证明,该系统能实时、高效的在手机终端进行博客搜索,使用户获得优于传统博客检索的体验。  相似文献   

13.
突发事件类别众多,若采用传统的平面文本分类方法对突发事件分类,模型训练所需计算量剧增,并且对测试文本分类时要和全部分类器进行比较,导致极大的时间开销。根据突发事件类别体系结构层次性特点,提出了一种基于领域特征词的突发事件层次分类方法,将领域特征词自动提取算法用于特征选择,并在每个分类平面上采用改进的基于二叉树的SVM多类分类算法构建分类器。实验证明,基于领域特征词提取算法的特征选择方法优于传统方法,采用层次分类方法对突发事件分类,降低了时间复杂度,同时改善了分类效果,有效降低了错误分类的风险。  相似文献   

14.
为了提高数据的分类效率和准确度,利用云计算提供的弹性集群平台来解决计算力伸缩性瓶颈,并用MapReduce编程模型对SVM进行Map和Reduce并行化处理,并将基于优化理论的遗传算法( GA)引入SVM分类算法中对分类器参数进行优化,以分类器的准确率作为GA算法适应度函数,找出全局最优的模型参数和核函数参数值。经开源云计算平台Hadoop实验验证,数据分类的准确度有了明显的提高,整个分类过程的加速度几近呈线性增加。  相似文献   

15.
提出一种基于特征金字塔(FPN)结构的快速卷积神经网络(F-Faster-RCNN)的摔倒检测模型,采用F-Faster-RCNN目标检测网络结合多目标跟踪算法Deepsort实现运动目标跟踪;采用3D卷积神经网络和支持向量机(SVM)分类算法实现老人摔倒行为的判别。F-Faster-RCNN算法以残差网络为主干网络,加深了网络层次;以FPN结构逐层提取特征,实现深浅层特征的融合;结合遗传算法改进SVM的参数调优过程,避免了局部最优解。经仿真验证,基于F-Faster-RCNN目标检测模型损失率可降低到2.2%,摔倒检测平均准确率达到84.4%。  相似文献   

16.
提出了一种加权的基于LDA(Latent Dirichlet Allocation)的协同过滤算法,通过对传统协同过滤算法优缺点的分析,联合打分数据和评论数据的特征进行推荐。该算法主要研究用户评论文本的特点,通过LDA主题模型对评论文本集合进行主题提取,使用相对熵的方法计算相似度,在此基础上,研究用户评分对于每条评论文本的影响,联合LDA进行评分预测及推荐。实验结果表明,该算法能够显著提高推荐准确度。  相似文献   

17.
针对传统支持向量机(SVM)在数据分类方面准确率识别较低的问题,提出了一种改进鲸鱼优化算法同步优化SVM的特征选择模型。首先,利用Levy飞行策略对鲸鱼优化算法的螺旋更新位置进行变异扰动,利用单纯形策略中的反射操作对种群中的精英个体进行反射点求解的改进,标准函数的测试结果证明其改进能有效提高算法的收敛速度和计算精度;其次,将SVM核参数和特征选择目标作为共同优化对象,在获得最优核参数的同时得到相对应的最优特征子集;最后,对UCI标准数据集和真实乳腺癌数据集进行特征选择仿真实验,在平均分类准确率、平均适应度值、适应度标准差和所选特征个数上进行评价。结果表明,本文算法在降低特征维度,实现数据分类上效果明显。在真实乳腺癌数据集上的分类精度与传统支持向量机相比提高了11.053%。  相似文献   

18.
为了使出版机构能够及时从大量网页中发现所需文献,需要设计能够从超文本标记语言页面中自动提取文献信息的算法.为此,设计了基于条件随机场的文献记录分析算法:首先,设计了文档对象树的分割算法,通过分割标记将页面数据分成独立的部分,这些数据块由标签和文本序列构成;随后,将该序列作为条件随机场模型的特征向量,建立文献信息标记模型;最后,设计启发式算法,从标记模型中提取文献信息数据,并通过实验验证了其有效性.  相似文献   

19.
首先利用(Local Configuration Pattern, LCP)算法提取指静脉的纹理特征作为深度信念网络(Deep Belief Network, DBN)的输入,并通过逐层训练网络不断调整参数使网络达到最优化,从而实现对指静脉图像的最优分类。将本算法与BP分类算法、SVM分类算法及KNN分类算法进行了比较。  相似文献   

20.
RSS广告是最近出现的一种新型网络广告形式.针对RSS广告的个性化推荐,对个性化网络广告系统进行了探讨,提出了一种基于RSS的个性化网络广告推荐系统,并对系统的主要功能模块,包括数据预处理模块、文本挖掘模块、用户行为挖掘模块和智能推荐模块进行了分析与探讨,使RSS广告的个性化表示成为可能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号