共查询到20条相似文献,搜索用时 109 毫秒
1.
对文本分类中降维技术、提高分类精度和效率的方法进行了研究,提出了一种基于矩阵投影运算的新型文本分类算法——Matrix Projection(MP)分类算法。矩阵运算将训练样例中表示文本特征的三维空间投影到二维空间上,得到归一化向量,有效地达到了降维与精确计算特征项权重的目的。与其他多种文本分类算法对比实验表明,MP算法的分类精度和时间性能都有明显提高,在两套数据集上的宏平均F1值分别达到92.29%和96.03%。 相似文献
2.
3.
4.
5.
针对文本聚类问题中因为维度灾难以及特征信息丢失而导致的聚类效果低效问题,本文提出一种基于特征矩阵优化与改进主成分分析(Principal component analysis,PCA)降维的聚类算法.在原基于文档频率和逆词频(Term frequency inverse document frequency,TF-ID... 相似文献
6.
基于标签的推荐算法已成为研究热点,现有相关研究集中在利用标签改进协同过滤推荐算法和基于内容的推荐算法,鲜有研究把标签引入更先进的矩阵分解推荐算法。而现有矩阵分解推荐算法大多使用商品类别作为因子向量对用户偏好和商品特征建模,限制了其精度的提升。本文使用标签构建因子向量,提出一种新的基于标签的矩阵分解推荐算法。经过真实数据检测,本文提出的推荐算法较以往基于类别的矩阵分解算法在精度上有了显著提升。 相似文献
7.
在文本分类中,特征空间维数通常高达几万,甚至远远超出训练样本的个数,这是一种十分普遍的现象。为了提高文本挖掘算法的运行速度,降低占用的内存空间,提出了一种基于优化的模拟退火算法的特征选择方法。在该方法中,为避免遗失当前最优解,增加了记忆功能,将当前最好的状态记忆下来,从而使得模拟退火算法成为一种智能化算法;设计了一个自适应温度更新函数,并设置双阈值使得在尽量保持最优性的前提下减少计算量,从而较快地获得较具代表性的特征子集。实验结果表明该方法是有效的。 相似文献
8.
以向量空间模型作为Web文本的表示方法,结合Web文本的结构特征对向量空间模型中的特征选择算法进行了分析并加以改进。在改进的算法中,体现出了特征词在Web文档结构中的位置信息;引入了信息论中熵的概念,用词的熵函数对权值进行调整,从而更加准确地选取有效的特征词。实验验证了改进算法的可行性和有效性。 相似文献
9.
基于向量空间模型的网页文本表示改进算法 总被引:7,自引:0,他引:7
介绍了一种新的文本表示算法,应用在网页文本过滤系统中。比起传统的向量空间模型,这种建立在其上的改进算法有更快的过滤速度和更高的过滤精度。该算法直接从过滤模板的特征集中取出词条,只在网页文本出现该词的地方进行精确处理。根据特征项所在的网页标签,赋予不同的权值系数,以准确定义特征词在文中的重要程度,最后建立该网页的文本表示模型。 相似文献
10.
在推荐系统中,基于矩阵分解的推荐算法是目前的研究热点之一,然而普通矩阵分解算法的推荐精确度偏低,为了改善该问题,以矩阵分解算法中的潜在因子模型(LFM)优化为研究对象,分析LFM中两种基础推荐算法在寻优速率与推荐精度上的不足,然后提出两种改进算法:带冲量的批量学习算法和混合学习算法,最后通过实验数据测试,对比了不同算法的推荐效果,结果证明改进算法的性能更优。 相似文献
11.
本文对一般的工业过程的生产装置操作变量调优进行了简要回顾,结合作者几年来调优工作的实践,提出了综合调优法及相应的调优专家系统.文章着重阐述了知识的分类、获取、表示及综合应用各类知识的调优决策方法,提出了深层知识与浅层知识,统计模型与机理模型协同使用的原则.特别提出了知识矩阵的方法,即把所获得的各类知识都表示成矩阵形式,从而大大简化了调优决策过程.应用作者所设计的自适应调优专家系统,某化工装置在调优试验中取得了显著的实际效果. 相似文献
12.
13.
多偏好向量引导的协同进化算法(PICEA-g)是将目标向量作为偏好,个体支配目标向量的个数作为适应值,以有效降低高维目标空间中非支配解的比例.但PICEA-g所获解集是近似Pareto前沿,而不是决策者真正感兴趣部分的Pareto最优解,导致算法在处理高维优化问题时性能下降和计算资源的浪费.鉴于此,提出一种基于偏好向量引导的高维目标协同进化算法(ASF-PICEA-g):首先,利用ASF扩展函数将进化种群中的参考点映射至目标空间,并将其作为偏好向量引导种群进化的参考方向;然后,利用偏好区域选择策略获取两个临时参考点,进而构建决策者感兴趣区域(ROI),确定随机偏好集产生的上下界范围,通过协同进化机制引导种群朝偏好区域收敛.将ASF-PICEA-g与g-NSGA-II和r-NSGA-II在3-20维的WFG系列和DTLZ系列测试函数上进行仿真实验,实验结果表明:ASFPICEA-g在WFG系列测试函数上表现出了良好的性能,所得解集整体上优于对比算法;在DTLZ系列测试函数上略优于对比算法,尤其在10维以上目标空间,ASF-PICEA-g表现出更好的稳定性,所获解集有较好的收敛性和分布性. 相似文献
14.
为解决支持向量机(SVM)参数在优化过程中存在的局部极值和收敛速度慢的问题,提出一种基于矢量矩免疫算法优化SVM参数的方法.通过将抗体距离与免疫网络原理中浓度调节机制相结合的方式,提高算法的局部搜索能力,通过引入免疫记忆单元加快算法搜索最优参数的速度,优化过程中用SVM的分类精度作为算法的循环条件,实现对不同分类问题SVM参数的自适应调节.最后,利用Matlab7.0软件进行计算机仿真并与遗传算法进行比较,结果表明前者在优化性能上具有一定的优越性,为应用提供了参考. 相似文献
15.
16.
17.
针对粒子群优化算法(PSO)应用于矢量量化时,最优粒子对与其对应维度距离较大的粒子缺乏有效指导问题,提出适用于矢量量化的改进粒子群优化算法(IPSO_VQ).该算法通过建立粒子与榜样粒子的维度映射关系,以基于映射关系的维度学习代替对应维度学习关系,使粒子相关维度间的学习有一定相关性,增强算法局部搜索能力.同时,借鉴广泛学习粒子群优化(CLPSO)算法中的广泛学习思想,并将其应用于基本PSO中的全局最优位置学习部分,通过对多个粒子的广泛学习,增加种群的多样性.实验结果表明该算法有效避免种群早熟收敛,从而使解码恢复图像获得更高的主客观质量. 相似文献
18.
19.
曹志波 《计算机技术与发展》2010,20(8):188-191
通过优化随机早期检测算法来降低网络的丢包率,提高吞吐量和降低延时。用网络仿真软件进行网络仿真:分析随机早期检测算法,找出随机早期检测算法在避免网络拥塞时存在的缺点;针对随机早期检测算法存在的缺点进行优化;将优化的随机早期检测算法在网络仿真软件上实现,在丢包率、吞吐量和延时上与随机早期检测算法进行比较,得到最终的实验结果。特色在于合理设置最大丢包率来控制路由器中的瞬时队列长度,进而实现网络资源的优化。仿真结果表明,相对于随机早期检测算法,改进后的算法能更好地降低网络的丢包率、提高吞吐量和降低延时。 相似文献
20.
由Weiler—Atherton算法思想,提出一种基于向量交点特征的圆(弧)裁剪算法。算法以裁剪边为对象来研究交点的特征,使交点计算变得快速容易;在遍历追踪时,巧妙地将圆弧的起点和终点并入“出”、“入”交点列表,避免了圆(弧)交点的排序运算,不仅快速得到裁剪后的圆弧段,而且极容易地得出完全“取之”和“弃之”的结果;实际应用程序证明该算法具有较强的稳定性和实用性。 相似文献