共查询到20条相似文献,搜索用时 78 毫秒
1.
对文本分类中降维技术、提高分类精度和效率的方法进行了研究,提出了一种基于矩阵投影运算的新型文本分类算法——Matrix Projection(MP)分类算法。矩阵运算将训练样例中表示文本特征的三维空间投影到二维空间上,得到归一化向量,有效地达到了降维与精确计算特征项权重的目的。与其他多种文本分类算法对比实验表明,MP算法的分类精度和时间性能都有明显提高,在两套数据集上的宏平均F1值分别达到92.29%和96.03%。 相似文献
2.
3.
4.
5.
针对文本聚类问题中因为维度灾难以及特征信息丢失而导致的聚类效果低效问题,本文提出一种基于特征矩阵优化与改进主成分分析(Principal component analysis,PCA)降维的聚类算法.在原基于文档频率和逆词频(Term frequency inverse document frequency,TF-ID... 相似文献
6.
基于标签的推荐算法已成为研究热点,现有相关研究集中在利用标签改进协同过滤推荐算法和基于内容的推荐算法,鲜有研究把标签引入更先进的矩阵分解推荐算法。而现有矩阵分解推荐算法大多使用商品类别作为因子向量对用户偏好和商品特征建模,限制了其精度的提升。本文使用标签构建因子向量,提出一种新的基于标签的矩阵分解推荐算法。经过真实数据检测,本文提出的推荐算法较以往基于类别的矩阵分解算法在精度上有了显著提升。 相似文献
7.
在文本分类中,特征空间维数通常高达几万,甚至远远超出训练样本的个数,这是一种十分普遍的现象。为了提高文本挖掘算法的运行速度,降低占用的内存空间,提出了一种基于优化的模拟退火算法的特征选择方法。在该方法中,为避免遗失当前最优解,增加了记忆功能,将当前最好的状态记忆下来,从而使得模拟退火算法成为一种智能化算法;设计了一个自适应温度更新函数,并设置双阈值使得在尽量保持最优性的前提下减少计算量,从而较快地获得较具代表性的特征子集。实验结果表明该方法是有效的。 相似文献
8.
以向量空间模型作为Web文本的表示方法,结合Web文本的结构特征对向量空间模型中的特征选择算法进行了分析并加以改进。在改进的算法中,体现出了特征词在Web文档结构中的位置信息;引入了信息论中熵的概念,用词的熵函数对权值进行调整,从而更加准确地选取有效的特征词。实验验证了改进算法的可行性和有效性。 相似文献
9.
基于向量空间模型的网页文本表示改进算法 总被引:7,自引:0,他引:7
介绍了一种新的文本表示算法,应用在网页文本过滤系统中。比起传统的向量空间模型,这种建立在其上的改进算法有更快的过滤速度和更高的过滤精度。该算法直接从过滤模板的特征集中取出词条,只在网页文本出现该词的地方进行精确处理。根据特征项所在的网页标签,赋予不同的权值系数,以准确定义特征词在文中的重要程度,最后建立该网页的文本表示模型。 相似文献
10.
目前已有蚁群算法优化的特征选择方法,大多采用的是以属性依赖度和信息熵属性重要度作为路径上启发搜索因子,但这类搜索方法在某些决策表中存在算法早熟或搜索到的特征子集包含了冗余特征,从而导致选择精度显著下降。针对此类问题,根据条件属性在分辨矩阵中的占比提出了一种属性重要度的度量方法,以分辨矩阵重要度作为路径上启发因子,设计了一种基于分辨矩阵与蚁群算法优化的特征子集搜索方法。该算法从特征核出发,蚁群依次选择概率大的特征加入特征核集,直至找到最小特征子集算法终止。通过实例验证和UCI数据集实验结果表明,与基于属性依赖度和信息熵属性重要度的特征选择方法相比,在通常情况下,该算法能较小代价找到最小特征子集,并且可以有效减少计算工作量。 相似文献
11.
本文对一般的工业过程的生产装置操作变量调优进行了简要回顾,结合作者几年来调优工作的实践,提出了综合调优法及相应的调优专家系统.文章着重阐述了知识的分类、获取、表示及综合应用各类知识的调优决策方法,提出了深层知识与浅层知识,统计模型与机理模型协同使用的原则.特别提出了知识矩阵的方法,即把所获得的各类知识都表示成矩阵形式,从而大大简化了调优决策过程.应用作者所设计的自适应调优专家系统,某化工装置在调优试验中取得了显著的实际效果. 相似文献
12.
13.
为解决支持向量机(SVM)参数在优化过程中存在的局部极值和收敛速度慢的问题,提出一种基于矢量矩免疫算法优化SVM参数的方法.通过将抗体距离与免疫网络原理中浓度调节机制相结合的方式,提高算法的局部搜索能力,通过引入免疫记忆单元加快算法搜索最优参数的速度,优化过程中用SVM的分类精度作为算法的循环条件,实现对不同分类问题SVM参数的自适应调节.最后,利用Matlab7.0软件进行计算机仿真并与遗传算法进行比较,结果表明前者在优化性能上具有一定的优越性,为应用提供了参考. 相似文献
14.
15.
16.
针对粒子群优化算法(PSO)应用于矢量量化时,最优粒子对与其对应维度距离较大的粒子缺乏有效指导问题,提出适用于矢量量化的改进粒子群优化算法(IPSO_VQ).该算法通过建立粒子与榜样粒子的维度映射关系,以基于映射关系的维度学习代替对应维度学习关系,使粒子相关维度间的学习有一定相关性,增强算法局部搜索能力.同时,借鉴广泛学习粒子群优化(CLPSO)算法中的广泛学习思想,并将其应用于基本PSO中的全局最优位置学习部分,通过对多个粒子的广泛学习,增加种群的多样性.实验结果表明该算法有效避免种群早熟收敛,从而使解码恢复图像获得更高的主客观质量. 相似文献
17.
曹志波 《计算机技术与发展》2010,20(8):188-191
通过优化随机早期检测算法来降低网络的丢包率,提高吞吐量和降低延时。用网络仿真软件进行网络仿真:分析随机早期检测算法,找出随机早期检测算法在避免网络拥塞时存在的缺点;针对随机早期检测算法存在的缺点进行优化;将优化的随机早期检测算法在网络仿真软件上实现,在丢包率、吞吐量和延时上与随机早期检测算法进行比较,得到最终的实验结果。特色在于合理设置最大丢包率来控制路由器中的瞬时队列长度,进而实现网络资源的优化。仿真结果表明,相对于随机早期检测算法,改进后的算法能更好地降低网络的丢包率、提高吞吐量和降低延时。 相似文献
18.
为满足TTCAN的非周期和周期信息的实时性要求,提出了一种采用"权"的动态优先级提升算法。该算法用来提高仲裁窗中非周期信息的实时性。算法引入字母编码方式的遗传算法对系统矩阵时间调度表进行优化,并给出具体的计算方法和步骤。试验表明,该算法可以很好地满足网络中各信息的实时性要求。 相似文献
19.
20.
由Weiler—Atherton算法思想,提出一种基于向量交点特征的圆(弧)裁剪算法。算法以裁剪边为对象来研究交点的特征,使交点计算变得快速容易;在遍历追踪时,巧妙地将圆弧的起点和终点并入“出”、“入”交点列表,避免了圆(弧)交点的排序运算,不仅快速得到裁剪后的圆弧段,而且极容易地得出完全“取之”和“弃之”的结果;实际应用程序证明该算法具有较强的稳定性和实用性。 相似文献