首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
对文本分类中降维技术、提高分类精度和效率的方法进行了研究,提出了一种基于矩阵投影运算的新型文本分类算法——Matrix Projection(MP)分类算法。矩阵运算将训练样例中表示文本特征的三维空间投影到二维空间上,得到归一化向量,有效地达到了降维与精确计算特征项权重的目的。与其他多种文本分类算法对比实验表明,MP算法的分类精度和时间性能都有明显提高,在两套数据集上的宏平均F1值分别达到92.29%和96.03%。  相似文献   

2.
基于归一化向量的文本分类算法   总被引:1,自引:0,他引:1       下载免费PDF全文
基于归一化思想和矩阵投影运算提出一种文本分类算法。该算法综合考虑单个类别内的文档频率和词频,用于进行矩阵投影运算。将训练样例中表示文本特征的三维空间投影到二维空间上,得到归一化的特征向量,可有效地达到降低特征空间维数、提高分类效率和精度的目的。与kNN算法的对比实验表明,该算法在时间性能和精度上都有较大提高。  相似文献   

3.
文本分类特征权重改进算法   总被引:1,自引:2,他引:1       下载免费PDF全文
台德艺  王俊 《计算机工程》2010,36(9):197-199,
TF-IDF是一种在文本分类领域获得广泛应用的特征词权重算法,着重考虑了词频与逆文档频等因素,但无法把握特征词在类间与类内的分布情况。为提高在同类中频繁出现、类内均匀分布的具有代表性的特征词权重,引入特征词分布集中度系数改进IDF函数、用分散度系数进行加权,提出TF-IIDF-DIC权重函数。实验结果表明,基于TF-IIDF-DIC权重算法的K-NN文本分类宏平均F1值比TF-IDF算法提高了6.79%。  相似文献   

4.
文本分类特征权重改进算法   总被引:4,自引:2,他引:4       下载免费PDF全文
台德艺  王俊 《计算机工程》2010,36(9):197-199
TF-IDF是一种在文本分类领域获得广泛应用的特征词权重算法,着重考虑了词频与逆文档频等因素,但无法把握特征词在类间与类内的分布情况。为提高在同类中频繁出现、类内均匀分布的具有代表性的特征词权重,引入特征词分布集中度系数改进IDF函数、用分散度系数进行加权,提出TF-IIDF-DIC权重函数。实验结果表明,基于TF-IIDF-DIC权重算法的K-NN文本分类宏平均F1值比TF-IDF算法提高了6.79%。  相似文献   

5.
针对文本聚类问题中因为维度灾难以及特征信息丢失而导致的聚类效果低效问题,本文提出一种基于特征矩阵优化与改进主成分分析(Principal component analysis,PCA)降维的聚类算法.在原基于文档频率和逆词频(Term frequency inverse document frequency,TF-ID...  相似文献   

6.
基于标签的推荐算法已成为研究热点,现有相关研究集中在利用标签改进协同过滤推荐算法和基于内容的推荐算法,鲜有研究把标签引入更先进的矩阵分解推荐算法。而现有矩阵分解推荐算法大多使用商品类别作为因子向量对用户偏好和商品特征建模,限制了其精度的提升。本文使用标签构建因子向量,提出一种新的基于标签的矩阵分解推荐算法。经过真实数据检测,本文提出的推荐算法较以往基于类别的矩阵分解算法在精度上有了显著提升。  相似文献   

7.
在文本分类中,特征空间维数通常高达几万,甚至远远超出训练样本的个数,这是一种十分普遍的现象。为了提高文本挖掘算法的运行速度,降低占用的内存空间,提出了一种基于优化的模拟退火算法的特征选择方法。在该方法中,为避免遗失当前最优解,增加了记忆功能,将当前最好的状态记忆下来,从而使得模拟退火算法成为一种智能化算法;设计了一个自适应温度更新函数,并设置双阈值使得在尽量保持最优性的前提下减少计算量,从而较快地获得较具代表性的特征子集。实验结果表明该方法是有效的。  相似文献   

8.
以向量空间模型作为Web文本的表示方法,结合Web文本的结构特征对向量空间模型中的特征选择算法进行了分析并加以改进。在改进的算法中,体现出了特征词在Web文档结构中的位置信息;引入了信息论中熵的概念,用词的熵函数对权值进行调整,从而更加准确地选取有效的特征词。实验验证了改进算法的可行性和有效性。  相似文献   

9.
基于向量空间模型的网页文本表示改进算法   总被引:7,自引:0,他引:7  
曾致远  张莉 《计算机工程》2006,32(3):134-135,139
介绍了一种新的文本表示算法,应用在网页文本过滤系统中。比起传统的向量空间模型,这种建立在其上的改进算法有更快的过滤速度和更高的过滤精度。该算法直接从过滤模板的特征集中取出词条,只在网页文本出现该词的地方进行精确处理。根据特征项所在的网页标签,赋予不同的权值系数,以准确定义特征词在文中的重要程度,最后建立该网页的文本表示模型。  相似文献   

10.
在推荐系统中,基于矩阵分解的推荐算法是目前的研究热点之一,然而普通矩阵分解算法的推荐精确度偏低,为了改善该问题,以矩阵分解算法中的潜在因子模型(LFM)优化为研究对象,分析LFM中两种基础推荐算法在寻优速率与推荐精度上的不足,然后提出两种改进算法:带冲量的批量学习算法和混合学习算法,最后通过实验数据测试,对比了不同算法的推荐效果,结果证明改进算法的性能更优。  相似文献   

11.
本文对一般的工业过程的生产装置操作变量调优进行了简要回顾,结合作者几年来调优工作的实践,提出了综合调优法及相应的调优专家系统.文章着重阐述了知识的分类、获取、表示及综合应用各类知识的调优决策方法,提出了深层知识与浅层知识,统计模型与机理模型协同使用的原则.特别提出了知识矩阵的方法,即把所获得的各类知识都表示成矩阵形式,从而大大简化了调优决策过程.应用作者所设计的自适应调优专家系统,某化工装置在调优试验中取得了显著的实际效果.  相似文献   

12.
针对矢量水听器定向算法在不同目标方向和噪声情况下精度各有优劣的特点,和定向结果普遍具有一致性较差的缺点,将多传感器和多源数据处理中先进的数据融合技术引入定向算法的研究当中.采用基于方差的加权数据融合技术,将平均声强法、反正弦法和反余弦法这三种矢量定向算法有效融合,取长补短,单一算法的执行过程中也有效沿用了重复检测的优化思想.仿真实验验证,融合算法不仅可以提高目标的定向精度,而且大大降低检测结果的均方差,从而提高了定向结果的准确性和可靠性,对水下目标检测工程具有重要意义.  相似文献   

13.
王丽萍  陈宏  杜洁洁  邱启仓  邱飞岳 《软件学报》2020,31(12):3716-3732
多偏好向量引导的协同进化算法(PICEA-g)是将目标向量作为偏好,个体支配目标向量的个数作为适应值,以有效降低高维目标空间中非支配解的比例.但PICEA-g所获解集是近似Pareto前沿,而不是决策者真正感兴趣部分的Pareto最优解,导致算法在处理高维优化问题时性能下降和计算资源的浪费.鉴于此,提出一种基于偏好向量引导的高维目标协同进化算法(ASF-PICEA-g):首先,利用ASF扩展函数将进化种群中的参考点映射至目标空间,并将其作为偏好向量引导种群进化的参考方向;然后,利用偏好区域选择策略获取两个临时参考点,进而构建决策者感兴趣区域(ROI),确定随机偏好集产生的上下界范围,通过协同进化机制引导种群朝偏好区域收敛.将ASF-PICEA-g与g-NSGA-II和r-NSGA-II在3-20维的WFG系列和DTLZ系列测试函数上进行仿真实验,实验结果表明:ASFPICEA-g在WFG系列测试函数上表现出了良好的性能,所得解集整体上优于对比算法;在DTLZ系列测试函数上略优于对比算法,尤其在10维以上目标空间,ASF-PICEA-g表现出更好的稳定性,所获解集有较好的收敛性和分布性.  相似文献   

14.
为解决支持向量机(SVM)参数在优化过程中存在的局部极值和收敛速度慢的问题,提出一种基于矢量矩免疫算法优化SVM参数的方法.通过将抗体距离与免疫网络原理中浓度调节机制相结合的方式,提高算法的局部搜索能力,通过引入免疫记忆单元加快算法搜索最优参数的速度,优化过程中用SVM的分类精度作为算法的循环条件,实现对不同分类问题SVM参数的自适应调节.最后,利用Matlab7.0软件进行计算机仿真并与遗传算法进行比较,结果表明前者在优化性能上具有一定的优越性,为应用提供了参考.  相似文献   

15.
找到系统中的全部反馈环是系统动力学模型分析的基础。针对这一问题,比较了几种常见的反馈环计算方法,得出在时间复杂度上矩阵算法优于行列式算法。在计算机上用MATLAB实现了基于流率基本入树和强简化流率基本入树枝向量矩阵计算所有反馈环的矩阵算法,分析了算法的复杂性,并给出了相应的算例。  相似文献   

16.
找到系统中的全部反馈环是系统动力学模型分析的基础.针对这一问题,比较了几种常见的反馈环计算方法,得出在时间复杂度上矩阵算法优于行列式算法.在计算机上用MATLAB实现了基于流率基本入树和强简化流率基本入树枝向量矩阵计算所有反馈环的矩阵算法,分析了算法的复杂性,并给出了相应的算例.  相似文献   

17.
针对粒子群优化算法(PSO)应用于矢量量化时,最优粒子对与其对应维度距离较大的粒子缺乏有效指导问题,提出适用于矢量量化的改进粒子群优化算法(IPSO_VQ).该算法通过建立粒子与榜样粒子的维度映射关系,以基于映射关系的维度学习代替对应维度学习关系,使粒子相关维度间的学习有一定相关性,增强算法局部搜索能力.同时,借鉴广泛学习粒子群优化(CLPSO)算法中的广泛学习思想,并将其应用于基本PSO中的全局最优位置学习部分,通过对多个粒子的广泛学习,增加种群的多样性.实验结果表明该算法有效避免种群早熟收敛,从而使解码恢复图像获得更高的主客观质量.  相似文献   

18.
现有RAID系统的编码算法不能同时具备较高的执行效率和较强的容错能力。为此,提出一种基于二进制矩阵的RS编码优化算法。使用RS编码中有限域内乘法运算得到转换后的二进制矩阵,采用多分法对其进行优化,从而减少编码时的异或运算次数,以此设计优化算法。实验结果表明,该算法的执行效率较高,容错能力较大。  相似文献   

19.
通过优化随机早期检测算法来降低网络的丢包率,提高吞吐量和降低延时。用网络仿真软件进行网络仿真:分析随机早期检测算法,找出随机早期检测算法在避免网络拥塞时存在的缺点;针对随机早期检测算法存在的缺点进行优化;将优化的随机早期检测算法在网络仿真软件上实现,在丢包率、吞吐量和延时上与随机早期检测算法进行比较,得到最终的实验结果。特色在于合理设置最大丢包率来控制路由器中的瞬时队列长度,进而实现网络资源的优化。仿真结果表明,相对于随机早期检测算法,改进后的算法能更好地降低网络的丢包率、提高吞吐量和降低延时。  相似文献   

20.
由Weiler—Atherton算法思想,提出一种基于向量交点特征的圆(弧)裁剪算法。算法以裁剪边为对象来研究交点的特征,使交点计算变得快速容易;在遍历追踪时,巧妙地将圆弧的起点和终点并入“出”、“入”交点列表,避免了圆(弧)交点的排序运算,不仅快速得到裁剪后的圆弧段,而且极容易地得出完全“取之”和“弃之”的结果;实际应用程序证明该算法具有较强的稳定性和实用性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号