首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
对文本分类中降维技术、提高分类精度和效率的方法进行了研究,提出了一种基于矩阵投影运算的新型文本分类算法——Matrix Projection(MP)分类算法。矩阵运算将训练样例中表示文本特征的三维空间投影到二维空间上,得到归一化向量,有效地达到了降维与精确计算特征项权重的目的。与其他多种文本分类算法对比实验表明,MP算法的分类精度和时间性能都有明显提高,在两套数据集上的宏平均F1值分别达到92.29%和96.03%。  相似文献   

2.
基于归一化向量的文本分类算法   总被引:1,自引:0,他引:1       下载免费PDF全文
基于归一化思想和矩阵投影运算提出一种文本分类算法。该算法综合考虑单个类别内的文档频率和词频,用于进行矩阵投影运算。将训练样例中表示文本特征的三维空间投影到二维空间上,得到归一化的特征向量,可有效地达到降低特征空间维数、提高分类效率和精度的目的。与kNN算法的对比实验表明,该算法在时间性能和精度上都有较大提高。  相似文献   

3.
文本分类特征权重改进算法   总被引:1,自引:2,他引:1       下载免费PDF全文
台德艺  王俊 《计算机工程》2010,36(9):197-199,
TF-IDF是一种在文本分类领域获得广泛应用的特征词权重算法,着重考虑了词频与逆文档频等因素,但无法把握特征词在类间与类内的分布情况。为提高在同类中频繁出现、类内均匀分布的具有代表性的特征词权重,引入特征词分布集中度系数改进IDF函数、用分散度系数进行加权,提出TF-IIDF-DIC权重函数。实验结果表明,基于TF-IIDF-DIC权重算法的K-NN文本分类宏平均F1值比TF-IDF算法提高了6.79%。  相似文献   

4.
文本分类特征权重改进算法   总被引:4,自引:2,他引:4       下载免费PDF全文
台德艺  王俊 《计算机工程》2010,36(9):197-199
TF-IDF是一种在文本分类领域获得广泛应用的特征词权重算法,着重考虑了词频与逆文档频等因素,但无法把握特征词在类间与类内的分布情况。为提高在同类中频繁出现、类内均匀分布的具有代表性的特征词权重,引入特征词分布集中度系数改进IDF函数、用分散度系数进行加权,提出TF-IIDF-DIC权重函数。实验结果表明,基于TF-IIDF-DIC权重算法的K-NN文本分类宏平均F1值比TF-IDF算法提高了6.79%。  相似文献   

5.
针对文本聚类问题中因为维度灾难以及特征信息丢失而导致的聚类效果低效问题,本文提出一种基于特征矩阵优化与改进主成分分析(Principal component analysis,PCA)降维的聚类算法.在原基于文档频率和逆词频(Term frequency inverse document frequency,TF-ID...  相似文献   

6.
基于标签的推荐算法已成为研究热点,现有相关研究集中在利用标签改进协同过滤推荐算法和基于内容的推荐算法,鲜有研究把标签引入更先进的矩阵分解推荐算法。而现有矩阵分解推荐算法大多使用商品类别作为因子向量对用户偏好和商品特征建模,限制了其精度的提升。本文使用标签构建因子向量,提出一种新的基于标签的矩阵分解推荐算法。经过真实数据检测,本文提出的推荐算法较以往基于类别的矩阵分解算法在精度上有了显著提升。  相似文献   

7.
在文本分类中,特征空间维数通常高达几万,甚至远远超出训练样本的个数,这是一种十分普遍的现象。为了提高文本挖掘算法的运行速度,降低占用的内存空间,提出了一种基于优化的模拟退火算法的特征选择方法。在该方法中,为避免遗失当前最优解,增加了记忆功能,将当前最好的状态记忆下来,从而使得模拟退火算法成为一种智能化算法;设计了一个自适应温度更新函数,并设置双阈值使得在尽量保持最优性的前提下减少计算量,从而较快地获得较具代表性的特征子集。实验结果表明该方法是有效的。  相似文献   

8.
以向量空间模型作为Web文本的表示方法,结合Web文本的结构特征对向量空间模型中的特征选择算法进行了分析并加以改进。在改进的算法中,体现出了特征词在Web文档结构中的位置信息;引入了信息论中熵的概念,用词的熵函数对权值进行调整,从而更加准确地选取有效的特征词。实验验证了改进算法的可行性和有效性。  相似文献   

9.
基于向量空间模型的网页文本表示改进算法   总被引:7,自引:0,他引:7  
曾致远  张莉 《计算机工程》2006,32(3):134-135,139
介绍了一种新的文本表示算法,应用在网页文本过滤系统中。比起传统的向量空间模型,这种建立在其上的改进算法有更快的过滤速度和更高的过滤精度。该算法直接从过滤模板的特征集中取出词条,只在网页文本出现该词的地方进行精确处理。根据特征项所在的网页标签,赋予不同的权值系数,以准确定义特征词在文中的重要程度,最后建立该网页的文本表示模型。  相似文献   

10.
杨震宇  叶军  季雨瑄  敖家欣  王磊 《计算机应用研究》2022,39(4):1118-1123+1131
目前已有蚁群算法优化的特征选择方法,大多采用的是以属性依赖度和信息熵属性重要度作为路径上启发搜索因子,但这类搜索方法在某些决策表中存在算法早熟或搜索到的特征子集包含了冗余特征,从而导致选择精度显著下降。针对此类问题,根据条件属性在分辨矩阵中的占比提出了一种属性重要度的度量方法,以分辨矩阵重要度作为路径上启发因子,设计了一种基于分辨矩阵与蚁群算法优化的特征子集搜索方法。该算法从特征核出发,蚁群依次选择概率大的特征加入特征核集,直至找到最小特征子集算法终止。通过实例验证和UCI数据集实验结果表明,与基于属性依赖度和信息熵属性重要度的特征选择方法相比,在通常情况下,该算法能较小代价找到最小特征子集,并且可以有效减少计算工作量。  相似文献   

11.
本文对一般的工业过程的生产装置操作变量调优进行了简要回顾,结合作者几年来调优工作的实践,提出了综合调优法及相应的调优专家系统.文章着重阐述了知识的分类、获取、表示及综合应用各类知识的调优决策方法,提出了深层知识与浅层知识,统计模型与机理模型协同使用的原则.特别提出了知识矩阵的方法,即把所获得的各类知识都表示成矩阵形式,从而大大简化了调优决策过程.应用作者所设计的自适应调优专家系统,某化工装置在调优试验中取得了显著的实际效果.  相似文献   

12.
针对矢量水听器定向算法在不同目标方向和噪声情况下精度各有优劣的特点,和定向结果普遍具有一致性较差的缺点,将多传感器和多源数据处理中先进的数据融合技术引入定向算法的研究当中.采用基于方差的加权数据融合技术,将平均声强法、反正弦法和反余弦法这三种矢量定向算法有效融合,取长补短,单一算法的执行过程中也有效沿用了重复检测的优化思想.仿真实验验证,融合算法不仅可以提高目标的定向精度,而且大大降低检测结果的均方差,从而提高了定向结果的准确性和可靠性,对水下目标检测工程具有重要意义.  相似文献   

13.
为解决支持向量机(SVM)参数在优化过程中存在的局部极值和收敛速度慢的问题,提出一种基于矢量矩免疫算法优化SVM参数的方法.通过将抗体距离与免疫网络原理中浓度调节机制相结合的方式,提高算法的局部搜索能力,通过引入免疫记忆单元加快算法搜索最优参数的速度,优化过程中用SVM的分类精度作为算法的循环条件,实现对不同分类问题SVM参数的自适应调节.最后,利用Matlab7.0软件进行计算机仿真并与遗传算法进行比较,结果表明前者在优化性能上具有一定的优越性,为应用提供了参考.  相似文献   

14.
找到系统中的全部反馈环是系统动力学模型分析的基础。针对这一问题,比较了几种常见的反馈环计算方法,得出在时间复杂度上矩阵算法优于行列式算法。在计算机上用MATLAB实现了基于流率基本入树和强简化流率基本入树枝向量矩阵计算所有反馈环的矩阵算法,分析了算法的复杂性,并给出了相应的算例。  相似文献   

15.
找到系统中的全部反馈环是系统动力学模型分析的基础.针对这一问题,比较了几种常见的反馈环计算方法,得出在时间复杂度上矩阵算法优于行列式算法.在计算机上用MATLAB实现了基于流率基本入树和强简化流率基本入树枝向量矩阵计算所有反馈环的矩阵算法,分析了算法的复杂性,并给出了相应的算例.  相似文献   

16.
针对粒子群优化算法(PSO)应用于矢量量化时,最优粒子对与其对应维度距离较大的粒子缺乏有效指导问题,提出适用于矢量量化的改进粒子群优化算法(IPSO_VQ).该算法通过建立粒子与榜样粒子的维度映射关系,以基于映射关系的维度学习代替对应维度学习关系,使粒子相关维度间的学习有一定相关性,增强算法局部搜索能力.同时,借鉴广泛学习粒子群优化(CLPSO)算法中的广泛学习思想,并将其应用于基本PSO中的全局最优位置学习部分,通过对多个粒子的广泛学习,增加种群的多样性.实验结果表明该算法有效避免种群早熟收敛,从而使解码恢复图像获得更高的主客观质量.  相似文献   

17.
通过优化随机早期检测算法来降低网络的丢包率,提高吞吐量和降低延时。用网络仿真软件进行网络仿真:分析随机早期检测算法,找出随机早期检测算法在避免网络拥塞时存在的缺点;针对随机早期检测算法存在的缺点进行优化;将优化的随机早期检测算法在网络仿真软件上实现,在丢包率、吞吐量和延时上与随机早期检测算法进行比较,得到最终的实验结果。特色在于合理设置最大丢包率来控制路由器中的瞬时队列长度,进而实现网络资源的优化。仿真结果表明,相对于随机早期检测算法,改进后的算法能更好地降低网络的丢包率、提高吞吐量和降低延时。  相似文献   

18.
为满足TTCAN的非周期和周期信息的实时性要求,提出了一种采用"权"的动态优先级提升算法。该算法用来提高仲裁窗中非周期信息的实时性。算法引入字母编码方式的遗传算法对系统矩阵时间调度表进行优化,并给出具体的计算方法和步骤。试验表明,该算法可以很好地满足网络中各信息的实时性要求。  相似文献   

19.
在分析马尔可夫决策过程(Markov Decision Process, MDP)性能灵敏度的基础上,讨论了部分可观 测马尔可夫决策过程(Partially Observable Markov Decision Process, POMDP)的性能优化问题.给出了POMDP 性能灵敏度分析公式,并以此为基础提出了两种基于观测的POMDP 优化算法:策略梯度优化算法和策略迭 代优化算法.最后以准许控制问题为仿真实例,验证了这两个算法的有效性.  相似文献   

20.
由Weiler—Atherton算法思想,提出一种基于向量交点特征的圆(弧)裁剪算法。算法以裁剪边为对象来研究交点的特征,使交点计算变得快速容易;在遍历追踪时,巧妙地将圆弧的起点和终点并入“出”、“入”交点列表,避免了圆(弧)交点的排序运算,不仅快速得到裁剪后的圆弧段,而且极容易地得出完全“取之”和“弃之”的结果;实际应用程序证明该算法具有较强的稳定性和实用性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号