首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
自动文本分类的效果在很大程度上依赖于属性特征的选择。针对传统基于频率阈值过滤的特征选择方法会导致有效信息丢失,影响分类精度的不足,提出了一种基于粗糙集的文本自动分类算法。该方法对加权后的特征属性进行离散化,建立一个决策表;根据基于依赖度的属性重要度对决策表中条件属性进行适当的筛选;采用基于条件信息熵的启发式算法实现文本属性特征的约简。实验结果表明,该方法能约简大量冗余的特征属性,在不降低分类精度的同时,提高文本分类的运行效率。  相似文献   

2.
一种新的基于粗糙集的值约简算法   总被引:14,自引:1,他引:14  
林嘉宜  彭宏  郑启伦 《计算机工程》2003,29(4):70-71,129
对粗糙集(Rough Set)理论中属性约简和值约简算法进行了研究,提出了一种新的基于粗糙集的值约简算法,实验表明,该算法所得结果比目前通用的基于粗糙集的值约简算法更简化和有效,它可以应用到各种与值约简相关的实际问题中。  相似文献   

3.
为解决传统遗传算法在属性约简时会出现迭代次数多,收敛较慢的问题,论文提出了一种改进的遗传算法。该方法在适应函数上加入属性重要度因子,同时在交叉操作中有选择地保留子代个体,确保算法能够快速收敛。实验结果证明,改进之后的算法在保证属性约简的基础上,能够实现比传统遗传算法更快的迭代和收敛。  相似文献   

4.
林珣  李志蜀  周勇 《计算机科学》2011,38(11):239-240,263
文本分类是中文信息处理的重要研究领域。给文本分配一个或多个不同的类别,可提高文本检索和存储的处理效率。粗糙集是一种不需要任何先验信息的分类方法,通过对文本分词、过滤掉停用词之后把剩余的词语作为特征项,然后把文本用向量空间模型表示出来,将文本集转化成不带决策属性的信息系统,用粗糙集理论中核心内容属性约简实现对文本的分类。实验表明,该方法的查准率和查全率都有所提高。  相似文献   

5.
高亮  王伟  吴涛 《微机发展》2008,18(5):19-21
属性约简是粗糙集理论中的一个核心问题,为了有效获取属性最小相对约简,提出了一种新的基于相对差异比较表的属性约简算法。该算法给出了一种将信息表转化为相对差异比较表的方法,且该方法对于不相容决策表也是可行的,进而就将求解最小属性约简问题转化为求解一个0-1整数规划问题,并分别采用一般求解规划问题的方法和遗传算法两种方法来求解这个0-1整数规划问题。实验结果证明该算法结合遗传算法能够更加快速有效地进行属性约简。  相似文献   

6.
约简的一种启发式算法   总被引:4,自引:0,他引:4  
本文揭示了约简在数量上的蕴涵的一个重要性质,由此给出又一种属性重要性的定义及相应的启发式算法,并对算法进行了详细的分析。文章最后还类似地讨论了相对约简。  相似文献   

7.
郑芸芸  王萍  游强华 《福建电脑》2013,(10):99-100,134
朴素贝叶斯分类器是建立在一个指定类别中各属性的取值是相互独立的上的,但在实际运用过程中独立性假设经常是不存在的.而粗糙集模型提供了属性离散化和约简技术,能改善属性间的依赖关系,得到相互独立的核心属性.因此,将两种不同的计算方法想结合,利用粗糙集先对数据进行约简,然后在利用朴素贝叶斯分类器,得到分类结果.实验证明这种方法改善了朴素贝叶斯分类器.  相似文献   

8.
一种基于粗糙集理论的文本分类方法   总被引:1,自引:0,他引:1  
在网络这个庞大的虚拟图书馆中,占信息比重最大的文本数据却缺乏结构化、组织化的规整性,大大降低了网络文本信息的利用效率,而文本的自动分类技术则能降低网络的查询时间,提高网络搜索质量。文章提出了一种基于粗糙集理论的文本分类方法。  相似文献   

9.
属性约简是粗糙集理论研究的重要内容之一,而求解最小约简是NP难问题。为了有效获取最优或次优约简,该文提出了一种基于遗传算法的粗糙集属性约简算法。该算法将属性核加入遗传算法的初始种群来增加收敛速度,而且在适应度函数中,通过计算决策属性对条件属性的依赖度,使该文算法既保证了全局寻优的特性又具有加强局部搜索的能力,能够获得最佳的搜索效果。该算法通过实例分析,证明是求解属性约简问题的快速有效方法。  相似文献   

10.
一种基于粗糙集的决策系统属性约简算法   总被引:28,自引:1,他引:28  
从大量数据发现知识时,属性约简是一个关键问题,本文提出了一种新的算法用于粗集中的属性约简,该算法基于Hu的差别矩阵,在对差别矩阵进行化简的基础上,先得到核,然后在逐步减小的差别矩阵中挑选出最频繁的属性加入直到成为一个约简。文中还对求核的正确性,算法的正确性进行了证明,同时对算法复杂度进行了分析,最后给出了一个例子来说明算法的有效性。  相似文献   

11.
基于遗传算法的粗糙集属性约简算法   总被引:1,自引:0,他引:1  
为了研究粗糙集理论中属性约简问题,给出了一种属性相对重要度定义,证明了其合理性,并将它应用到基于遗传算法的约简算法中,提出一种启发式遗传算法.算法采用修正策略保证群体进化收敛于最小约简,同时引入属性相对重要度作为启发信息,加快算法的收敛速度.对算法进行的时间复杂度和完备性分析以及数值实验表明,基于遗传算法的粗糙集属性约简算法具有完备、快速收敛等特点.  相似文献   

12.
基于变长编码遗传算法的最小缩减计算   总被引:8,自引:1,他引:8  
在数据库知识发现的过程中,属性选取是其中的一个重要步骤,它通过去除冗余属性,达到提高数据挖掘效能的目的。本文利用粗糙集合中的理论作为背景知识,讨论了使用遗传算法寻找最小缩减的方法,并提出采用个体变长编码的方法来解决最小缩减的计算问题,设计出相应的交叉、变异算子,实验证明其具有较好的收敛性能。  相似文献   

13.
基于模糊综合评判的文本自动分类算法   总被引:2,自引:0,他引:2  
文本分类在文献检索、信息过滤、数据组织、信息管理等领域中应用十分广泛。本文给出了一种基于模糊综合评判的文本自动分类算法,该算法以文本分词技术作为基础,以类间词频方差作为评判因素的选择依据,通过预定义类中关键词的词频均值高低构造评判矩阵,以最大隶属度作为评判原则。文中详细描述了算法的理论依据、评判因数的选择、评判矩阵的构造及分类算法。实验结果表明本文提出的分类算法具有相当的应用价值。  相似文献   

14.
结合粗糙集和模糊聚类方法的属性约简算法   总被引:5,自引:2,他引:5  
本文针对粗糙集理论的属性约简算法进行了研究。结合模糊聚类方法,提出了一个新的属性约简算法,用户可以根据实际决策需要和领域知识更改阈值λ,从而得到用户满意的属性约简结果。最后利用该文的算法给出了一个实例的约筒结果。  相似文献   

15.
基于小生境遗传算法的知识约简方法   总被引:1,自引:1,他引:1  
武志峰  吉根林 《计算机工程》2004,30(22):152-154
提出基于小生境遗传算法的知识约简算法,利用遗传算法的搜索寻优技术,可以得到多种约简属性集。实验证明,该算法是有效的,它可以解决启发式算法不能解决的部分问题,并能求解出知识系统中存在的不同约简,从而为特征提取、决策支持和数据挖掘等提供更多的信息。  相似文献   

16.
基于蚁群遗传算法的中文文本分类中的特征提取   总被引:1,自引:0,他引:1  
针对文本分类中特征提取准确度的问题,分析了中文文本中词长对于表征文本类别的影响,改进了传统的中文文本词条权重计算方法;由于遗传算法用于特征提取时搜索随机性强,没有方向性,故将蚁群算法应用到遗传算法的选择操作中,提出了一种蚁群算法和遗传算法相结合的特征提取方法。实验结果表明,该方法不但可以提高分类的准确率,而且可以减少分类时间,是一种有效的方法。  相似文献   

17.
网络科技资源应用集成环境所汇集到的信息纷繁复杂,使得用户对信息的浏览、检索造成了一定的困难.首先对所有汇集到的信息向量化,然后通过对IF-IDF权重构造函数进行了改良,使其更加适合本项目的实际情况,接着利用粗糙集理论进行属性约简,生成最终的决策表对科技信息进行分类.最终结果证明,提出的分类系统比传统人工分类的效率有较大提高,取得了良好的效果.  相似文献   

18.
随着社交网络的兴起,文本数据不断增加,这使得自动化文本分类技术成为研究的热点。单个文本可能同时带有多个类别标签,该特点直接导致传统的二分类或多类别分类技术在多标签文本数据上性能不佳。针对这一不足,提出一种基于半监督杂质的子空间聚类分析算法SCA(subspace clustering analysis),该算法分析在多标签环境下每一对分类和标签之间存在的潜在相关性。并设计一种对分类文本数据更有效的多标签分类器。最后,实验对两个多标签文本集进行分析,结果表明该算法优于当前采用的其他文本分类方法。  相似文献   

19.
针对难以获得大量有标签的训练集问题,将增量式贝叶斯学习用于小规模训练集上,并提出了一种新的序列学习算法以弥补其学习序列中存在的不足:无法充分利用先验知识导致噪声数据不断传播。在增量学习的样本选择上,算法引入了配对样本检验和类支持度的知识,分别从横向和纵向角度充分利用先验知识来选取最优增量子集优化分类器,使分类器参数在动态学习过程中得以强化。实验结果表明,该算法能有效弱化噪声数据的消极影响,提高分类精度,同时能大幅度减少增量学习时间。  相似文献   

20.
研究海洋参数数据检测评价融合问题。在海洋环境监测系统中,由于监测项目繁多,测量数据存在着大量的冗余,使海洋环境的监测准确性差。传统的数据融合算法复杂度较高,难以实时利用,为了消除数据冗余性,针对钦州湾海洋数据的特点,提出了一种粗糙集的属性约简改进算法。结合贪心算法和遗传算法,在编码、交叉、变异、选择方面做了改进,能生成属性个数较少的约简,提高算法效率。通过钦州湾海洋数据融合实例,提出的算法可有效挖掘钦州湾海洋数据间的关联性,通过实验,结果表明了算法的有效性,为海洋环境监测及后续处理提供有力的决策依据。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号