首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
中文文本的关键词自动抽取和模糊分类   总被引:41,自引:3,他引:38  
本文提出了中文文本分类的两种模糊方法,一种基于模糊集间的语义距离,一种基于本文中提出的‘模糊分类网络’。两者都必须首先从文本中抽取关键词集合,本文给出了一种主要采用统计方法结合受限自然语言理解技术的模糊关键词集合提取方法,它与模糊分类方法结合,可望达到文本信息的自动分类。所提出的方法同样适合于模式识别之类问题的解决。  相似文献   

2.
将软粗糙模糊集应用于多属性决策问题,用软粗糙模糊集分析模糊知识表达系统,定义了软模糊决策系统、决策分类模糊软集依赖度、条件双射软集对决策分类模糊软集的重要性、软模糊决策系统的约简、软模糊决策系统的决策规则等概念,借助这些概念给出了一种基于软粗糙模糊集的多属性决策算法,通过实例分析说明了该算法的可行性。  相似文献   

3.
基于自适应模糊聚类的神经网络软测量建模方法   总被引:8,自引:1,他引:8  
提出一种基于模糊聚类的神经网络软测量建模方法.该方法采用数据分组训练、自动确定模糊分类数、在线测量时分类中心自适应修正,降低了计算量,提高了建模精度.将该算法用于步进式加热炉钢坯温度预报的仿真结果表明,它能够解决钢坯温度难以在线测量的问题。  相似文献   

4.
阐述了基于相似粗糙集和模糊认知图的文本分类问题,提出了一种基于模糊认知图的文本分类推理算法,使文本分类成为一个基于文本特征项的权和特征项与类别的相关度构成的模糊认知图进行推理的结果,最后对该算法进行了实验,并对结果进行了分析.  相似文献   

5.
特征加权距离与软子空间学习相结合的文本聚类新方法   总被引:1,自引:0,他引:1  
王骏  王士同  邓赵红 《计算机学报》2012,35(8):1655-1665
文本数据维数高、数据分布稀疏、不同类别的特征相互重叠,这为聚类分析提出了挑战.针对文本数据的这一特点,将特征加权技术与软子空间相结合,基于模糊聚类的算法框架,提出了一种适用于高维文本数据的软子空间模糊聚类新方法.首先,基于加权范数理论,提出了新的特征加权距离计算方法.接着,将其与软子空间学习的理论框架相结合,提出了面向模糊聚类的新的目标学习准则.通过向约束条件中引入熵指数r,从而扩展了模糊指数m的取值范围,并给出了物理解释.基于Zangwill收敛定理对算法的全局收敛性给出理论证明.实验表明,文中算法可以使软子空间学习和聚类分析同时进行,其性能比现有的相关算法有了较大的提高.  相似文献   

6.
同义词和近义词现象以及强关联语义信息加大了文本向量的特征维数,对文本分类的效率和精度都会带来极大影响.为了有效降低文本向量的特征维数,提出一种基于混合并行遗传聚类的文本特征抽取方法.该方法首先使用K-means聚类算法进行特征词粗粒度聚类,然后采用混合并行遗传算法对各类特征词进行细粒度聚类,最后对各聚类中的特征词进行分析并压缩,得到最终能反映文本类别特征和语义信息的文本特征词集合.实验证明,该方法是一种有效的文本特征抽取方法,能切实提高文本分类的效率和精度.  相似文献   

7.
网络信息的多样性和多变性给信息的管理和过滤带来极大困难,为加快网络信息的分类速度和分类精度,提出了一种基于模糊粗糙集的Wdb文本分类方法.采用机器学习的方法:在训练阶段,首先对Web文本信息预处理,用向量空间模型表示文本,生成初始特征属性空间,并进行权值计算;然后用模糊粗糙集算法来进行信息过滤,用基于模糊租糙集的属性约简算法生成分类规则:最后利用知识库进行文档分类.在测试阶段,对未经预处理的文本直接进行关键属性匹配,经模糊粗糙因子加权后,用空间距离法分类.通过试验比较,该方法具有较好的分类效果.  相似文献   

8.
从集合间的包含程度出发,构造了一种基于包含度的变精度软粗糙集模型。提出带参数的变精度近似算子的定义,得到了它的基本性质和定理,并给出了证明;定义了双精度软粗糙集的近似算子,研究了其性质;讨论了该模型与其他粗糙集模型的关系以及退化条件;举例说明了在信息处理中的应用。  相似文献   

9.
唐小川  邱曦伟  罗亮 《计算机应用》2018,38(7):1857-1861
针对文本分类中的特征选择问题,提出了一种考虑特征之间交互作用的文本分类特征选择算法——Max-Interaction。首先,通过联合互信息(JMI),建立基于信息论的文本分类特征选择模型;其次,放松现有特征选择算法的假设条件,将特征选择问题转化为交互作用优化问题;再次,通过最大最小法避免过高估计高阶交互作用;最后,提出一个基于前向搜索和高阶交互作用的文本分类特征选择算法。实验结果表明,Max-Interaction比交互作用权重特征选择(IWFS)的平均分类精度提升了5.5%,Max-Interaction比卡方统计法(Chi-square)的平均分类精度提升了6%,Max-Interaction在93%的实验中分类精度高于对比方法,因此,Max-Interaction能有效利用交互作用提升文本分类特征选择的性能。  相似文献   

10.
提出一种基于特征词句子环境的文本分类方法,介绍了创建分类规则的文本句子信息模型,比较详细地给出训练算法和语句聚集算法.该算法依据训练文本集的特征词句子环境,获取识别文本主题类别的特征词集合.最后给出了分类器性能的测试结果.  相似文献   

11.
模糊软集多参数决策方法中经常将Zadeh交与代数积使用在数据融合方法中,在一些实际应用中会产生信息缺失,导致决策者无法做出准确的选择。针对这一问题,结合Einstein运算法则提出一种新的数据融合方法,用于解决信息缺失和对象无法排序的问题。所提出的基于模糊软集的多参数决策方法是通过Einstein积运算进行多个参数集合的整合,从而得到一个合成模糊软集,再由合成模糊软集计算得到对照矩阵与得分表,最终得到对象的全排序,为决策者提供判断依据。通过实例结果,可以验证新方法在决策问题中的正确性和有效性。  相似文献   

12.

Classification is one of the data mining processes used to predict predetermined target classes with data learning accurately. This study discusses data classification using a fuzzy soft set method to predict target classes accurately. This study aims to form a data classification algorithm using the fuzzy soft set method. In this study, the fuzzy soft set was calculated based on the normalized Hamming distance. Each parameter in this method is mapped to a power set from a subset of the fuzzy set using a fuzzy approximation function. In the classification step, a generalized normalized Euclidean distance is used to determine the similarity between two sets of fuzzy soft sets. The experiments used the University of California (UCI) Machine Learning dataset to assess the accuracy of the proposed data classification method. The dataset samples were divided into training (75% of samples) and test (25% of samples) sets. Experiments were performed in MATLAB R2010a software. The experiments showed that: (1) The fastest sequence is matching function, distance measure, similarity, normalized Euclidean distance, (2) the proposed approach can improve accuracy and recall by up to 10.3436% and 6.9723%, respectively, compared with baseline techniques. Hence, the fuzzy soft set method is appropriate for classifying data.

  相似文献   

13.
自动文本分类的效果在很大程度上依赖于属性特征的选择。针对传统基于频率阈值过滤的特征选择方法会导致有效信息丢失,影响分类精度的不足,提出了一种基于粗糙集的文本自动分类算法。该方法对加权后的特征属性进行离散化,建立一个决策表;根据基于依赖度的属性重要度对决策表中条件属性进行适当的筛选;采用基于条件信息熵的启发式算法实现文本属性特征的约简。实验结果表明,该方法能约简大量冗余的特征属性,在不降低分类精度的同时,提高文本分类的运行效率。  相似文献   

14.
The purpose of this paper is two folded. Firstly, the concept of mean potentiality approach (MPA) has been developed and an algorithm based on this new approach has been proposed to get a balanced solution of a fuzzy soft set based decision making problem. Secondly, a parameter reduction procedure based on relational algebra with the help of the balanced algorithm of mean potentiality approach has been used to reduce the choice parameter set in the parlance of fuzzy soft set theory and it is justified to the problems of diagnosis of a disease from the myriad of symptoms from medical science. Moreover the feasibility of this proposed method is demonstrated by comparing with Analytical Hierarchy Process (AHP), Naive Bayes classification method and Feng's method.  相似文献   

15.
基于最大互信息最大相关熵的特征选择方法   总被引:5,自引:1,他引:4  
特征选择算法主要分为filter和wrapper两大类,并已提出基于不同理论的算法模型,但依然存在算法处理能力不强、子集分类精度不高等问题。基于模糊粗糙集的信息熵模型提出最大互信息最大相关熵标准,并根据该标准设计了一种新的特征选择方法,能同时处理离散数据、连续数据和模糊数据等混合信息。经UCI数据集试验,表明该算法与其他算法相比,具有较高的精度,且稳定性较高,是有效的。  相似文献   

16.
一种基于CHI值特征选取的粗糙集文本分类规则抽取方法   总被引:6,自引:1,他引:6  
王明春  王正欧  张楷  郝玺龙 《计算机应用》2005,25(5):1026-1028,1033
结合文本分类规则抽取的特点,给出了近似规则的定义。该方法首先利用CHI值进行特征选取并为下一步特征选取提供特征重要性信息,然后使用粗糙集对离散决策表继续进行特征选取,最后用粗糙集抽取出精确规则或近似规则。该方法将CHI值特征选取和粗糙集理论充分结合,避免了用粗糙集对大规模决策表进行特征约简,同时避免了决策表的离散化。该方法提高了文本规则抽取的效率,并使其更趋实用化。实验结果表明了这种方法的有效性和实用性。  相似文献   

17.
对医学图像进行分类时,特征选择是影响分类准确率的非常重要的因素。针对医学图像的特殊性,以及目前提出的特征选择算法在应用于医学图像分类时效果不够理想等问题,提出一种基于邻域关系的模糊粗糙集模型,基于该模型给出特征选择算法,并将其应用于乳腺X光图像。实验结果表明,同已有的算法相比,该方法能有效选择特征,分类精度有较大的提升。  相似文献   

18.
针对当前基于属性重要性的决策表属性集分解方法存在的不足,提出了一种新型的基于决策分类的决策表属性集分解方法。分析了近似分类质量和属性重要性与决策分类之间的关系,利用粗糙集理论,从提高子决策表中决策分类正确性的角度出发考虑条件属性与决策属性之间的关系,提出了决策表分解的条件属性选择量度并对决策表实施属性集分解。  相似文献   

19.
In this paper, a kind of novel soft set model called a Z-soft fuzzy rough set is presented by means of three uncertain models: soft sets, rough sets and fuzzy sets, which is an important generalization of Z-soft rough fuzzy sets. As a novel Z-soft fuzzy rough set, its applications in the corresponding decision making problems are established. It is noteworthy that the underlying concepts keep the features of classical Pawlak rough sets. Moreover, this novel approach will involve fewer calculations when one applies this theory to algebraic structures. In particular, an approach for the method of decision making problem with respect to Z-soft fuzzy rough sets is proposed and the validity of the decision making methods is testified by a given example. At the same time, an overview of techniques based on some types of soft set models is investigated. Finally, the numerical experimentation algorithm is developed, in which the comparisons among three types of hybrid soft set models are analyzed.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号