首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
一种基于Rough Sets和模糊神经网络的规则获取的方法   总被引:3,自引:1,他引:2  
该文提出了一种基于RoughSets思想获取初始规则,并通过模糊神经网络优化,最后再进行简化获取模糊规则,及模糊系统参数学习的方法。并通过实例进行了自动列车运行系统仿真。文中还基于上述实例,将这种基于模糊神经网络的学习与控制方法与标准的BP网络和基本的模糊系统方法进行了比较,并总结了这种方法的特点。结论表明,该文所提出的模糊规则生成和模糊系统学习方法是行之有效的。  相似文献   

2.
制约语料库加工质量的一个重要方面是多标记词语的词性标注一致性问题。该文通过对大规模语料库兼类词的词性标注结果的分析,提出一种语料库词性标注一致性检查的方法,分析词性标记序列的特征并建立兼类词语境向量模型,运用k最近邻法,对兼类词语境进行向量分类,判定兼类词词性标注是否一致,得出每篇文章的词性标注的一致性情况,并测试了北京大学的150万语料。  相似文献   

3.
基于搭配模式的汉语词性标注规则的获取方法   总被引:2,自引:0,他引:2  
文章介绍了一种基于搭配模式的汉语词性标注规则的获取方法。该方法从已标注了词性的语料库中自动获取候选搭配模式规则,然后根据可信度从候选规则中选择出大于某阈值的规则,再通过不断测试新语料来完善规则。将获取的规则用于汉语的词性标注,使标注的正确率得到了明显提高。  相似文献   

4.
规则与统计相结合的兼类词处理机制   总被引:5,自引:0,他引:5  
兼类词处理是词性标注的关键所在,本文对兼类词排岐进行了研究,介绍了规则和统计相结合的排岐策略.按照上述策略,实现了一个兼类词处理系统.实验测试结果表明,利用规则与统计相结合的兼类词处理机制可以有效地提高排岐正确率和词性标注正确率,在封闭测试和开放测试中兼类词的排歧正确率分别达到了93.91%和91.16%,标注正确率分别达到了97.85%和96.71%.  相似文献   

5.
用数据采掘方法获取汉语词性标注规则   总被引:8,自引:0,他引:8  
从数据采掘的角度对汉语文本词性标注规则的获取进行研究,在满足用户规定的支持度向量的前提下,先从侯选集模式中挑选出常用模式;然后采掘出具有高可信度的产生式规则。该过程完全是自动的,而获取的规则有表达上是明确的,同时又是隐含在数据中的、用户不易发现的,实验表明:在原有统计方法的基础上,利用自动获得的标注规则作为补充,可以提高词性标注的正确率。  相似文献   

6.
藏文词性标注是藏文信息处理的基础,在藏文文本分类、自动检索、机器翻译等领域有广泛的应用。该文针对藏文语料匮乏,人工标注费时费力等问题,提出一种基于词向量模型的词性标注方法和相应算法,该方法首先利用词向量的语义近似计算功能,扩展标注词典;其次结合语义近似计算和标注词典,完成词性标注。实验结果表明,该方法能够快速有效地扩大了标注词典规模,并能取得较好的标注结果。  相似文献   

7.
汉语语料词性标注自动校对方法的研究   总被引:6,自引:0,他引:6  
兼类词的词类排歧是汉语语料词性标注中的难点问题,它严重影响语料的词性标注质量。针对这一难点问题,本文提出了一种兼类词词性标注的自动校对方法。它利用数据挖掘的方法从正确标注的训练语料中挖掘获取有效信息,自动生成兼类词词性校对规则,并应用获取的规则实现对机器初始标注语料的自动校对,从而提高语料中兼类词的词性标注质量。分别对50万汉语语料做封闭测试和开放测试,结果显示,校对后语料的兼类词词性标注正确率分别可提高11.32%和5.97%。  相似文献   

8.
语料库词性标注一致性检查方法研究   总被引:4,自引:0,他引:4  
在对大规模语料库进行深加工时,保证词性标注的一致性已成为建设高质量语料库的首要问题。本文提出了基于聚类和分类的语料库词性标注一致性检查的新方法,该方法避开了以前一贯采用的规则或统计的方法,利用聚类和分类的思想,对范例进行聚类并求出阈值,对测试数据分类来确定其标注的正误,进而得出每篇文章的词性标注一致性情况,进一步保证大规模语料库标注的正确性。  相似文献   

9.
汉语词性标注方法的研究   总被引:4,自引:0,他引:4  
1 引言自然语言中,表达意义的符号(词)往往在各个层面上有歧义。在句法层面上,一个词可以兼好几种词性;在语义层面上,一个词可能有多个义项。词性歧义是由语言中的兼类词,即具有不止一个词性特征的词所引起的,只有在一定的上下文语境关系中,词所表现  相似文献   

10.
词性兼类是自动词性标注过程的关键所在,特别是确定未登录词词性的正确率对整个标注效果有很大的影响.对兼类词排歧方法进行了研究,针对统计和规则两种方法各自的优点和局限,提出运用隐马尔科夫模型和错误驱动学习方法相结合自动标注方法,最后介绍了如何通过这种方法在只有一个词库的有限条件下进行词性标注和未登录词的词性猜测.实验结果表明,该方法能有效提高未登录词词性标注的正确率.  相似文献   

11.
该文提出了一种基于粗糙集理论的控制规则自动生成方法。此方法在RSI引导算法基础上进行了改进,能够得到更精确的控制规则,这些规则即使在数据不完整、不精确的情况下也可以自动产生。通过对工程实例的分析,表明此方法是有效的。  相似文献   

12.
日语分词和词性标注是以日语为源语言的机器翻译等自然语言处理工作的第一步。该文提出了一种基于规则和统计的日语分词和词性标注方法,使用基于单一感知器的联合分词和词性标注算法作为基本框架,在其中加入了基于规则的词语的邻接属性作为特征。在小规模测试集上的实验结果表明,这种方法分词的F值达到了98.2%,分词加词性标注的F值达到了94.8%。该文所采用的方法已经成功应用到日汉机器翻译系统中。  相似文献   

13.
汉语自动分词和词性标注评测   总被引:6,自引:2,他引:6  
本文介绍了2003年“863中文与接口技术”汉语自动分词与词性标注一体化评测的一些基本情况,主要包括评测的内容、评测方法、测试试题的选择与产生、测试指标以及测试结果,并对参评系统的切分和标注错误进行了总结。文中着重介绍了测试中所采用的一种柔性化的自动测试方法,该方法在一定程度上克服了界定一个具体分词单位的困难。同时,对评测的结果进行了一些分析,对今后的评测提出了一些建议。  相似文献   

14.
粗糙集在神经网络中应用技术的研究   总被引:11,自引:0,他引:11  
通过对有关粗糙集与神经网络相结合的研究现状,关键技术和发展趋势进行分析,给出了一个三维应用框架,并介绍了粗糙集用于数据预处理、神经元设计和粗糙集用于神经网络结构设计几个方面的应用现状,并给出了粗糙集在神经网络中应用的关键技术。  相似文献   

15.
粗糙神经网络及其在中医智能诊断系统中的应用   总被引:7,自引:2,他引:5  
文章利用Rough Set技术对人工神经网络进行预处理,求取核属性,构造粗糙人工神经网络, 并应用到中医类风湿病分型诊断建模。计算机仿真结果证明了用Rough Set辅助设计人工神经网络,改善了网络的学习能力,并在实践取得了满意的效果。  相似文献   

16.
Collaborative Filtering (CF) is one of the popular methodology in recommender systems. It suffers from the data sparsity problem, recommendation inaccuracyand big-error in predictions. In this paper, the efficient advisory tool is implemented for the younger generation to choose their right career based on theirknowledge. It acquires the notions of indiscernible relation from Fuzzy Rough Sets Theory (FRST) and propose a novel algorithm named as Fuzzy RoughSet Theory Based Collaborative Filtering Algorithm (FRSTBCF). To evaluate the model, data is prepared using the cross validation method. Based on that,ratings are evaluated by calculating the MAE (mean average error), MSE (means squared error) and RMSE (root means squared error) values. Further thecorrectness of the model is measured by finding rates like Accuracy, Specificity, Sensitivity, Precision & False Positive Rate. The proposed FRSTBCF algorithmis compared with the traditional algorithms experiment results such as Item Based Collaborative Filtering using the cosine similarity (IBCF-COS), IBCF usingthe pearson correlation (IBCF-COR), IBCF using the Jaccard similarity (IBCF-JAC) and Singular Value Decomposition approximation (SVD). The proposedalgorithm gives better error rate and its precision value is comparatively identical with the existing system.  相似文献   

17.
基于语境的语义排歧方法   总被引:8,自引:2,他引:6  
本文针对英汉机器翻译系统(ECMT)中的语义排歧问题,提出了一种根据单词与语境之间的关系以消除单词语义歧义的模型。该模型利用反映单词之间语义共现关系的知识库词典,对有歧义的单词作出排歧。为提高知识库的覆盖率,本模型在对大量语料进行分析的基础上建立起单词语义分类之间的相关程度矩阵,同时采用动态链表来表示和维护语境,给出了寻找歧义单词的最可能的语义的排歧算法。开放测试的实验结果表明本方法使语义排歧的正确率提高约10%。  相似文献   

18.
As knowledge block in knowledge base is fuzzy and obtained randomly, we propose a random fuzzy rough set model based on random fuzzy sets and fuzzy logic operators. We give some properties of the random fuzzy rough set. We investigate the relationship between fuzzy measures defined by lower approximation and upper approximation of fuzzy set and fuzzy probability measures.  相似文献   

19.
当前大多数的聚类方法是针对单一属性类型的。要开发出能同时处理多种属性类型的聚类方法来适应当今大型的复杂数据库,这在现实应用中是至关重要的。本文提出了基于粗集和粒度思想的多属性类型的聚类算法。该算法能够满足同时处理混合属性的要求.以达到聚类的目的。此外,文中也通过一个具体实例来演示算法的可行性和有效性。结果表明,基于粗集和粒度思想的多属性类型的聚类算法简单有效、易于操作.而且能够清晰方便地对粒度结果进行分析。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号