首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 109 毫秒
1.
为解决近年来使用依存分析等语法信息计算句子相似度存在的手工标注代价较大、自动标注准确率低影响性能等问题,结合现有的句子相似度算法,提出两种方法融合词性特征计算句子相似度。在高精度的自动词性标注基础上,方法一通过词性信息调整不同词性的单词对句子相似度的影响,方法二使用词性信息选择句子中较为关键的单词进行计算。对比实验中,方法一在实验任务中取得了最高的准确率,方法二具有较优的准确率和较快计算速度,实验结果表明了两种方法的有效性。  相似文献   

2.
为提高句子相似度的准确率,从结构相似度出发,提出基于词性及词性依存关系的句子结构相似度计算方法。该方法从正向和逆向比较句子的词性序列,获得2个句子词性及词性依存关系的最优匹配,从而计算句子结构相似度。实验结果表明,该方法能使句子结构相似度计算更合理。  相似文献   

3.
基于搭配模式的汉语词性标注规则的获取方法   总被引:2,自引:0,他引:2  
文章介绍了一种基于搭配模式的汉语词性标注规则的获取方法。该方法从已标注了词性的语料库中自动获取候选搭配模式规则,然后根据可信度从候选规则中选择出大于某阈值的规则,再通过不断测试新语料来完善规则。将获取的规则用于汉语的词性标注,使标注的正确率得到了明显提高。  相似文献   

4.
用规则抽取句子中事件信息   总被引:2,自引:0,他引:2  
信息抽取是数据挖掘的重要课题.目前的研究主要通过机器学习的方法对信息进行抽取.但是机器学习对训练数据的质量要求高,学习过程中参数设置复杂.而利用事先构建好的规则可以简单有效的从文本中提取事件信息.提出一种基于抽取规则对句子中的事件信息进行抽取的方法,摆脱了繁杂的机器学习过程.该方法利用本体对动词与事件角色匹配规则、事件角色抽取规则、时间信息抽取规则和地点信息抽取规则进行定义,用OWL对这些抽取规则进行了描述,然后应用这些规则抽取句子中的动词词义信息、事件角色信息、时间信息和地点信息,并用本文提出的一种新评测指标对事件信息进行评测.实验表明该方法从句子中抽取事件信息是有效的.  相似文献   

5.
卢伟胜  郭躬德  陈黎飞 《计算机应用》2014,34(10):2869-2873
传统的n-gram文本特征提取方法会产生高维度的特征向量,高维数据不但增大了分类的难度,同时也会增加分类的时间。针对这一问题,提出了一种基于词性(POS)标注序列的特征提取方法,根据词性序列能够代表一类文本的这一个特点,利用词性序列组作为文本的特征以达到降低特征维度的效果。在实验中,词性序列特征提取方法比n-gram特征提取方法至少提高了9%的分类精度,降低4816个维度。实验结果表明,该方法能够适用于微博情感分类。  相似文献   

6.
针对传统基于转换的词性标注方法中规则学习速度过慢的问题提出了一种对训练语料库进行动态划分的算法。该算法根据规则之间的冲突和依赖关系对训练语料库进行动态划分,减小了搜索空间。在保证拉丁蒙文词性标注正确率的前提下提高了规则学习速度。经过10000拉丁蒙文句子语料库的对比测试,发现该方法在规则学习中所花费的时间仅为原方法的32%。  相似文献   

7.
基于上下文依赖规则覆盖的句子生成   总被引:1,自引:0,他引:1  
基于规则覆盖的句子生成,是上下文无关文法句子生成的主要方法,但是它也具有局限性。最近提出的上下文依赖规则覆盖,能根据文法的内部结构不同而具有不同的分支集合,比规则覆盖的精度更高。目前,尚未见这种上下文依赖规则覆盖的句子生成算法。该文在规则覆盖的句子生成算法的基础上,实现一个基于上下文依赖规则覆盖的句子生成算法。该算法已在机器上实现并经过实验检验。  相似文献   

8.
长短期记忆网络(long short term memory,LSTM)是一种能长久储存序列信息的循环神经网络,在语言模型、语音识别、机器翻译等领域都得到了广泛的应用。先研究了前人如何将LSTM中的记忆模块拓展到语法树得到LSTM树结构网络模型,以获取和储存句子深层次的语义结构信息;然后针对句子词语间的极性转移在LSTM树结构网络模型中添加了极性转移信息提出了极性转移LSTM树结构网络模型,更好获取情感信息来进行句子分类。实验表明在Stanford sentiment tree-bank数据集上,提出的极性转移LSTM树结构网络模型的句子分类效果优于LSTM、递归神经网络等模型。  相似文献   

9.
多分类器组合是提高识别效果的一条有效途径。文中提出一种用于多分类器组合的改进贝叶斯规则,即首先通过对大量样本的统计获得有关每个分类器识别性能的先验知识,将其作为多分类器组合的依据。组合时对每个类设置不同的阈值,使组合效果得以改善,这些阈值可以通过训练获得。在数字识别中的应用结果表明,改进的贝叶斯规则可以使多分类器的组合结果识别率和置信度得到明显提高。  相似文献   

10.
研究了情感分析中情感词的识别、褒贬分析.情感词识别是根据词义并结合上下文判断这个词是否有情感倾向性.阐述了情感词识别和情感词极性判断的两种方法和技术.实验结果表明两种方法都得到了较好的效果.  相似文献   

11.
文中引入数理统计中“置信区间”的概念,提出并实现了一种基于“置信区间”评价函数的汉语词性纯概率标注算法.测试表明,本算法可以保证在具有一定召回率的同时,具有可界定的高的消歧率.当消歧率为94.8%时,召回率可达81.5%.  相似文献   

12.
用数据采掘方法获取汉语词性标注规则   总被引:8,自引:0,他引:8  
从数据采掘的角度对汉语文本词性标注规则的获取进行研究,在满足用户规定的支持度向量的前提下,先从侯选集模式中挑选出常用模式;然后采掘出具有高可信度的产生式规则。该过程完全是自动的,而获取的规则有表达上是明确的,同时又是隐含在数据中的、用户不易发现的,实验表明:在原有统计方法的基础上,利用自动获得的标注规则作为补充,可以提高词性标注的正确率。  相似文献   

13.
基于非监督训练的汉语词性标注的实验与分析   总被引:4,自引:0,他引:4  
概率参数的获取是基于统计的词性标注的两个主要研究方向之一.侧重于研究非监督方式,利用未标注的语料进行训练获取概率参数.实现了一个非监督的训练标注模式-HMM-Basic;从不同的初始模型和训练集出发对汉语词性标注进行了实验;分析了训练集规模、初始模型的选择对系统标注性能的影响并讨论了其中所存在的问题。  相似文献   

14.
李宏  徐晖 《信息与控制》1997,26(2):137-155
介绍了一种基于人工神经网络与证据理论相结合的空间点目标识别以及该方法珠结构,分析了该方法的性能,并用计算机仿真验证了该方法的强抗干扰性和鲁棒性。  相似文献   

15.
A story generation system based on dynamics of the mind is presented. Semantic theories until now avoided discussing a linkage of language with encyclopedic human knowledge. This paper attacks the problem of how to make clear the complicated, wide-ranging dynamics of the mind and how to connect it to language.
First, the background of this study is shown, in which our model of the mind, with both five levels along the concept formation process and eight domains according to the contents of mental activities, is surveyed.
Based on this model, then, the dynamics of mind are discussed, along an Aesop fable. A unit of data processing in the mind is called a "module," and the mental dynamics are considered as a chain activation of those modules, represented by a dynamic network. Next, a method for story generation is discussed. Propositional information of a sentence is embedded in a slot of activated, frame-structured modules, and the discourse structure of a generated story basically depends on the dynamic network. Both the chain activation and the generation processes are verified by experiments.
Lastly, residual problems of our research, a comparison with related research, and its applications are discussed.
This case study would be expected to give a basis to integrated systems for problem solving, natural language and image understandings, their generations, and intelligent robots.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号