首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
评价对象抽取主要用于文本的意见挖掘,旨在发掘评论文本中的评价对象实体。基于无监督的自编码器方法可以识别评论语料库中潜藏的主题信息,且无需人工标注语料,但自编码器抽取的评价对象缺乏多样性。提出一种基于监督学习的句子级分类任务和无监督学习自编码器混合模型。该模型通过训练一个分类器生成评价对象类别,对自编码器共享分类任务中的LSTM-Attention结构进行编码得到句向量表征,以增加语义关联度,根据得到的评价对象类别将句向量表征转化为中间层语义向量,从而捕捉到评价对象类别与评价对象之间的相关性,提高编码器的编码能力,最终通过对句向量的重构进行解码得到评价对象矩阵,并依据计算评价对象矩阵与句中单词的余弦相似度完成评价对象的抽取。在多领域评论语料库上的实验结果表明,与k-means、LocLDA等方法相比,该方法评价指标在餐厅领域中提升了3.7%,在酒店领域中提升了2.1%,可有效解决训练过程缺少评价类别多样性的问题,具有较好的评价对象抽取能力。  相似文献   

2.
一种基于生语料的领域词典生成方法   总被引:7,自引:0,他引:7  
为了实现准确分词,实用的汉语信息处理系统都需有其专用的领域词典.针对现有词典构造方法存在的不足,本文提出了一种领域词典的构造方法;利用通用词典对领域生语料进行分词处理,并提出了基于切分单元的最大匹配算法,从而得到候选词串集,然后利用规则对其进行优化,最终生成领域词典.词典的生成过程基本上是自动完成的,人工干预少,易于更新;目前.本方法生成的领域词典已经应用于我们自主开发的“基于Web的智能答疑系统”中,并取得了较好的效果.  相似文献   

3.
微博情感分析是对微博内容进行细粒度的挖掘,有着重要的研究价值。微博评价对象的抽取是微博情感分析研究的关键问题之一。为了提高中文微博评价对象抽取的准确率,该文在中文微博特征分析和微博评论本体构建研究的基础上,尝试从词、词性、情感词以及本体四个方面进行特征选择,采用CRFs模型对评价对象进行抽取。该文将提出的方法运用到COAE2014测评的Task5评价对象抽取任务中,宏平均准确率达到61.20%,在所有测评队伍中居第一。实验结果表明,将本体特征引入到CRFs模型中,能够有效地提高评价对象抽取的准确率。  相似文献   

4.
文摘生成系统中词典的一种构造方法   总被引:1,自引:1,他引:0  
文章讨论了针对文摘生成系统如何有效地建立一种全信息词典,在正确进行自动分词的同时,为后续的文本分析提供尽可能多的词法、词义及词用信息,以便生成具有理解能力的高质量的文本摘要。  相似文献   

5.
评价词和评价对象抽取在意见挖掘中是一个重要的任务,我们在句子级评价词和评价对象联合抽取任务上研究了长短时记忆(long short-term memory)神经网络模型的几种变种应用。长短时记忆神经网络模型是一种循环神经网络模型,该模型使用长短时记忆模型单元作为循环神经网络的记忆单元,它能够获得更多的长距离上下文信息,同时避免了普通循环神经网络的梯度消失和梯度爆炸的问题。我们对比了传统的方法,实验结果证明长短时记忆神经网络模型优于以前的方法,在细粒度评价词和评价对象的联合抽取中达到更好的性能。  相似文献   

6.
细粒度意见挖掘的主要目标是从观点文本中获取情感要素并判断情感倾向。现有方法大多基于序列标注模型,但很少利用情感词典资源。该文提出一种基于领域情感词典特征表示的细粒度意见挖掘方法,使用领域情感词典在观点文本上构建特征表示并将其加入序列标注模型的输入部分。首先构建一份新的电商领域情感词典,然后在电商评论文本真实数据上,分别为条件随机场(CRF)和双向长短期记忆-条件随机场(BiLSTM-CRF)这两种常用序列标注模型设计基于领域情感词典的特征表示。实验结果表明,基于电商领域情感词典的特征表示方法在两种模型上都取得了良好的效果,并且超过其他情感词典。  相似文献   

7.
通过描述Web服务的领域特征,开发者可以复用领域模型进行Web服务的组装.如何从抽象的领域模型中得到具体的服务组装模型成为当前研究的热点之一.本文提出一种基于领域语义的、在逻辑和物理两个层次进行Web服务组装的方法在逻辑层次上,把领域模型转化成由通用服务构成的通用服务组装模型;在物理层次上,完成从抽象的通用服务组装模型到具体的组装实现模型的转化.该方法使得两个层次的细化分工明确,充分体现了复用的思想,也使Web服务组装更加有效.  相似文献   

8.
随着互联网的不断普及,针对各种产品的评论也不断增多,这些评论中所包含的丰富信息,对制造商和消费者都极具分析价值.只有正确分析评价对象,意见挖掘的结果才会准确可信.在总结前人成果的基础上,针对网络上的客户评论,提出了一种新的评价对象抽取方法.该方法是基于ICTParser的句法分析与IR的依存关系分析的联合,采用似然值检...  相似文献   

9.
一种新闻评论情感词典的构建方法   总被引:2,自引:0,他引:2  
情感词典研究是文本情感分析领域的一个重要内容;基于情感词典的文本情感分析方法是一种非常有效的方法。互联网上的新闻评论包含评论人的情感,对其情感进行自动分析研究是非常有意义的。借鉴图排序模型的原理,提出一种新闻评论情感词典构建方法,该方法首先通过新闻评论语料和基础情感词典获得评论情感词集和种子词,然后根据提出的基于PageRank算法的方法判定评论情感词集的极性并计算其强度,进而构建新闻评论情感词典。实验从情感词判定的准确性和基于构建的情感词典的分类性能两个方面验证了所提方法的有效性。  相似文献   

10.
基于浅层句法特征的评价对象抽取研究   总被引:3,自引:1,他引:2  
徐冰  赵铁军  王山雨  郑德权 《自动化学报》2011,37(10):1241-1247
随着网络评论文本数量的快速增长,文本情感分析越来越受到研究者的广泛关注. 句子级文本情感分析就是对主观性文本进行细粒度的挖掘,有重要的研究价值. 评论句中的评价对象抽取是句子级情感分析要研究的关键问题之一. 为了提高评价对象抽取的性能,本文提出在系统模型的训练过程中引入浅层句法信息和启发式位置信息,同时在不增加领域词典的情况下, 有效提高系统的精确率.实验结果表明,将本文提出的特征引入到条件随机域模型和对比模型后,系统的各项指标均有所提高, 并且条件随机域模型的结果优于对比模型.同时,将条件随机域模型的结果与2008年国内中文评测的最大值比较,其F值超过最大值 5%.  相似文献   

11.
《计算机工程》2017,(4):222-227
现有的评价对象抽取方法多基于启发式规则或者基于词性、词形等特征的机器学习方法,未能较好地利用依存分析所揭示出的深层句法关联关系。为此,基于从依存关系树库所挖掘的频繁树模式,提出一种针对中文评论性短文本的评价对象抽取方法。该方法基于依存关系频繁子树模式进行短文本的初始标注,采用错误驱动框架的方法提炼出能反映评价对象特征的频繁子树模式有序模式规则集,并利用该规则集进行评价对象的抽取。实验结果表明,该方法具有较好的稳定性与准确性,在召回率和F1值等评价指标上优于基于支持向量机的方法。  相似文献   

12.
建筑图中参数化描述的语法分析方法   总被引:5,自引:0,他引:5  
表格式建筑结构图是参数化描述的一种形态。在对这一类结构图的工程量自动统计时必须分析表格的结构与含义。该文从常见的建筑图表格入手,提出了一种有效的语法分析方法。  相似文献   

13.
In this paper we establish the relationship between the syntax and semantics of a fuzzy temporal constraint logic (FTCL) proposed by Cárdenas et al. FTCL enables us to express interrelated events by means of fuzzy temporal constraints. Moreover, it provides a resolution principle for performing inferences which take these constraints into account. FTCL is compatible with the theoretical temporal reasoning model proposed by Marín et al. – the Fuzzy Temporal Constraint Networks (FTCN). The main contributions of this paper are, on the one hand, the proofs of the FTCL-deduction and the FTCL-refutation theorems, and, on the other, the proof of the soundness of the refutation by resolution in this formal system, together with an exhaustive study of its completeness.  相似文献   

14.
中文评价对象与评价词抽取是文本倾向性分析的重要问题.如何利用评价对象与评价词之间的语法、共现等关系设计模型是提高抽取精度的关键.本文提出了一种基于多层关系图模型的中文评价对象与评价词抽取方法.该方法首先利用词对齐模型抽取评价对象与评价词搭配;然后,考虑评价对象与评价词的依存句法关系、评价对象内部的共现关系和评价词内部的共现关系,建立多层情感关系图,接着利用随机游走方法计算候选评价对象与评价词的置信度;最后,选取置信度高的候选评价对象与评价词作为输出.实验结果表明,与现有的方法相比,本文所提出的方法不仅对评价对象和评价词的抽取精度均有显著提升,而且具有良好的鲁棒性.  相似文献   

15.
张鹏程  李必信  李雯睿 《软件学报》2010,21(11):2752-2767
为了表示事件出现的时间约束,扩展属性序列图为时间属性序列图,使其继承属性序列图的优点,并且能够表示时间属性,定义了时间属性序列图的形式语法,并给出基于时间Büchi自动机的形式操作语义;用实时规约模式度量了时间属性序列图的表达力。最后,对时间属性序列图进行了实例研究,显示了其广泛的应用前景。  相似文献   

16.
罗年洁  吕钊 《计算机工程》2014,(12):57-62,67
领域概念分类体系自动构建在人工智能、自然语言处理和信息检索等领域具有重要作用,但现有研究较多关注通用知识,面向特定领域的研究较少,且存在领域概念间关系抽取准确率以及自动构建算法效率较低等问题。为此,提出一种混合的领域概念分类体系自动构建算法,该算法主要包括领域概念间关系抽取模块和分类体系构建模块。领域概念间关系抽取模块设计考虑中文自身的特点,采取句法树和基于规则相结合的方法,以提高抽取领域概念间关系的查准率和查全率;分类体系构建模块设计采取改进的BRT算法,从而在降低算法复杂度的同时,提高领域分类体系构建的查准率。在通信、金融和计算机领域的实验结果均表明,与BRT算法相比,该算法的构建效果较好,查准率最高可达到89.3%。  相似文献   

17.
准确的模式识别要求提取出的特征尽可能反映分类本质的特征.本文利用同态分析理论对水下声信号进行预处理,从最终接收到经过噪声干扰的目标信号中复原出能反映目标传输特性的原始信号,并在此基础上对信号进行离散小波变换,提取小波变换系数在不同区间上的尺度—过零密度、尺度—平均幅度特征,最终利用组合核函数支持向量机对提取出的特征进行分类识别.实验表明,提取出的特征能反映目标类别特点,该方法能对水下目标进行有效的识别.  相似文献   

18.
基于混合阈值法的Envisat影像水体提取   总被引:2,自引:0,他引:2  
李智慧  陈秀万  罗鹏  许玉斌  李颖 《遥感信息》2013,28(2):62-65,69
图像分割是图像目标识别和提取的重要步骤。然而由于SAR影像相干成像特点,SAR影像往往信噪比不高,于是传统的图像处理方法难以适用。本文在分析当前主流的阈值法图像分割的基础上,提出一种改进的混合阈值法:首先对影像按一维最大类间方差法求解出一维最佳阈值,以此计算图像分割水体和背景的权重比,然后根据求得的权重比,修改二维最大熵算法,最后采纳遗传算法提高搜索效率,进而求解二维最优阈值实现SAR影像水体提取。为了验证此方法的有效性,针对阳澄湖地区Envisat ASAR影像中同时存在信噪比高的区域和信噪比低的区域设计了仿真实验。实验结果表明,改进方法能较好地从信噪比低的影像中提取水体,同时保持良好的时间复杂度。  相似文献   

19.
提出一种按照计算域分解的并行化方法来构建等几何分析的刚度矩阵和右侧向量.将计算域分解成为若干个不相交的子区域,然后为每个区域分配一个处理器,所有处理器并行进行子区域上面的计算,所有处理器完成子区域的计算以后,使用一个快速的归并算法完成线性系统的装配.实验表明,本文提出的方法在8核的机器上可以达到6.46的加速比,能够在4秒左右的时间计算680万个矩阵元素个数.使用Intel MKL稀疏求解器来求解线性系统,本文的等几何分析求解器能够在大约10秒的时间内求解52万的自由度,本文的方法比ISOGAT速度要快上万倍.  相似文献   

20.
在对中文网络文本进行情感分析时,情感词典的完备性以及好坏对情感分析的效果有着至关重要的影响.虽然已经有了几个通用的中文情感词典,但是现实生活中电影领域有自身特有的领域词汇、领域词语的特殊使用方式等,现有的几个情感词典若用在电影评论的情感分析中使用,往往效果不佳.现今还没有学者发布行业认可的、官方的可用于分析电影评论的领...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号