共查询到19条相似文献,搜索用时 93 毫秒
1.
2.
针对微博的情感倾向分析,提出了一种基于关键句分析的微博情感倾向性分析方法SOAS(Sentiment Orientation Analysis Based on Key Sentence Analysis),实现了从句子级到文档级的情感分析。首先,利用关键句抽取算法得到微博关键句,关键句抽取主要考虑位置属性、关键词属性和词频句子频特征这3类属性;之后,结合依存句法分析提出了影响情感倾向的7种词性搭配,以及针对这7种搭配,给出了6种情感计算规则,计算关键句的情感倾向值;最后,以关键句得分为权重,对所有关键句的情感倾向值加权求和得到微博的情感倾向。实现结果表明,基于关键句分析的微博情感倾向算法的情感分析,比同类算法的准确率高出了10.55%,提高了情感分析的准确率,具有高效性。 相似文献
3.
4.
5.
6.
基于CRF算法的汉语比较句识别和关系抽取* 总被引:5,自引:2,他引:5
比较句是表明事物之间关系的常见表达方式,对于文本挖掘,特别是情感分析,具有重要的价值。目前汉语比较句的研究还是一个新颖的课题,包括汉语比较句的识别和比较关系的抽取。对于汉语比较句的识别,在前人研究的基础上,以SVM为分类器,以特征词和CSR序列规则为特征,同时利用CRF算法抽取实体对象,并增加以实体对象的信息作为特征,显著提高了比较句识别的准确率、召回率和F-度量,最高分别达到96.55%、88.63%和92.43%。对于汉语比较关系的抽取,在CRF算法抽取实体对象的基础上,通过定义一些规则,抽取比较主体和比较基准,也取得了较好的效果,其中比较主体的抽取效果要好于比较基准。 相似文献
7.
汉语比较句识别研究 总被引:2,自引:0,他引:2
比较是常见的表达方式,提取事物之间的比较关系是一项新颖而有实用价值的研究。识别自然语言中的比较句,是提取比较关系的一个重要步骤。目前还没有针对汉语比较句的自动识别研究,语言学上比较句的哪些特征能够应用到自动识别上来是一个亟待研究的问题。该文讨论了汉语比较句的范畴、外延和特征,定义了汉语比较句识别的任务,并提出用SVM分类器将汉语句子分为“比较”和“非比较”两类。该文比较了比较句的语言学特征和统计特征,包括特征词、序列模式等在分类中的作用。实验结果表明:基于类序列规则的SVM分类器能够有效地识别汉语比较句,效果优于传统基于词的文本分类。 相似文献
8.
9.
10.
11.
该文主要研究如何自动识别微博中用户对各品牌汽车进行评价的句子。针对微博中汽车宣传信息较多而由真正汽车用户发出的观点句所占比例很小的特点,该文提出了结合微博和汽车评论语料的基于SVM模型的分类方法。选取的特征包括词语、评价词个数、与评价对象有关的词语以及微博相关特征。实验表明,评价词特征和部分微博相关特征可有效提高分类器性能,使用微博和汽车评论两种语料进行训练的分类器性能要比仅使用微博语料的方法好。 相似文献
12.
基于产品属性的条件句倾向性分析 总被引:1,自引:1,他引:0
该文主要识别产品评论中的条件句并分析其倾向性,判断评论者对产品属性持积极或是消极的态度。条件句中一般都含有条件连接词,但是有些条件句中没有条件连接词,称为隐式条件句。经过观察,发现隐式条件句中含有一些体现条件关系的词,称之为隐式条件词。识别条件句时,主要依据条件连接词和隐式条件词及其词性以及类序列规则进行分类;分析属性倾向性时,依据条件连接词和隐式条件词把条件句分为假设条件句、让步条件句、特定条件句和无条件句四类,并把条件句的类别用于SVM分类。通过实验证明了该方法有助于条件句倾向性分类。 相似文献
13.
当前,微博意见领袖识别的研究方法纷繁多样,常见的方法有:对用户的个性化特征进行综合分析的方法和基于社交网络结构的分析方法。这些方法大多只考虑了用户的特征,未考虑用户之间的互动行为,或者未考虑 微博文本的情感因素。为此,提出了一种基于微博情感分析的微博意见领袖识别方法。首先,在基于合成情感词典的词频统计结果的基础上,利用支持向量机对微博博文进行情感分析;然后,将变异系数法用于微博属性权重的计算,以体现微博的影响力;最后,利用改进的PageRank算法在微博用户转发关系网络中预测用户影响力的扩散过程,计算用户最终影响力的大小。在新浪微博数据集上通过实验评测该方法的性能,结果表明该方法能够有效提高识别性能。 相似文献
14.
意见领袖是社交网络和社交媒体中的重要节点,是信息传播的关键性因素。在QQ群聊天中由于参与用户较多,各种话题比较繁杂,因此识别其中的意见领袖比较困难。基于此提出一种基于应答关系来挖掘QQ群中意见领袖的方法,该方法首先构建回应词词库,然后基于Aho-Corasick算法来匹配聊天文本中的回应词数据,构建出用户应答关系的网络结构,最后使用社交网络中重要节点识别的方法来发现意见领袖。该方法对QQ群中的意见领袖发现具有较高的准确率,在融合QQ群用户交互社交网络的节点重要性特征后,能够达到更好的意见领袖发现效果。 相似文献
15.
倾向性句子识别是文本倾向性分析的重要组成部分,其目的是识别文档中具有情感倾向的主观性句子。中文句子的倾向性不仅与倾向词有关,而且还跟句法、语义等因素有关,这使得倾向性句子识别不能简单地从词语的倾向性来统计得到。该文提出了一种基于N-gram超核的中文倾向性句子识别分类算法。该算法基于句子的句法、语义等特征构造N-gram超核函数,并采用基于该超核函数的支持向量机分类器识别中文倾向性句子。实验结果表明,与多项式核、N-gram核等单核函数相比,基于N-gram超核的中文倾向性句子识别算法在一定程度上能有效识别倾向性句子。 相似文献
16.
Opinion target extraction is one of the core tasks in sentiment analysis on text data. In recent years, dependency parser–based approaches have been commonly studied for opinion target extraction. However, dependency parsers are limited by language and grammatical constraints. Therefore, in this work, a sequential pattern-based rule mining model, which does not have such constraints, is proposed for cross-domain opinion target extraction from product reviews in unknown domains. Thus, knowing the domain of reviews while extracting opinion targets becomes no longer a requirement. The proposed model also reveals the difference between the concepts of opinion target and aspect, which are commonly confused in the literature. The model consists of two stages. In the first stage, the aspects of reviews are extracted from the target domain using the rules automatically generated from source domains. The aspects are also transferred from the source domains to a target domain. Moreover, aspect pruning is applied to further improve the performance of aspect extraction. In the second stage, the opinion target is extracted among the aspects extracted at the former stage using the rules automatically generated for opinion target extraction. The proposed model was evaluated on several benchmark datasets in different domains and compared against the literature. The experimental results revealed that the opinion targets of the reviews in unknown domains can be extracted with higher accuracy than those of the previous works. 相似文献
17.
18.
中文比较句识别及比较关系抽取 总被引:1,自引:0,他引:1
比较是一种具有一定说服力的评估方式,利用机器进行比较句的识别以及比较关系的抽取可以对观点挖掘、信息推荐等应用提供重要的依据。该文通过构建中文比较模式库以实现中文比较句的自动识别。在此基础上,该文通过选取比较主体、比较客体及其上下文的词、词性、位置、语义以及比较属性的领域知识等特征,利用条件随机域模型进行中文比较关系抽取。实验结果表明,中文比较模式库的构建有助于比较句的自动识别,而在词、词性、位置等Baseline特征中融入语义、领域知识及启发式规则特征后,基于条件随机域的比较关系抽取结果有了显著的提高。 相似文献
19.
比较是人们常用的评估不同事物优劣、异同的表达方式,利用机器识别比较句并进一步抽取比较要素是语言信息处理领域一项新颖又有实用价值的课题。该文依据比较句与比较要素之间是一种“你中有我,我中有你”的共生关系,将比较句识别与比较要素抽取两个任务合二为一完成;根据词意分类,构建由领域词典、情感词典、标记词典、普通词典构成的词典系统;根据汉语比较句句义分类,构建比较句识别与比较要素抽取规则库。以第四届中文倾向性评测(COAE2012)发布的测试语料为实验对象,该系统取得了较好的实验(评测)结果。 相似文献