共查询到10条相似文献,搜索用时 15 毫秒
1.
网页在线评论的情感分类关系到个人决策、企业管理甚至社会安全。提出了一种基于直觉模糊推理的情感分类方法,通过样本库的学习将特征在分类时的不确定性分别用隶属度、非隶属度、犹豫度定量地描述,同时定量地考虑程度副词、转折词、否定词对表达情感的作用,然后通过对特征的直觉模糊信息的集结,按词组、句子、文本三个级别依次合其情感倾向,得到文本的情感倾向。在对公开语料库的比较实验中证明了该方法的正确性和分类性能。 相似文献
2.
随着电子商务,个人博客,社交网站和微博的蓬勃发展,互联网进入了一个崭新的时代,而在线评论的情感分类关系到个人决策、企业管理甚至社会安全.提出了一种基于区间直觉模糊的情感分类模型,采用了区间直觉模糊算子来计算特征词的区间直觉模糊数,利用区间直觉模糊集的隶属度、非隶属度和犹豫度分别定量地描述特征词,通过情感合成确定文本的情感倾向,从而获得准确率较高的情感倾向性分析结果.最后通过相同语料库的比较实验证明该分类模型的可行性、正确性和较高的分类性能. 相似文献
3.
提出了基于赋权粗糙隶属度的文本情感分类方法.该方法将特征倾向强度引入到文本的向量空间表示法中,建立了基于二元组属性(特征,特征倾向强度)的文本表示模型.提出了基于情感倾向强度序的属性离散化方法,将特征选择寓于离散化过程,达到数据降维的目的.利用特征倾向强度,定义了赋权粗糙隶属度,用于新文本的情感分类.在真实汽车评论语料上,与支持向量机分类模型进行比较实验表明,基于赋权粗糙隶属度的文本情感分类方法在对数据进行一定程度的压缩后仍表现出较好的分类性能. 相似文献
4.
5.
6.
基于相似性进行文本分类是当前流行的文本处理方法。基于特征隶属度的文本分类相似性度量方法旨在利用特征与文档间的隶属关系度量文档相似性,从而实现文本分类。该方法基于特征与文档的隶属关系,对特征进行全隶属、偏隶属和无隶属词集划分,并基于3种隶属词集定义隶属度函数。全隶属词集隶属于两篇文档,隶属度随权差增大而降低;偏隶属词集仅隶属于其中某一篇文档,隶属度为一个定值;无隶属词集与两篇文档无隶属关系,隶属度为零。在度量相似性时,偏隶属关系高于全隶属关系。由于同类文档词集相近,异类文档词集差异明显,因此,基于特征与文档的隶属度进行相似性度量,可清晰界定词集与类别的隶属关系,提升分类精度。最后,采用数据集20-Newgroups和Reuters-21578对分类有效性进行验证,结果表明基于特征隶属度的相似性度量方法的性能优于目前流行的相似性度量方法。 相似文献
7.
8.
考虑到中文评价文本的整体情感倾向性与其表达的情感顺序有很大关系,且在具有情感倾向的中文文本中,越是靠近文本最后所表达的情感倾向,对于整个文本的情感分类影响越大。因此对于情感倾向表达不明显或者表达不单一的短文本,通过考虑文本中情感节点出现的顺序以及情感转折同化来对文本进行情感分类。在来自某购物网站爬取的中评评价文本数据集上的实验结果显示,提出的分类方法明显高于单纯基于词特征的支持向量机(SVM)分类器。 相似文献
9.
该文针对网络评论倾向分级问题,提出了一种基于观点袋模型和语言学规则的多级情感分类方法。通过分析句子中的词性搭配关系,设计了12种抽取特征-观点搭配模式,并对存在问题给出了解决策略。依据汉语用词特点和词汇在汽车领域的特殊用法,提出搭配四元组的情感倾向极性值计算方法。在此基础上,利用获取的搭配四元组及其情感倾向极性,建立文本的向量化表示,并构造了权重计算公式。最后,利用文本余弦相似度计算方法实现对评论文本的五级情感极性分类。通过在COAE2012任务3的汽车数据集上进行的测试,取得了较好的分类结果。 相似文献