期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

林江豪周咏梅阳爱民陈锦《山东大学学报(工学版)》2018,48(3):40-47

针对现有领域情感词典在情感和语义表达等方面的不足,提出一种基于词向量的领域情感词典构建方法。利用25万篇新闻语料和10万余条酒店评论数据,训练得到word2vec模型;选择80个情感明显、内容丰富、词性多样化的情感词作为种子词集;利用TF-IDF值在词汇重要程度的度量作用,在酒店评论中获得9 860个领域候选情感词汇;通过计算候选情感词与种子词的词向量之间的语义相似度,将情感词映射到高维向量空间,实现了情感词的特征向量表示(Senti2vec)。将Senti2vec应用于情感词极性分类和文本情感分析任务中,试验结果表明,Senti2vec能实现情感词的语义表示和情感表示;基于特定领域语料的语义相似计算,使得提取的情感特征更具有领域特性,同时不受候选情感词集范围的约束。相似文献

2.

基于宽度学习的注塑产品质量预测方法

林江豪吴宗泽李嘉俊谢胜利《电子与信息学报》2022,44(5):1581-1590

在注塑成型工业中,产品质量自动监测一直是注塑工业智能化发展的核心问题。高品质和大规模的产品质量数据采集成本高昂,导致数据样本量少、不同类别样本数据不平衡,为注塑产品质量预测提出了更高的挑战。为此,该文提出一种基于宽度学习方法的注塑产品质量预测模型,以产品的3维尺寸为预测目标,在普通的宽度学习系统(BLS)中加入最小p范数来改进得到模型p范数宽度学习系统(pN-BLS),解决小样本和不平衡数据的问题,提高模型对离群点的检测性能。在第4届工业大数据竞赛任务2《注塑成型工艺的虚拟量测和调机优化》数据集中,将192个参数特征与预测目标进行相关分析,提取相关性高的基础特征17个,衍生特征4个和调机参数2个作为模型的输入。将16600条数据平均分为训练集和测试集各8300条,与支持向量机 (SVM)、最近邻算法 (KNN)、多层感知机 (MLP)和BLS进行对比实验,实验结果显示pN-BLS具有更快速和更准确的预测效果。在实际缺陷检测应用中,pN-BLS能更准确地预测异常数据,具有更高的鲁棒性。相似文献

3.

结合词向量和聚类算法的新闻评论话题演进分析

林江豪周咏梅阳爱民王伟《计算机工程与科学》2016,38(11):2368-2374

话题演进分析主要是挖掘话题内容随着时间流的演进情况。话题的内容可用关键词来表示。利用word2vec对75万篇新闻和微博文本进行训练,得到词向量模型。将文本流处理后输入模型,获得时间序列下所有词汇的词向量,利用K-means对词向量进行聚类,从而实现话题关键词的抽取。实验对比了基于PLSA和LDA主题模型下的话题抽取效果,发现本文的话题分析效果优于主题模型的方法。同时,采集足够大量、内容足够丰富的语料,可训练得到泛化能力比较强的模型,有利于实时话题演进分析研究工作。相似文献

4.

基于概率潜在语义分析的群体情绪演进分析

林江豪周咏梅阳爱民陈昱宏陈晓帆《计算机应用》2015,35(10):2747-2751

针对群体情绪演进分析中话题内容挖掘及其对应群体情绪分析两个层面的难题,提出了一种基于概率潜在语义分析(PLSA)模型的群体情绪演进分析方法。该方法首先利用PLSA模型抽取时间序列上的子话题,挖掘话题内容随时间的演进规律;再利用句法关系和情感本体库,抽取与话题内容相匹配群体情绪单元,计算情绪单元的强度,形成情绪特征向量;最后,对各子话题下的情绪强度进行求和,细粒度分析子话题和事件的整体群体情绪,深入挖掘群体情绪演进规律,并将群体情绪量化和可视化。在话题情绪单元抽取过程中,引入了句法规则和情感本体库,更细粒度地抽取情绪单元,并提高了话题内容与情绪单元匹配的准确性。实验结果表明,该模型能够实现话题内容及其群体情绪按时序特征的演进分析,验证了所提方法的有效性。相似文献

5.

中文文本情感词典构建方法 总被引：1，自引：0，他引：1

阳爱民林江豪周咏梅《计算机科学与探索》2013,(11)

互联网海量文本的情感分析是当前的一个研究热点。介绍了一种中文文本情感词典构建方法,该方法选用若干个情感种子词,利用搜索引擎返回的共现数,通过改进的PMI（pointwise mutual information）算法计算情感词的情感权值。将构建的情感词典应用到文本情感分类实验中,在不同的语料环境下,对比基于情感词典和朴素贝叶斯分类器下的文本情感分类效果,实验结果表明,构建的情感词典,可有效用于情感特征选择和直接用于情感分类,并且分类性能稳定。相似文献

6.

基于语义相似度的情感特征向量提取方法

林江豪周咏梅阳爱民陈锦《计算机科学》2017,44(10):296-301

针对现有情感特征在语义表达和领域拓展等方面的不足,提出了一种基于语义相似度的情感特征向量提取方法。利用25万篇sogou新闻语料和50万条微博语料,训练得到Word2vec模型;选择80个情感明显、内容丰富、词性多样化的情感词作为种子词集;通过计算候选情感词与种子词的词向量之间的语义相似度,将情感词映射到高维向量空间,实现了情感词的特征向量表示(Senti2vec)。将Senti2vec应用于情感近义词和反义词相似度分析、情感词极性分类和文本情感分析任务中,实验结果表明Senti2vec能实现情感词的语义表示和情感表示。基于大规模语料的语义相似计算,使得提取的情感特征更具有领域拓展性。相似文献

7.

中文微博情感词典构建方法 总被引：3，自引：2，他引：1

周咏梅阳爱民林江豪《山东大学学报(工学版)》2014,44(3):36-40

提出了一种中文微博情感词典构建方法。采用上下文熵的网络用语发现策略,通过TF-IDF(term frequencyinverse document frequency)进行二次过滤得到网络用语;利用SO-PMI(semantic orientation-pointwise mutual information)算法在已标注的微博语料库中计算网络用语的情感倾向值,构建网络用语情感词典;将词典应用到微博情感分类实验,并与朴素贝叶斯分类器的分类性能进行了比较分析。实验结果表明,直接利用微博情感词典的分类效果好于朴素贝叶斯分类器,并具有分类过程简单、快速等优势。相似文献

8.

一种基于朴素贝叶斯的微博情感分类 总被引：1，自引：0，他引：1

林江豪阳爱民周咏梅陈锦蔡泽键《计算机工程与科学》2012,34(9):160-165

本文基于二次情感特征提取算法,利用句法依存关系进行一次文本情感特征提取,在此基础上,利用情感词典,进行二次情感特征提取。构建朴素贝叶斯分类器,对采集的热门话题微博和酒店评论进行文本情感倾向性分类。主要比较了表情符号、标点符号,基于情感词典的特征提取和基于二次情感特征提取方法,在不同的组合下的分类性能,寻找更佳的微博文本情感分类预处理方法。并与酒店评论情感分类结果对比、分析,发现影响微博情感分类性能的原因。实验结果表明,二次特征提取方法在分类上取得更高的F1。实验最佳的分类预处理方式是"表情符号+标点符号+二次情感特征提取+BOOL值"。同时发现,朴素贝叶斯在酒店评论情感分类取得更高的分类性能,主要是微博评价对象多样化造成的。相似文献

9.

基于主题聚类的短文本情绪分类方法

林江豪顾也力周咏梅阳爱民陈锦《计算机与数字工程》2020,48(6):1400-1404,1439

相似文献

10.

基于PLSA的新闻评论情绪类别自动标注方法

下载免费PDF全文

林江豪顾也力周咏梅阳爱民《计算机系统应用》2019,28(1):207-211

针对大规模语料手动标注困难的问题，提出利用概率潜在语义分析（PLSA）模型的新闻评论自动标注方法.利用PLSA计算获得语料集的"文档-主题"和"词语-主题"概率矩阵；基于情感本体库和"词语-主题"概率矩阵，认为某一类情绪词汇出现的概率最高的主题与词汇的情绪类别相同，对主题进行情绪类别标注；最后，基于"文档-主题"概率矩阵，认为出现在某一主题概率最高的文档与主题的情绪类别相同，通过"词汇-主题-文档"三者的关系，达到自动标注的效果.实验结果表明，本文提出的方法准确率可达到90%以上. 相似文献