期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

綦方中田宇阳《计算机应用与软件》2023,(7):71-76+90

通过主题模型对酒店评论文本进行文本挖掘,有利于引导酒店管理者和客户对评论信息做出合适的鉴别和判断。提出一种基于预训练的BERT语言模型与LDA主题聚类相结合的方法;利用中文维基百科语料库训练BERT模型并从中获取文本向量,基于深度学习算法对评论文本进行情感分类;通过LDA模型对分类后的文本进行主题聚类,分别获取不同情感极性文本的特征主题词,进而挖掘出酒店客户最为关注的问题,并对酒店管理者提出具有参考价值的建议。实验结果表明,通过BERT模型获取的文本向量在情感分类任务中表现较好,且BERT-LDA文本挖掘方法能使酒店评论文本的主题更具表达性。相似文献

2.

基于FCM聚类的多超球体一类分类数字图像隐藏信息检测

下载免费PDF全文

戴蒙林家骏刘云翔《中国图象图形学报》2008,13(10)

从净图角度出发,提出了以BMP、JPEG净图特征为基础,采用FCM聚类的多超球体一类分类的隐藏信息检测技术。该技术针对同一类样本的特征存在着部分差异的特点,先将净图样本进行模糊C均值聚类,再将该样本的各子类样本特征输入一类SVM分类器进行训练,建立净图样本各子类的超球体分类模型,以此解决净图检测正确率低的问题。实验结果表明,该方法具有一定的通用性和泛化能力,减少了虚警率和漏检率。相似文献

3.

基于FCM聚类的多超球体一类分类

下载免费PDF全文

戴蒙林家骏刘云翔《中国图象图形学报》2008,13(10):1918-1921

从净图角度出发,提出了以BMP、JPEG净图特征为基础,采用FCM聚类的多超球体一类分类的隐藏信息检测技术。该技术针对同一类样本的特征存在着部分差异的特点,先将净图样本进行模糊C均值聚类,再将该样本的各子类样本特征输入一类SVM分类器进行训练,建立净图样本各子类的超球体分类模型,以此解决净图检测正确率低的问题。实验结果表明,该方法具有一定的通用性和泛化能力,减少了虚警率和漏检率。相似文献

4.

基于LDA—加权Word2Vec组合的机器学习情感分类模型研究

陈登建杜飞霞吴瑞雪杨秀璋夏换《现代计算机》2022,(18):16-22

为解决社交媒体用户发布评论文本过长,导致情感倾向不明确,情感特征分布离散,传统情感分类模型缺乏上下文语义分析,提取情感特征不准确,分类精准率较低的难题,提出一种主题模型与词向量组合特征（LDA-Word2Vec）的情感分类模型。通过LDA主题模型对长评论文本进行特征提取,构建所有主题下的特征词库;借助特征词库构建长评论的LDA特征表达;利用CBOW训练得到特征表达后文本的词向量表示,使用TF-IDF对词向量进行加权并融合语义特征,再构建机器学习模型对长评论文本进行情感分类的方法,研究了机器学习情感分类模型。实验结果表明：相较于传统的文本特征表示方法,本文提出的LDA-Word2Vec组合特征的方法,在情感分类的准确率与召回率的表现上都更加优秀。可见本文的模型能够进一步挖掘文本的情感特征,具有一定学术意义和现实意义。相似文献

5.

基于可穿戴传感器的行为识别随机逼近模型

高蕾 ;曹建忠《微机发展》2014,(12):83-87

为了使分类器能够在某个强度级别的行为样本集上训练而在其他强度级别上正确分类行为,提出了行为识别的随机逼近模型。在训练阶段从加速度计的时间序列数据提取特征,然后将特征送入聚类算法。数据依据行为聚类,聚类的均值和方差组合成相对应的SAM。在识别随机行为阶段,测试样本和每种行为类别的SAM进行比较。利用聚类算法和随机逼近给每种行为创建模型,然后使用启发式随机逼近最近邻方法来对行为进行分类。在实验中结合k-均值和高斯混合模型两种聚类算法,验证了提出的随机逼近模型的性能优于其他几种流行的行为分类方案。相似文献

6.

Mixed-Fisher特征云模型聚类在文本情感分类中的应用

《计算机科学与探索》2016,(9):1320-1331

海量网络信息的出现,使得提取文本信息情感观点成为研究的热点。针对文本情感分类中文本信息模糊及分类准确率低的问题,提出了一种基于Mixed-Fisher特征选择的文本云向量模型聚类算法。该算法首先分别计算文档中各个词性特征项的Fisher判别比,根据Fisher判别比越大特征向量判别性越强的Fisher准则,选择Fisher比值较大的前q个特征,并按照词性进行组合生成文档的Mixed-Fisher特征向量。然后在Mixed-Fisher特征向量集上构建文档的云向量模型,根据云向量模型间的差异度对模型进行聚类和合并。将该算法应用于文本情感观点的分类,选择核Fisher判别技术用于最终文本观点的判定。仿真实验结果表明,基于Mixed-Fisher特征的云向量聚类模型的分类准确率明显优于传统向量空间模型,从而验证了核Fisher判别技术的有效性。相似文献

7.

结合LDA与Self-Attention的短文本情感分类方法

下载免费PDF全文

陈欢黄勃朱翌民俞雷余宇新《计算机工程与应用》2020,56(18):165-170

在对短文本进行情感分类任务的过程中,由于文本长度过短导致数据稀疏,降低了分类任务的准确率。针对这个问题,提出了一种基于潜在狄利克雷分布（LDA）与Self-Attention的短文本情感分类方法。使用LDA获得每个评论的主题词分布作为该条评论信息的扩展,将扩展信息和原评论文本一起输入到word2vec模型,进行词向量训练,使得该评论文本在高维向量空间实现同一主题的聚类,使用Self-Attention进行动态权重分配并进行分类。通过在谭松波酒店评论数据集上的实验表明,该算法与当前主流的短文本分类情感算法相比,有效地提高了分类性能。相似文献

8.

基于主题相似性聚类的自适应文本分类

康雁杨其越李浩梁文韬李晋源崔国荣王沛尧《计算机工程》2020,46(3):93-98

传统的文本分类方法仅使用一种模型进行分类,容易忽略不同类别特征词出现交叉的情况,影响分类性能。为提高文本分类的准确率,提出基于主题相似性聚类的文本分类算法。通过CHI和WordCount相结合的方法提取类特征词,利用K-means算法进行聚类并提取簇特征词构成簇特征词库。在此基础上,通过Adaptive Strategy算法自适应地选择fasttext、TextCNN或RCNN模型进行分类,得到最终分类结果。在AG News数据集上的实验结果表明,该算法可较好地解决不同类别特征词交叉的问题,与单独使用的fasttext、TextCNN、RCNN模型相比,其文本分类性能显著提升。相似文献

9.

基于多特征融合的抽象画情感研究

白茹意郭小英贾春花《计算机应用研究》2021,38(2):587-590

抽象画作为一种寓意含蓄的艺术作品,传递出的情感也是含蓄的,确定其情感分类也比较困难,为此采用多特征融合方式预测抽象画的情感。首先采用K-means聚类提取抽象画图像的主色调作为底层颜色特征,采用灰度—梯度共生矩阵提取底层纹理特征,采用卷积神经网络自动提取高层语义特征;其次由于特征维度不同,采用多核学习对底层和高级语义特征进行融合;最后采用支持向量机实现抽象画情感识别,分为积极与消极两类。在MART数据集上进行测试,并与其他现有分类模型进行了比较,实验结果显示该方法在测试性能上优于已有模型。相似文献

10.

面向短文本情感分类的端到端对抗变分贝叶斯方法

尹春勇章荪《计算机应用》2020,40(9):2536-2542

针对文本情感分析中文本过短而导致的分类准确度低的问题,结合对抗学习和变分推断提出一种端到端的短文本情感分类模型。首先,使用谱规范化技术解决了判别器在训练过程中的震荡问题;然后,添加额外的分类模型来指导推断模型的更新;其次,使用对抗变分贝叶斯（AVB）模型提取短文本的主题特征;最后,使用三次注意力机制来融合主题特征与预训练词向量特征进行分类。通过在一个产品评论和两个微博数据集上的实验结果证明,所提模型较基于自注意力的双向长短期记忆网络（BiLSTM-SA）在分类准确度上分别提高了2.9、2.2和8.4个百分点。由此可见,该模型适用于挖掘社交短文本中的情感和观点信息,对舆情发现、用户反馈、质量监督和其他相关领域具有重要的意义。相似文献