排序方式: 共有11条查询结果,搜索用时 31 毫秒
1.
在注塑成型工业中,产品质量自动监测一直是注塑工业智能化发展的核心问题。高品质和大规模的产品质量数据采集成本高昂,导致数据样本量少、不同类别样本数据不平衡,为注塑产品质量预测提出了更高的挑战。为此,该文提出一种基于宽度学习方法的注塑产品质量预测模型,以产品的3维尺寸为预测目标,在普通的宽度学习系统(BLS)中加入最小p范数来改进得到模型p范数宽度学习系统(pN-BLS),解决小样本和不平衡数据的问题,提高模型对离群点的检测性能。在第4届工业大数据竞赛任务2《注塑成型工艺的虚拟量测和调机优化》数据集中,将192个参数特征与预测目标进行相关分析,提取相关性高的基础特征17个,衍生特征4个和调机参数2个作为模型的输入。将16600条数据平均分为训练集和测试集各8300条,与支持向量机 (SVM)、最近邻算法 (KNN)、多层感知机 (MLP)和BLS进行对比实验,实验结果显示pN-BLS具有更快速和更准确的预测效果。在实际缺陷检测应用中,pN-BLS能更准确地预测异常数据,具有更高的鲁棒性。 相似文献
2.
针对现有领域情感词典在情感和语义表达等方面的不足,提出一种基于词向量的领域情感词典构建方法。利用25万篇新闻语料和10万余条酒店评论数据,训练得到word2vec模型;选择80个情感明显、内容丰富、词性多样化的情感词作为种子词集;利用TF-IDF值在词汇重要程度的度量作用,在酒店评论中获得9 860个领域候选情感词汇;通过计算候选情感词与种子词的词向量之间的语义相似度,将情感词映射到高维向量空间,实现了情感词的特征向量表示(Senti2vec)。将Senti2vec应用于情感词极性分类和文本情感分析任务中,试验结果表明,Senti2vec能实现情感词的语义表示和情感表示;基于特定领域语料的语义相似计算,使得提取的情感特征更具有领域特性,同时不受候选情感词集范围的约束。 相似文献
3.
话题演进分析主要是挖掘话题内容随着时间流的演进情况。话题的内容可用关键词来表示。利用word2vec对75万篇新闻和微博文本进行训练,得到词向量模型。将文本流处理后输入模型,获得时间序列下所有词汇的词向量,利用K-means对词向量进行聚类,从而实现话题关键词的抽取。实验对比了基于PLSA和LDA主题模型下的话题抽取效果,发现本文的话题分析效果优于主题模型的方法。同时,采集足够大量、内容足够丰富的语料,可训练得到泛化能力比较强的模型,有利于实时话题演进分析研究工作。 相似文献
4.
中文文本情感词典构建方法 总被引:1,自引:0,他引:1
互联网海量文本的情感分析是当前的一个研究热点。介绍了一种中文文本情感词典构建方法,该方法选用若干个情感种子词,利用搜索引擎返回的共现数,通过改进的PMI(pointwise mutual information)算法计算情感词的情感权值。将构建的情感词典应用到文本情感分类实验中,在不同的语料环境下,对比基于情感词典和朴素贝叶斯分类器下的文本情感分类效果,实验结果表明,构建的情感词典,可有效用于情感特征选择和直接用于情感分类,并且分类性能稳定。 相似文献
5.
针对群体情绪演进分析中话题内容挖掘及其对应群体情绪分析两个层面的难题,提出了一种基于概率潜在语义分析(PLSA)模型的群体情绪演进分析方法。该方法首先利用PLSA模型抽取时间序列上的子话题,挖掘话题内容随时间的演进规律;再利用句法关系和情感本体库,抽取与话题内容相匹配群体情绪单元,计算情绪单元的强度,形成情绪特征向量;最后,对各子话题下的情绪强度进行求和,细粒度分析子话题和事件的整体群体情绪,深入挖掘群体情绪演进规律,并将群体情绪量化和可视化。在话题情绪单元抽取过程中,引入了句法规则和情感本体库,更细粒度地抽取情绪单元,并提高了话题内容与情绪单元匹配的准确性。实验结果表明,该模型能够实现话题内容及其群体情绪按时序特征的演进分析,验证了所提方法的有效性。 相似文献
6.
针对现有注塑产品缺陷故障原因排查与定位依靠专家人工诊断效率低、成本高昂等不足,本文提出了一种面向注塑产品缺陷的知识图谱构建方法及其应用,目的在于将专家知识采用知识图谱进行表示,利用基于知识图谱的垂直检索技术,解决故障排查和定位困难的问题.首先,文章基于多源异构的故障解决方案文本构建语料库,并构建知识本体模型.其次,采用面向非结构化文本的知识抽取模型,将产品缺陷的相关专家知识从原始语料中自动抽取出来.最后,利用Neo4j图数据库实现知识存储及可视化知识图谱的构建.在所构建的知识图谱中,探索并实现了知识智能搜索、故障诊断及工艺卡解析等应用,展示了知识图谱技术在注塑领域的良好应用前景. 相似文献
7.
针对现有情感特征在语义表达和领域拓展等方面的不足,提出了一种基于语义相似度的情感特征向量提取方法。利用25万篇sogou新闻语料和50万条微博语料,训练得到Word2vec模型;选择80个情感明显、内容丰富、词性多样化的情感词作为种子词集;通过计算候选情感词与种子词的词向量之间的语义相似度,将情感词映射到高维向量空间,实现了情感词的特征向量表示(Senti2vec)。将Senti2vec应用于情感近义词和反义词相似度分析、情感词极性分类和文本情感分析任务中,实验结果表明Senti2vec能实现情感词的语义表示和情感表示。基于大规模语料的语义相似计算,使得提取的情感特征更具有领域拓展性。 相似文献
8.
一种基于朴素贝叶斯的微博情感分类 总被引:1,自引:0,他引:1
本文基于二次情感特征提取算法,利用句法依存关系进行一次文本情感特征提取,在此基础上,利用情感词典,进行二次情感特征提取。构建朴素贝叶斯分类器,对采集的热门话题微博和酒店评论进行文本情感倾向性分类。主要比较了表情符号、标点符号,基于情感词典的特征提取和基于二次情感特征提取方法,在不同的组合下的分类性能,寻找更佳的微博文本情感分类预处理方法。并与酒店评论情感分类结果对比、分析,发现影响微博情感分类性能的原因。实验结果表明,二次特征提取方法在分类上取得更高的F1。实验最佳的分类预处理方式是"表情符号+标点符号+二次情感特征提取+BOOL值"。同时发现,朴素贝叶斯在酒店评论情感分类取得更高的分类性能,主要是微博评价对象多样化造成的。 相似文献
9.
中文微博情感词典构建方法 总被引:3,自引:2,他引:1
提出了一种中文微博情感词典构建方法。采用上下文熵的网络用语发现策略,通过TF IDF(term frequency inverse document frequency)进行二次过滤得到网络用语;利用SO PMI(semantic orientation pointwise mutual information)算法在已标注的微博语料库中计算网络用语的情感倾向值,构建网络用语情感词典;将词典应用到微博情感分类实验,并与朴素贝叶斯分类器的分类性能进行了比较分析。实验结果表明,直接利用微博情感词典的分类效果好于朴素贝叶斯分类器,并具有分类过程简单、快速等优势。 相似文献
10.