首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
为实现网络上非领域相关的中文产品评论信息的搜索及结构化,设计并实现中文产品评论结构化引擎,该引擎通过抓取网络上指定产品的评论,抽取评论中的特征与意见,判断意见的极型,将评论以(特征,意见,极型)的结构化形式输出给用户。其中特征意见抽取解决了产品隐形特征抽取问题。实验结果表明该引擎的特征意见召回率与准确率、意见极型判断准确率等指标可以满足用户需要。  相似文献   

2.
中文句子评价对象抽取是指在中文句子中抽取评论所针对的对象或对象的属性。目前国内相关研究工作尚未能有效识别复合词评价对象和未登陆评价对象。针对以上两种情况,该文提出了一种基于层叠条件随机场的中文句子评价对象抽取方法。该方法首先通过低层条件随机场获得候选评价对象集,然后通过降噪模型对噪声进行过滤、补充模型对缺失的候选评价对象进行补充、合并模型对复合短语候选评价对象进行合并,最后由高层模型抽取出评价对象。实验结果显示,与基于线性链条件随机场的识别方法相比,该方法准确率、召回率和F1值分别提升1.62%、5.75%和4.17%,能有效地识别复合词评价对象和未登录评价对象,从而提高中文句子评价对象的识别精度。  相似文献   

3.
中文产品评论中属性词抽取方法研究   总被引:2,自引:0,他引:2       下载免费PDF全文
针对现有属性词抽取方法的准确率和覆盖率偏低问题,利用百度百科和分词后相邻词语同现比例识别专业领域生词,降低分词错误对属性词识别的影响,在中文产品评论语料中通过设计词性序列模板获得候选属性词集,该词性序列模板包含名词和名词短语模板、动词和动词短语模板,采用统计技术和自然语言处理技术筛选候选属性词。实验结果表明,对于3 623篇手机评论文章,利用该方法可获得1 732个属性词,准确率为0.565、召回率为0.726、调和平均值为0.636,具有较好的抽取性能。  相似文献   

4.
在电商网站评论文本中,评价对象和评价属性的缺省识别对文本情感分析具有重要地作用。针对电商网站评论文本中评价对象和评价属性缺省问题,该文提出了一种基于条件随机场的评价对象缺省项识别方法。首先利用情感词典识别观点句,将缺省项识别问题转换成序列标注问题,综合词法特征和依存句法特征,使用条件随机场模型进行训练,并在测试集上对待识别的观点句进行序列标注,通过标注结果判定缺省项的位置。实验结果表明,该方法具有较高的准确率和召回率,验证了该方法的有效性。  相似文献   

5.
针对情感词典构建中只反映了语言知识,缺乏语用知识的问题,提出了一种从真实语料中获取词语间的共现关系,并结合词语同义关系、语素特征进行中文褒贬词典半监督构建的方法。利用点互信息从语料中构建了情感词语和评价对象之间的相关性矩阵,采用非负矩阵分解的方法将其分解为情感词语之间的共现矩阵及新的情感词语-评价对象关系矩阵;将关系矩阵结合同义、语素特征,利用标签传播算法进行词语的褒贬分类。实验结果表明,在相同的数据集上该方法提高了只考虑语素和语义特征词典的准确率和召回率。  相似文献   

6.
国内电商网站的快速发展促使产生大量的中文商品评论信息。对这些评论进行情感分类有利于获取其中的有用信息,具有重要的应用意义。目前,情感分类的研究主要基于情感词典或者传统机器学习。这些方法通常需要人工选取特征,费事费力,分类效果不好。针对这些不足,本文提出一种基于注意力机制的双向LSTM模型,对中文商品评论进行情感分类。实验结果表明,该模型在中文商品评论二分类任务和三分类任务中均获得了较好的准确率、召回率、F1值。  相似文献   

7.
在线评论中特征抽取是产品意见挖掘的基础,直接影响到最终挖掘结果的准确性。针对现有特征抽取方法的准确率和召回率偏低问题,该文通过设计词性序列模板产生候选特征集,利用PMI-IR方法进行筛选,最终获得产品特征集。实验结果表明,该方法取得较好效果。  相似文献   

8.
随着互联网和电子商务的发展,用户在购买或使用商品之后会在网络站点上发表对产品的评论,大量的产品评论中所包含的丰富信息,可以为生产厂商和用户提供重要的决策依据。基于文本的语义和语言分析,提出了从产品评论中提取用户关注的产品特征的方法,并根据用户的关注程度对产品特征进行排序;同时,根据观点词的极性值判定用户对产品特征的情感倾向以及情感倾向强度。本研究采用从互联网上获得的针对笔记本电脑的产品评论作为实验对象,实验结果初步证明该方法具有良好的准确率和召回率。  相似文献   

9.
情感评价单元的抽取是情感分析的基础任务之一,目前大部分的抽取方法都基于句法路径等扁平化的特征,区分中文评价文本中噪声的能力不强。提出了一种基于短语句法的树型结构来表示情感评价单元模式,并使用近似卷积树核的方法来计算这种结构的相似度;在此基础上,采用基于相似度计算的模式匹配方法进行情感评价单元抽取。在中文商品评论上进行实验,该方法比基于句法路径的方法准确率提高了13.4%,召回率提高了9.2%。实验证明提出的方法对中文商品评价的情感评价单元抽取效果较好。  相似文献   

10.
随着深度学习的发展,神经网络在文本检测方面得到了更深入的研究和更广泛的应用。在此基础上,为了提升中文文本事件检各项性能,提出了一种基于改进神经网络的中文文本事件检测方法,研究利用FPA算法优化传统BP神经网络的权值和阈值。为了验证基于改进神经网络的中文文本事件检测方法的效果,将其与自然场景文本检测方法在召回率、准确率和耗时性等方面进行了比较。结果表明:自然场景文本检测方法的准确率为88%,召回率为73%;基于改进神经网络的文本检测方法准确率为95%,召回率为86%;中文文本事件检测测试中自然场景文本检测方法的F值为0.79,耗时4.56s;基于改进神经网络的文本检测方法的F值为0.90,耗时0.64s。可见,基于改进的神经网络的中文文本事件检测方法具有更好的性能。  相似文献   

11.
The development and application of an idea consolidation tool used in conjunction with idea generation software at the University of Arizona is described. The tool groups comments generated by meeting participants, based upon identical stemmed content keywords in each comment or idea. Results show that the tool groups comments in less than five percent of the time required by the current manual process and has nearly perfect recall and precision compared to the 82.6% recall and 73.1% precision of manual groupings.  相似文献   

12.
在线评论文本通常涉及多个评价对象,对象的表达方式有显式和隐式之分,针对不同对象的情感倾向可能不会完全一致.关键评价对象是评论中最受关注的对象,其相应的情感语义对整条评论的情感观点起主导作用.本文构建了融合关键对象识别与深层自注意力机制的Bi-LSTM模型,以提升短文本情感分类的效果.使用CNN处理文本,基于卷积层输出结果识别关键评价对象,并在此基础上完成深层自注意力的学习.将对象信息与文本信息进行融合,利用注意力机制强化的Bi-LSTM模型得到评论文本的情感分类结果.在酒店评论数据集上进行实验,与之前基于深度学习的模型相比,本文方法在精确率、召回率和F-score评价指标方面均有更好的表现.  相似文献   

13.
融合社交因素和评论文本卷积网络模型的汽车推荐研究   总被引:1,自引:0,他引:1  
汽车作为较高价值和个性化的消费品,使得用户购车决策过程较一般商品更为复杂.本文主要研究社交环境和评论文本两方面对用户购车决策过程的影响,提出了融合社交因素和评论文本卷积网络的汽车推荐模型(Social and comment text CNN model based automobile recommendation,SCTCMAR).SCTCMAR首先定义了基于购买用途需求的社交圈,在此基础上提出了个人偏好计算方法,并引入了偏好相似度;其次,设计了卷积网络模型学习汽车评论文本的隐特征;然后将社交影响量化因素和评论文本特征有机融合注入推荐模型,并采用低阶矩阵分解技术进行模型计算.另外,本文使用GloVe预训练词嵌入模型,产生了SCTCMAR的另一个版本SCTCMAR+.最后,将SCTCMAR、SCTCMAR、FMM(Flexible mixture model)、TR(Trust rank)、Random sampling在课题组爬取后经清理、去重和整合的266995个用户、702辆汽车信息的真实数据集上进行精确率、召回率和平均倒序排名三个指标的多粒度实验比较,结果表明本文提出的SCTCMAR+和SCTCMAR具有良好的推荐性能.  相似文献   

14.
针对当前方法难以获取评论文本全局情感倾向性的问题,提出一种基于潜在狄利克雷分布(LDA)模型的多文档情感摘要方法。该方法首先对给定的句子进行情感分析,抽取带有主观性评价的句子;然后,应用LDA模型表示已抽取的句子,并通过词汇的重要度和句子的特征计算句子的权重;最终提取情感文摘。实验结果表明,该方法能够有效地识别情感关键句,在准确率、召回率和F值上均有不错的效果。  相似文献   

15.
针对中文在线评论中产品属性词的提取,提出了一种基于互自扩展模式的半监督学习方法。利用较少的人工参与,通过FP-Growth算法挖掘频繁项集获得种子属性词,通过增量迭代发现新的属性词,在每一轮迭代中,通过计算提取词与提取模式的置信度,确保了算法的准确性,同时避免了主题偏移。最后通过相似提取模式获得复合提取词,大大减少了因分词及词性标注错误所导致的属性词挖掘错误,以牺牲较少准确率的代价换取了较高的召回率。实验结果表明:本文算法对产品属性提取的F值可以达到78.97%,结果优于文献中其它类似提取算法。  相似文献   

16.
针对目前微博推荐模型未考虑传播特征的问题,提出一种基于传播树的微博推荐模型。首先利用树结构对微博传播特征进行表示,由内容、时间和用户三方面特征构成树的节点,以微博的转发和评论关系作为树的边;然后基于节点间关联关系和层次关系分别计算待评估微博传播树与目标用户每棵微博传播树的传播路径相似度和传播层相似度,以此量化两棵传播树间的结构相似度;最后根据相似度大小对所有待评估微博进行排序,生成推荐列表,实现微博推荐。实验结果表明,与未考虑传播特征的微博推荐模型相比,该模型在准确率、召回率和F1值上分别提升13.0%、9.6%和10.7%,合理利用微博传播特征可以提升推荐结果的可靠性,增强用户体验感。  相似文献   

17.
为了解决协同过滤算法推荐精度低的问题,提出基于用户相似度和信任度的药品推荐算法。该方法通过离线使用DBSCAN算法对药品进行聚类来降低时间复杂度。引入共同评分药品阈值使用户相似度计算更准确,同时设置相似度阈值来限定相似性邻居的选取以克服KNN算法选取邻居的缺陷。根据用户的推荐可信度和评分可信度建立信任计算模型,计算基于相似邻居集的可信邻居集。通过两次邻居选择策略为目标用户产生药品推荐。仿真结果表明,该算法与其他算法相比在平均绝对误差、准确率和召回率上有更好的性能,提高了系统推荐精度。  相似文献   

18.
彩色直方图镜头分割中的阈值研究   总被引:2,自引:1,他引:1  
针对基于全局彩色直方图的镜头分割算法,研究其中五个参数:阈值、颜色空间子区间分割个数M、平均帧差、查全率和查准率之间的关系,设计了相应的计算方法,并在实验的基础上的对阈值与查全率和查准率的关系作了定性分析,揭示了5个参数之间的内在规律,对阈值和查全率的函数关系作了二次拟合,给出了一种满足查全率和查准率要求的阈值确定方法。  相似文献   

19.
Web预取性能指标准确率与查全率的关系   总被引:1,自引:0,他引:1       下载免费PDF全文
研究Web预取性能评价的2个重要指标(准确率与查全率)之间可能存在的关系,通过理论推导得出,两者的关系可以是相顺的,也可以是相逆的,采用真实Web服务器和代理服务器的日志进行性能实验。仿真实验结果表明,查全率依赖于准确率,即准确率的提高有利于查全率的提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号