首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   14篇
  免费   0篇
一般工业技术   1篇
自动化技术   13篇
  2022年   4篇
  2021年   2篇
  2020年   1篇
  2019年   1篇
  2018年   1篇
  2017年   2篇
  2014年   1篇
  2007年   1篇
  2005年   1篇
排序方式: 共有14条查询结果,搜索用时 31 毫秒
1.
问题自动生成是自然语言处理领域的一个研究热点,旨在从文本中生成自然问句。随着电子商务的不断发展,网络上产生了大量关于产品的评论。面对海量的评价信息,如何快速挖掘产品信息相关的关键评价,从而生成与产品各个层面息息相关的问答数据具有极大的研究价值,这对商家和顾客都具有极大的意义。现有的问题生成模型大多针对阅读理解类型等长文本语料,采用端到端序列化生成模型。然而,针对基于产品评论等短文本的问题生成任务,现有的模型无法将用户和商家重点关注的商品特性纳入学习过程。为了使生成的问题更加符合商品的特性,文中提出了基于产品建模的评论问题生成模型,通过与产品属性识别进行联合学习训练,使模型在解码层面加强了对特征信息的关注。与现有的问题生成模型相比,该模型不仅能解决产品数据口语化严重的问题,还能加强产品属性的识别能力,从而使生成的问题更加具体,更符合商品的特征。文中在京东与亚马逊产品评论数据集上同时进行实验,结果表明,在基于评论等短文本生成问题的任务上,与目前已有的问题生成模型相比,所提模型取得了较大的性能提升。基于中文京东数据集的实验中,所提模型的BLEU值提升了3.26%,ROUGE值提升了2.33%;基于英文亚马逊数据集的实验中,所提模型的BLEU值提升了2.01%,ROUGE值提升了2.10%。  相似文献   
2.
神经机器翻译系统的良好性能依赖于大规模内领域双语平行数据,当特定领域数据稀疏或不存在时,领域适应是个很好的解决办法。无监督领域适应方法通过构建伪平行语料来微调预训练的翻译模型,然而现有的方法没有充分考虑语言的语义、情感等特性,导致目标领域的翻译包含大量的错误和噪声,从而影响到模型的跨领域性能。为缓解这一问题,从模型和数据2个方面来提高伪平行句对的质量,以提高模型的领域自适应能力。首先,提出更加合理的预训练策略来学习外领域数据更为通用的文本表示,增强模型的泛化能力,同时提高内领域的译文准确性;然后,融合句子的情感信息进行后验筛选,进一步改善伪语料的质量。实验表明,该方法在中-英与英-中实验上比强基线系统反向翻译的BLEU值分别提高了1.25和 1.38,可以有效地提高翻译效果。  相似文献   
3.
神经机器翻译领域中多层神经网络结构能够显著提升翻译效果,但是多层神经网络结构存在信息传递的退化问题。为了缓解这一问题,提出了层间和子层间信息融合传递增强的方法,增强多层神经网络的层与层之间信息传递的能力。通过引入“保留门”机制来控制融合信息的传递权重,将融合信息与当前层的输出信息连接共同作为下一层的输入,使得信息传递更加充分。在目前最先进的多层神经网络Transformer上进行相关的实验,在中英和德英翻译任务上的实验结果表明,该信息传递增强方法相比于基线系统,BLEU得分分别提高了0.66和0.42。  相似文献   
4.
统计机器翻译一般采用启发式方法训练翻译模型。但启发式方法的理论基础不够完善,因此,会导致翻译模型规模庞大以及模型参数精确率不高。针对以上两个问题,该文提出一种基于变分贝叶斯推理的模型训练方法,形成更精确的精简翻译模型。该方法首先通过强制解码对齐语料,然后利用变分贝叶斯EM算法获得模型参数。该文的实验语料为NIST汉英翻译任务数据,实验结果显示,基于句法(基于短语)的统计机器翻译中,超过95%(76%)的规则被剪枝,且BLEU值显著提高。  相似文献   
5.
蔡鹏飞  李扬波  段湘煜  孙挺 《包装工程》2017,38(19):206-212
目的为了解决当前因图像匹配算法主要依靠提取图像的特征属性矢量进行度量,从而利用其对应的相关系数最大的点进行匹配时导致匹配结果中存在较多的错误匹配点以及匹配误差变大的问题。方法提出区域灰度分布耦合相似判定策略的图像匹配算法,首先利用Forstner算子来提取图像的特征点,以特征点为中心,采取建立极坐标系的方法来确定特征点的主方向,通过特征点邻域的灰度特征来生成低维度的特征描述子;然后引入归一化互相(NCC)函数对特征点之间的相似度进行评估,建立矩形窗口特征点双向匹配规则,完成特征点的匹配,以提高特征点之间的匹配准确度和算法鲁棒性;最后,根据正确匹配特征点组成的三角形具有相似性的特征,设计相似判定策略,对错误匹配点进行剔除,以改善匹配精度。结果实验结果表明,与当前图像匹配技术相比,文中匹配算法具有更高的匹配精度与效率,有效降低了特征点的误匹配率。结论所提图像匹配技术具有较高的配准精度,在图像伪造、包装条码识别等领域具有一定的应用价值。  相似文献   
6.
问答式检索技术及评测研究综述   总被引:18,自引:3,他引:18  
问答式检索系统(简称问答系统) 是集自然语言处理技术和信息检索技术于一身的新一代搜索引擎。它的出现旨在提供更有力的信息获取工具,以应对信息爆炸带来的严重挑战。经过这几年的发展,问答系统已经成为自然语言处理领域和信息检索领域的一个重要分支和新兴的研究热点,其“通过系统化、大规模地定量评测推动研究向前发展”的发展轨迹,以及某些成功的启示,如基于字符表层的文本分析技术(模板技术) 的有效性,快速、浅层自然语言处理技术的必要性,都极大地推动了自然语言处理研究的发展,促进了NLP研究与应用的紧密结合。回顾问答系统研究的历史,总结问答技术的研究现状,将有助于这方面工作向前发展。  相似文献   
7.
当今句子摘要研究主要针对单语,即源端句子和目标端摘要短语属于同种语言,然而单语句子摘要严重制约了不同语言文本信息的快速获取。为解决该问题,提出一种跨语言句子摘要系统。借鉴回译思想,将单语句子摘要平行语料中的源端通过神经机器翻译系统翻译成另一种语言,将其与句子摘要平行语料中目标端的摘要短语共同构成跨语言的伪平行语料。在此基础上,利用对比注意力机制,实现目标端与源端序列中不相关信息的获取,解决了传统注意力机制中源端和目标端句子长度不匹配的问题。实验结果表明,与基于管道方法的单语句子摘要系统相比,该跨语言系统生成的摘要短语更流畅且符合人类语言表述方式,可达到接近单语的句子摘要水平。  相似文献   
8.
基于动作建模的中文依存句法分析   总被引:1,自引:0,他引:1  
决策式依存句法分析,也就是基于分析动作的句法分析方法,常常被认为是一种高效的分析算法,但是它的性能稍低于一些更复杂的句法分析模型。本文将决策式句法分析同产生式、判别式句法分析这些复杂模型做了比较,试验数据采用宾州中文树库。结果显示,对于中文依存句法分析,决策式句法分析在性能上好于产生式和判别式句法分析。更进一步,我们观察到决策式句法分析是一种贪婪的算法,它在每个分析步骤只挑选最有可能的分析动作而丢失了对整句话依存分析的全局视角。基于此,我们提出了两种模型用来对句法分析动作进行建模以避免原决策式依存分析方法的贪婪性。试验结果显示,基于动作建模的依存分析模型在性能上好于原决策式依存分析方法,同时保持了较低的时间复杂度。  相似文献   
9.
汪琪  段湘煜 《计算机科学》2018,45(11):226-230
现有神经机器翻译模型普遍采用的注意力机制是基于单词级别的,文中通过在注意力机制上执行多层卷积,从而将注意力机制从基于单词的级别提高到基于短语的级别。经过卷积操作后的注意力信息将愈加明显地体现出短语结构性,并被用于生成新的上下文向量,从而将新生成的上下文向量融入到神经机器翻译框架中。在大规模的中-英测试数据集上的实验结果表明,基于注意力卷积的神经机翻译模型能够很好地捕获语句中的短语结构信息,增强翻译词前后的上下文依赖关系,优化上下文向量,提高机器翻译的性能。  相似文献   
10.
近年来,神经机器翻译的译文质量取得了显著的进步,但是其在训练过程中严重依赖平行的双语句子对。然而对于电子商务领域来说,平行资源是稀缺的,此外,文化的不同导致产品信息表达存在风格差异。为了解决这两个问题,提出了一种基于风格感知的无监督领域适应算法,该算法在互训练方法中充分利用电子商务单语数据,同时引入拟知识蒸馏的方法处理风格差异。通过获取电商产品数据信息构建非平行双语语料,基于该语料以及中英新闻平行语料进行多组实验,结果表明,相比各种无监督领域适应方法,该算法显著提高了翻译质量,较最强的基线系统提高了约5个BLEU点。此外,将该算法在Ted, Law和Medical OPUS 3类数据上进一步拓展应用,均取得了更佳的翻译效果。  相似文献   
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号