期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	2篇
免费	0篇

专业分类

自动化技术

2篇

出版年

2023年	1篇
2021年	1篇

排序方式： 共有2条查询结果，搜索用时 15 毫秒

融合文本特征的汉老双语句子相似度计算方法

谭琪辉周兰江刘畅《中文信息学报》2021,35(10):64-72

双语句子相似度旨在计算不同语言句子间的语义相似程度,在信息检索、平行语料库构建、机器翻译等领域有重要作用。由于汉语、老挝语平行语料稀少,且老挝语在语义表达、句子结构上与汉语有明显差异,导致汉老双语句子相似度研究的难度较大。该文提出了一种融合文本特征的汉老双语句子相似度计算方法,并构建了句子相似度模型。首先,在句子相似度模型中将汉语、老挝语的词性、数字共现等文本特征与GloVe预训练词向量融合,以此丰富句子特征,提升模型计算准确率。其次,由基于自注意力的双向长短时记忆网络组成多层孪生网络来提取长距离上下文特征和深层次语义信息,其中自注意力机制可以保证语义信息的有效利用。最后,采用迁移学习的方法将通用模型参数初始化,并使用不同的微调参策略增强模型的泛化能力。实验表明,该文提出的方法,其召回率、准确率和F₁值分别达到了82.5%、85.78%和84.00%。相似文献

融合语义信息的汉老双语句子对齐方法

谭琪辉周兰江张建安《中文信息学报》2023,(1):79-87

双语句子对齐能够为机器翻译、信息检索等跨语言领域任务提供高质量的平行语料，在低资源的老挝语自然语言处理研究中显得尤为重要。由于汉老双语文本中存在非单调对齐(交叉对齐和空对齐)的情况，容易影响汉老句子对齐的效果。此外，人名、地名作为新闻要素，大多属于未登录词，也给汉老句子对齐研究增加了难度。该文提出了一种融合局部和全局语义信息的汉老双语句子对齐方法。首先，将汉老双语句长特征和人名地名特征融入Glove词向量，然后利用双向门控循环单元对特征词向量进行编码，以得到更细粒度的句子局部信息。其次，引入交互注意力机制，提取双语句子中的全局信息，保证对上下文语义特征的有效利用。最后，在多层感知机的基础上引入KM算法，该方法可以处理非单调对齐文本，提高模型的泛化能力。实验结果表明，该方法显著提高了汉老双语新闻语料的对齐性能。相似文献