排序方式: 共有37条查询结果,搜索用时 31 毫秒
1.
领域概念分类体系自动构建在人工智能、自然语言处理和信息检索等领域具有重要作用,但现有研究较多关注通用知识,面向特定领域的研究较少,且存在领域概念间关系抽取准确率以及自动构建算法效率较低等问题。为此,提出一种混合的领域概念分类体系自动构建算法,该算法主要包括领域概念间关系抽取模块和分类体系构建模块。领域概念间关系抽取模块设计考虑中文自身的特点,采取句法树和基于规则相结合的方法,以提高抽取领域概念间关系的查准率和查全率;分类体系构建模块设计采取改进的BRT算法,从而在降低算法复杂度的同时,提高领域分类体系构建的查准率。在通信、金融和计算机领域的实验结果均表明,与BRT算法相比,该算法的构建效果较好,查准率最高可达到89.3%。 相似文献
2.
3.
在LEE等人提出的端到端指代消解模型基础上,考虑中文行文特点,提出一种融合结构化信息的中文指代消解模型。压缩文档中所进行有句子对应的成分句法树并获取文档压缩树叶节点深度,采用成分句法树的结构化嵌入(SECT)方法将结构信息进行向量化处理,将词性、文档压缩树叶节点深度与SECT信息作为3个特征向量引入模型中进行中文指代消解。在CoNLL2012数据集中的测试结果表明,通过结合上述3个特征,可使该模型的中文指代消解性能得到有效提高,其平均F_1值可达62.33%,较基准模型提升5.28%。 相似文献
4.
基于语料库句法结构分析的动态规划模型 总被引:1,自引:0,他引:1
语料库方法在性标注上获得了较大的成功,但句法分析中仍存在许多问题,针对句法分析方法的不足,文中给出了一个基于语料库的动态规划分析模型。 相似文献
5.
句法分析的研究是自然语言处理领域的一个重要组成部分。本文提出并实现了一个基于二元关系的句法树生成算法。该算法通过引入二元关系的优先级概念,巧妙借鉴了算术表达式的求解方法,从根本上解决了句法树生成过程中的层次问题。通过对大量的真实文本进行实验,结果表明,该算法是正确的,且具有较高的分析效率。 相似文献
6.
源语言和目标语言的句法异构性对统计机器翻译(SMT)性能有重要影响。在基于短语的汉英统计机器翻译基础上,提出了一种基于N-best句法知识增强的源语言预调序方法。首先对源语言输入句子进行N-best句法分析,计算统计概率得到高可靠性子树结构,再根据词对齐信息从可靠性子树结构中抽取初始调序规则集。两种优化策略用于对初始规则集进行优化:基于中英文句法知识规则推导筛选和规则概率阈值控制机制。然后为减少短语内部调序,保证短语局部流利性,采用源语言短语翻译表为约束,使调序控制在短语块之间进行。最后根据获取的优化规则集和短语表约束条件对源语言端句子的句法分析树进行预调序。在基于NIST 2005和2008测试数据集上的汉英统计机器翻译实验结果表明,所提基于N-best句法知识增强的统计机器翻译预调序方法相对于基线系统,自动评价准则BLEU得分分别提高了0.68和0.83。 相似文献
7.
针对现代藏语句法,在参照宾大中文树库的基础上,构建藏语短语句法树库,并建立了树库编辑工具,为藏汉机器翻译服务。在短语句法树库的基础上,提出一种融合藏语句法特征的藏汉机器翻译方法。实验分析结果表明,该方法可以很好地应用于藏汉机器翻译系统。 相似文献
8.
9.
10.
介绍了一个机器翻译辅助开发平台MTDevStudio中的部分关键技术,包括模型定义、句法树操作的实现、语料库规则提取与统计分析、翻译引擎的评测等,重点对基于规则的机器翻译的辅助开发实现进行了介绍。该平台有利于减少机器翻译过程中的大量重复性工作,使研究者致力于自然语言理解的核心理论研究。与其它辅助工具相比,该平台致力于集成机器翻译涉及到的全面工作,用户可以自定义机器翻译模型,可扩展性好,并由机器翻译专家实际参与使用、评价,取得了不错的效果。 相似文献