首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 49 毫秒
1.
该文介绍了一个新的汉英词语对齐规范。该规范以现有的LDC汉英词语对齐规范为基础,对其进行了较大的改进和扩展,特别是提出了一种全新的对齐标注方法 —— 将词语对齐区分为真对齐和伪对齐,真对齐又分为强对齐和弱对齐。这种细化的标注方法能够更好地刻画词语对齐的特点。该规范已经实际应用于大规模的人工词语对齐标注中。我们对对齐标注的一致性进行了评价。结果表明,在该规范的指导下,标注者内部和标注者间的对齐都取得了比较理想的一致性,两组强、弱、伪三种对齐的Kappa值分别为0.99、0.98、0.93 和0.96、0.83、0.68。最后,一个简单的实验初步证实了该规范在统计机器翻译中的有效性。  相似文献   

2.
神经机器翻译是目前机器翻译领域的主流方法,拥有足够数量的双语平行语料是训练出一个好的翻译模型的前提。双语句对齐技术作为一种从不同语言端单语语料中获取双语平行句对的技术,因此得到广泛的研究。该文首先简单介绍句对齐任务及其相应的评测标准,然后归纳总结前人在句对齐任务上的研究进展,以及句对齐任务的相关信息,并简单概括参加团队所提交的系统,最后对当前工作进行总结并展望未来的工作。  相似文献   

3.
中文Office2000以功能强大、设置灵活、智能化程度高而著称。我在经常使用的Word2000和PowerPoint2000中发现,Word2000常用工具栏中没有“左对齐”的按钮,PowerPoint2000则没有“两端对齐”的按钮。想从“添加或删除  相似文献   

4.
龚慧敏  段湘煜  张民 《计算机科学》2017,44(12):216-220, 238
词对齐是统计机器翻译系统的重要一环,但词对齐的获得往往基于序列模型的计算,而没有考虑语言的结构化信息及语言特征,从而造成词对齐中出现一些不符合语言特征的结果。文中提出一种词对齐的自纠正机制,以纠正词对齐中的错误部分。该机制使用一些语言学上的先验知识,对词对齐结果进行由粗颗粒度到细颗粒度的纠正。首先采用基于标点的方法对句对进行粗粒度化纠正,然后采用基于统计特征的方法对子句对进行细粒度化纠正。该自纠正过程不需要借助任何其他词对齐工具和新语料。实验结果显示,自纠正词对齐显著提高了词对齐的准确率,并提高了机器翻译的质量,其中粗粒度的纠正方法对翻译质量的提高最为显著,细粒度的纠正方法也提升了翻译质量,最终通过结合粗颗粒度和细颗粒度的纠正方法,使翻译结果相对基准系统取得了显著的提高。  相似文献   

5.
车超  刘迪 《计算机工程》2022,48(3):74-80
实体对齐表示在不同的知识图谱中查找引用相同现实身份的实体。目前主流的基于图嵌入的实体对齐方法中的对齐实体通常具有相似的属性,有效利用属性信息可提升实体对齐效果,同时由于不同知识图谱之间的知识分布差异,仅考虑单个方向的对齐预测会导致预测结果出现偏差。针对上述问题,提出一种改进的跨语言实体对齐方法。利用融合属性信息的双向对齐图卷积网络模型,将前馈神经网络编码实体对应的属性信息与初始的实体嵌入相结合,得到联合属性信息的实体表示,并使用双向对齐机制实现跨语言的实体对齐预测。在3个跨语言数据集上的实验结果表明,该方法通过融合更多的知识图谱信息增强了实体表示能力,并且利用双向对齐机制缓解了数据分布差异问题,相比基于图嵌入的实体对齐方法整体性能更优。  相似文献   

6.
Word6.0、Word7.0,为格式化页面提供了多种对齐操作,这些对齐操作分别适用不同的环境,产生不同的对齐效果。区分各种对齐方法的适用范围,理解各操作的对齐效果,是熟练使用对齐操作的关键,也是页面格式化的重要内容。为此,我们根据对齐操作参照的对象,在这里,把Word的对齐技术归纳为:页边距对齐、缩进对齐、断行符对齐、制表位对齐四种。  相似文献   

7.
很多财务人员在使用Excel制作财务报表的时候,都希望报表的表格列表数字按小数点对齐,这种排列方式比较直观,也不容易出错误。在Excel 下实现非常简单: 1.选中工作表中所需的单元格区域。2.在“格式”菜单中,单击“单元格”命令。  相似文献   

8.
在编辑Word文档中的表格时,如果含有小数点的数据太多,视觉上总觉得比较杂乱,若能将小数点对齐,不仅清爽整洁,而且也容易对数据进行对比。那么,我们就用“制表符”来将小数点对苑  相似文献   

9.
为了进一步加强电脑与电信领域的对外科技合作与交流,本刊与中国驻外使领事馆以及国外相关机构建立信息共享机制,从2008年第1期开始,定期发布国外最新的项目研发动态。如有兴趣者,请与本刊联系。  相似文献   

10.
本文目的:教大家如何利用表格精确对齐文字。  相似文献   

11.
默认设置下,WORD会使文本两端对齐,有时就会在单词间插入长段的空白,使该行显得很不美观(图1)。按Ctrl+L组合键可使段落左对齐,但问题并没有解决,第一行行尾留有很长空白,各行尾依然参差不齐(图2)。这是因为默认情况下,Word不会将西文单词在中间断开,当行尾已经显示不下一个单词时会提前换行,将这个单词在下行显示。正确的解决方法是:依次打开“格式”→“段落”→“中文版式”,勾选“允许西文在单词中部断字”(这里是Word2000,其它版本可能略有不同)。这样Word就不再强制单词的完整性,而是逐字符填满整行(图3)。这样又产生了一个新问题…  相似文献   

12.
双语语料对齐是自然语言处理的一个重要研究课题。对双语平行语料库的研究工作主要有构建、对齐和标注等方面,其中研究不同级别的对齐技术是一个重要的中心课题,对齐不仅是进一步利用平行语料库获取一些语言知识的必要前提.也是机器翻译系统利用双语知识的重要前期处理。重点介绍典型的句子对齐方法,并总结出每种方法的优缺点,具体分析了汉维双语句子对齐的方法。  相似文献   

13.
Word2000“水平标尺”左上端有一个“标记按钮”,单击它可以循环显示各种标记,包括两个缩进符和五个制表符(鼠标在按钮上停留片刻即可显示制表符类型说明)。如果需要实现图Ⅰ所示的左对齐效果,其设置方法是: 1.选择制表符类型为  相似文献   

14.
在试卷、调查问卷中,如何让选择题中各个选项自动对齐?使用查找与替换功能,老大难问题瞬间轻松搞定,这里以Word 2007为例进行说明。现在试卷中A、B、C、D四个选项无法对齐(见题图),因为在录入时人为加入了空格,有时“A、”前也被加入空格。如果题量较少,可通过空格键手工调整,但选择项之间可能混杂中英文,存在全角和半角问题,因此需要反复调整才行。  相似文献   

15.
多策略汉维句子对齐   总被引:2,自引:0,他引:2  
提出了一种错误抑制的多策略算法对齐汉维语句子。针对长度对齐算法无法避免错误蔓延的特点,提出了一种新的错误蔓延抑制策略:利用双语语料的词汇共现信息,自动抽取汉维语词汇搭配,结合句子长度特征,寻找1:1模式的句对作为锚点,将错误蔓延抑制在锚点内;在锚点之间,利用标点符号和长度混合方法进行句子对齐。算法实验结果验证了该多策略算法寻找的锚点的精度高,有效抑制了对齐错误的蔓延;采用的混合对齐算法,避免了基于词汇对齐算法的高时间复杂度的弱点,比传统的对齐算法性能有了较大提高,对齐准确率由95.0%提高到97.6%,召回率由96.8%提高到98.2%,采用的对齐正确性评价算法可以有效发现自动对齐中的噪音对齐。  相似文献   

16.
提出了一种混合算法对齐汉维句子,不需要汉语分词、词性标注预处理,利用双语语料的词汇共现信息,自动抽取汉维语词汇搭配,作为基于词汇对齐的词典,并结合基于长度的方法进行句子对齐,实验结果验证了该混合算法的有效性,汉维语句子对齐的正确率和召回率,达到了97.5%和97.1%。  相似文献   

17.
无监督句对齐在自然语言处理领域是一个重要而具有挑战性的问题。该任务旨在找到不同语言中句子的对应关系,为跨语言信息检索、机器翻译等应用提供基础支持。该综述从方法、挑战和应用3个方面概括了无监督句对齐的研究现状。在方法方面,无监督句对齐涵盖了多种方法,包括基于多语言嵌入、聚类和自监督或者生成模型等。然而,无监督句对齐面临着多样性、语言差异和领域适应等挑战。语言的多义性和差异性使得句对齐变得复杂,尤其在低资源语言中更为明显。尽管面临挑战,无监督句对齐在跨语言信息检索、机器翻译、多语言信息聚合等领域具有重要应用。通过无监督句对齐,可以将不同语言中的信息整合,提升信息检索的效果。同时,该领域的研究也在不断推动技术的创新和发展,为实现更准确和稳健的无监督句对齐提供了契机。  相似文献   

18.
很多朋友在用Photoshop对齐对象的时候可能会拉根辅助线然后手动拖放,这样实在是太费神。其实在Photoshop6.0/7.0 里本身就有对齐功能,只要点点鼠标就能实现了。步骤如下: 一、在Photoshop中新建一个空白文件,然后随意打开三张图片,拷贝到新建文件中,拷贝后,三张图片分布在三个图层中,我们适当调整一下图像的大小。二、确认当前图层为图层1,然后用鼠标分别点一下图层2、3前的方框,将三图层链接起来。  相似文献   

19.
默认设置下,WORD会使文本两端对齐.有时就会在单词间插入长段的空白,使该行显得很不美观(图1)。  相似文献   

20.
给出了一种基于增量式网格的快速对齐算法,在迭代最近点(ICP)算法的基础上,利用增量式网格多分辨率的特点,通过在不同粒度下的对齐来提高效率.还给出了一种在对齐前计算初始变化矩阵的方法,根据该方法计算出来的初始变化矩阵用于ICP算法中,可以保证网格对齐收敛于全局最佳。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号