首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 315 毫秒
1.
在测试基于复杂数据结构的程序时,需要用到上下文无关语言句子的枚举.基于上下文无关语言按推导树高度的分层构造,提出了句子的反向自然枚举算法.通过堆、层、簇和长方体将句子划分为有穷集合序列,该算法的时间效率为O(n),n是被枚举句子的长度.实验数据表明,该算法是高效的,且应用更加便利.  相似文献   

2.
基于上下文依赖规则覆盖的句子生成   总被引:1,自引:0,他引:1  
基于规则覆盖的句子生成,是上下文无关文法句子生成的主要方法,但是它也具有局限性。最近提出的上下文依赖规则覆盖,能根据文法的内部结构不同而具有不同的分支集合,比规则覆盖的精度更高。目前,尚未见这种上下文依赖规则覆盖的句子生成算法。该文在规则覆盖的句子生成算法的基础上,实现一个基于上下文依赖规则覆盖的句子生成算法。该算法已在机器上实现并经过实验检验。  相似文献   

3.
句子语义相似度计算   总被引:1,自引:0,他引:1       下载免费PDF全文
句子或文本片段相似度计算在与Web相关的任务中起着越来越重要的作用。在基于概念之间的语义相似度基础之上,提出一种句子语义相似度的计算方法SSBS并进行了相关的实验。与其他方法相比,SSBS方法在特征的量化过程中不仅考虑两个句子的概念对之间的语义相似度和字符串编辑距离,还考虑了不同词性的概念对句子相似度的影响。  相似文献   

4.
本文介绍了一种形式语言-Petri网语言,并讨论了Petri网语言与传统形式语言(正规语言,上下文无关语言,上下文有关语言以及递归枚举语言)的关系。  相似文献   

5.
《计算机研究与发展》2004,41(12):Z001-Z007
第一期演化门限ARMA模型方法与应用代建华 董文永 李元香 潘云鹤 (1)………………………………………………………基于最小序句子的上下文无关语言句子枚举黄文集 (9)……………………………………………………………………………一种基于PID反馈控制的分时调度算法童立靖 淮晓永 李明树 (15 )…………………………………………………………IA 6 4中软件流水的寄存器需求研究林海波 李文龙 汤志忠 (2 2 )……………………………………………………………基于类型注解的认证编译器设计与实现胡荣贵 陈意云 郭 帆 张 昱 (2 8)…  相似文献   

6.
以科技论文摘要句子为研究对象,提出一种两阶段的细粒度句子分类方法,通过结合摘要内各个句子的位置、关键词和上下文信息,选择部分易于分辨语境类型的句子,将其作为种子样本训练获得分类模型。利用机器学习的方法对摘要句子的背景知识、论文主题、研究方法和实验结果进行自动分类。实验结果表明,该方法中的F度量值比其他细粒度分类方法平均高3%~5%。  相似文献   

7.
郑黎晓  许智武  陈海明 《软件学报》2011,22(11):2564-2576
提出一种上下文无关文法的句子生成算法.对于给定文法,算法生成一个满足该文法分支覆盖准则的句子集.结合长度控制、冗余消除和句子集规模控制等策略,使得生成的句子较短、无冗余、句子集规模较小.考察了算法在基于文法的软件系统的测试数据生成方面的应用情况.实验结果表明,该算法生成的测试数据具有较强的程序揭错能力,并且能够帮助测试人员提高测试速度.  相似文献   

8.
自然语言生成中的句子结构优化处理   总被引:4,自引:0,他引:4  
本文介绍多语种文本生成系统中的句子结构优化处理,采用基于语义的规则驱动方法来消除句子之间的信息冗余,从而使生成的文本更加自然流畅,可读性强。这种方法独立于具体语言,不受语种限制,具有极好的移植和扩展能力,在自然语言生成系统中具有广泛的研究价值。句子优化的主要类型、算法的构造以及规则的定义方法均在文中作了详细的说明。  相似文献   

9.
基于产生式集划分的上下文无关语言句子生成   总被引:2,自引:0,他引:2  
王泓皓  董韫美 《软件学报》2000,11(8):1030-1034
给出了上下文无关文法(context-free grammar,简称CFG)产生式集的一种划分方法,可将产 生式分为两类.使用一类产生式进行推导时,推导过程将无限进行下去;使用另一类进行推导 时,推导过程将迅速结束.证明了CFG句子生成过程一定是先使用一类产生式使生成的句型不 断变长、变复杂,再使用另一类产生式使句型变成句子.据此,提出了一种可控制的通用句子 生成方法.其生成一条句子的时间和空间复杂度是O(r+n),其中n是生成句子的长度或深度 限制  相似文献   

10.
双语句子对齐能够为机器翻译、信息检索等跨语言领域任务提供高质量的平行语料,在低资源的老挝语自然语言处理研究中显得尤为重要。由于汉老双语文本中存在非单调对齐(交叉对齐和空对齐)的情况,容易影响汉老句子对齐的效果。此外,人名、地名作为新闻要素,大多属于未登录词,也给汉老句子对齐研究增加了难度。该文提出了一种融合局部和全局语义信息的汉老双语句子对齐方法。首先,将汉老双语句长特征和人名地名特征融入Glove词向量,然后利用双向门控循环单元对特征词向量进行编码,以得到更细粒度的句子局部信息。其次,引入交互注意力机制,提取双语句子中的全局信息,保证对上下文语义特征的有效利用。最后,在多层感知机的基础上引入KM算法,该方法可以处理非单调对齐文本,提高模型的泛化能力。实验结果表明,该方法显著提高了汉老双语新闻语料的对齐性能。  相似文献   

11.
句子相似度的计算在自然语言处理的各个领域占有很重要的地位,一些传统的计算方法只考虑句子的词形、句长、词序等表面信息,并没有考虑句子更深层次的语义信息,另一些考虑句子语义的方法在实用性上的表现不太理想。在空间向量模型的基础上提出了一种同时考虑句子结构和语义信息的关系向量模型,这种模型考虑了组成句子的关键词之间的搭配关系和关键词的同义信息,这些信息反应了句子的局部结构成分以及各局部之间的关联关系,因此更能体现句子的结构和语义信息。以关系向量模型为核心,提出了基于关系向量模型的句子相似度计算方法。同时将该算法应用到网络热点新闻自动摘要生成算法中,排除文摘中意思相近的句子从而避免文摘的冗余。实验结果表明,在考虑网络新闻中的句子相似度时,与考虑词序与语义的算法相比,关系向量模型算法不但提高了句子相似度计算的准确率,计算的时间复杂度也得到了降低。  相似文献   

12.
郭红建  黄兵 《计算机应用研究》2013,30(11):3299-3301
针对多文档文摘生成过程中话题容易中断和文摘句子语义出现不连贯这两个研究难点, 分析了潜在语义分析聚类算法在句子排序中的应用, 以期提高文摘的生成质量。先采用潜在语义分析聚类算法将文摘句子聚类, 从而形成话题集, 以达到解决话题中断的目的。通过计算文档的文摘展现力, 挑选出文摘展现力最大的文档作为模板, 然后根据模板对文摘句子进行两趟排序。实验结果表明, 提出的算法是有效的, 该算法能够提高文摘的可读性。  相似文献   

13.
针对面向查询的多文档自动文摘,本文将查询句混入多文档集合中的各句子中间,采用高效的软聚类算法SSC对所有的句子进行聚类。采用轮转法抽取文摘句,最后生成文摘。该方法在DUC2005的语料中测试效果很好。  相似文献   

14.
双语语料库的自动对齐已成为机器翻译研究中的一个重要研究课题.目前的句子对齐方法有基于长度的方法和基于词汇的方法,该文先分析了基于长度的方法,然后提出了基于译文的方法:通过使用一部翻译较完整的词典作为桥梁,把英汉句子之间的对应关系连接起来.根据英语文本中的单词,在词典中找到其对应的译文,并以译文到汉语句子中去匹配,根据评价函数和动态规划算法找到对齐句对.实验结果证明这种对齐方法消除了基于长度做法中错误蔓延的情况,它大大地提高了对齐的精度,其效果是令人满意的.  相似文献   

15.
维吾尔语新闻网页与对应的中文翻译网页在内容上往往并非完全可比,主要表现为双语句子序列的错位甚至部分句子缺失,这给维汉句子对齐造成了困难。此外,作为新闻要素的人名地名很多是未登录词,这进一步增加了维汉句子对齐的难度。为了提高维汉词汇的匹配概率,作者自动提取中文人名、地名并翻译为维吾尔译名,构造双语名称映射表并加入维汉双语词典。然后用维文句中词典词对应的中文译词在中文句中进行串匹配,以避免中文分词错误,累计所有匹配词对得到双语句对的词汇互译率。最后融合数字、标点、长度特征计算双语句对的相似度。在所有双语句子相似度构成的矩阵上,使用图匹配算法寻找维汉平行句对,在900个句对上最高达到95.67%的维汉对齐准确率。  相似文献   

16.
一种基于句长的文本水印算法   总被引:1,自引:0,他引:1       下载免费PDF全文
数字水印技术是文本版权保护的有效手段之一。通过对自然语言文本水印特征的分析,提出了一种基于句长的中文文本水印算法。该算法通过句式变换修改句子的长度来嵌入水印,在水印嵌入前采用DES加密算法并结合散列表技术对段和句子的索引序列进行置乱处理以提高水印的鲁棒性,水印嵌入时算法引入了冗余嵌入和大多数投票机制,通过分析表明该算法具有较高的鲁棒性和较低的误判率。  相似文献   

17.
该文以朱自清、汪曾祺和刘亮程的散文作品为语料,旨在从文本的韵律和节奏出发,采用文本聚类的方法来挖掘出新的能够代表作品风格的特征。实验表明,以句末用字韵母的n元组合、分句句长的n元组合、标点符号和整句句长作为风格特征,能成功地将这三位作家的作品区分开来。其中刘亮程句尾韵的舌位高于汪、朱二人,朱自清对韵脚的选择不如刘、汪二人丰富。汪曾祺的分句长最短,且最为讲究句式长短的对齐;刘亮程兼顾长短句的交错,节奏更富于变化;朱自清的句长变化最为平稳。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号