首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
自动文本摘要是继信息检索之后信息或知识获取的一个重要步骤,对高质量的文档文摘十分重要。该文提出以句子为基本抽取单位,以位置和标题关键词为句子的加权特征,对句子基于潜语义聚类,提出语义结构的摘要方法。同时给出了较为客观和有效的摘要评价方法。实验表明了该方法的有效性。  相似文献   

2.
为保护数字文本的知识产权,提出一种利用语义角色嵌入水印信息的文本水印算法。采用Unicode编码和Huffman编码对水印进行预处理形成特定形式的水印信息串,借助自然语言处理技术标注文本中的语义角色,将水印信息映射为语义角色的位置,实现水印的嵌入与提取。算法对文本的格式和内容不做任何修改,具有很强的隐蔽性和鲁棒性,能有效抵抗常见的格式变换和攻击,同时能提供较大的水印容量,与其它文本水印算法相比具有一定的优越性。  相似文献   

3.
格式化文本水印性能评估基准研究   总被引:2,自引:0,他引:2  
针对目前没有测试基准对格式化文本水印算法鲁棒性进行评估和比较,提出了格式化文本水印性能评估基准.回顾了水印系统通用的框架,分析并确定了影响水印系统性能的参数和文本文档的视觉质量评级标准.借鉴图像水印性能评估基准的攻击分类,提出了Word特有的去除攻击、几何攻击、密码攻击和协议攻击的攻击分类方法,同时阐述了Word特有的攻击模式.对两种不同的文本水印算法进行了攻击强度—鲁棒性、攻击强度—视觉质量和嵌入数据量—鲁棒性测试,实验结果表明,该系统在文本水印算法评估和设计中具有有效性和实用性.  相似文献   

4.
自动生成领域,传统的ROUGE评测方法已多次被研究者发现其评测结果与人工评测结果差距过大,但该差距尚未数值化,无法丈量。基于此现状,本文采用多个不同类型、长度的公开中文摘要数据集,通过定义语义损失率计算方法来衡量ROUGE在评价时所产生的语义损失程度,同时综合考虑摘要长度以及数据集内在因素对生成摘要评价的影响,最终可视化ROUGE评测与人工评测存在误差的具体数值。实验结果表明,ROUGE评测分数与人工评测分数呈弱相关性,ROUGE方法对不同长度的数据集都存在一定程度的语义损失,同时摘要长度和数据集的原始标注误差也会对最终的评测分数产生重要影响。本文定义的语义损失率计算方法可以为更好地选择数据集和评测方法提供一定的参考依据,为改进评测方法提供一定的思路方向,同时也对最终客观测评模型的有效性提供一定的指导帮助。  相似文献   

5.
文章把文本的偶数行的移位值作为向量的分量而构成一个数字文本水印的水印向量,给出了水印向量的嵌入与检测方法,讨论了盗版者对水印向量的伪造攻击,最后解决了如何辨识出伪造攻击的问题。  相似文献   

6.
分析了数字图像水印攻击方法及对策,提出了一种新的数字图像水印攻击分类,可以完善已有攻击分类.数字水印基准测试软件为数字水印算法提供一种评测标准.在文献[7,8]的基础上,介绍了新的数字水印攻击基准Certimark,并对Checkmark和Stirmark中典型的射影攻击和旋转攻击进行了分析比较.  相似文献   

7.
自然语言文本水印   总被引:27,自引:0,他引:27  
本文主要介绍了基于自然语言处理的文本水印技术,也即自然语言文本水印技术。该技术是在不改变文本原意的前提下,将需要隐藏的文本信息(水印信息) 插入到原始文本中的一种信息隐藏技术。这种技术对于确认信息来源和信息的秘密传送,以及版权维护等方面都有着很大的应用价值。本文首先给出了基于自然语言处理技术的文本水印的概念、特点及攻击模型,并对文本水印的研究现状进行了分析。通过分析可以看出,自然语言文本水印技术有着更好的灵活性,并且在适度的攻击下,不会破坏水印信息。本文详细介绍了文本水印系统的设计过程,包括该技术的基础数学理论- 二次余数理论。最后详细介绍了两种自然语言文本水印嵌入方法,分别是基于句法分析和基于语义的水印嵌入方法。  相似文献   

8.
自动摘要是解决网络信息过载问题的关键技术之一.在对文本中旬子的特征和句子之间的语义距离分析的基础上,提出了一种基于句子特征和语义距离的自动文本摘要算法.首先计算文档中句子的各个特征权重,在此基础上决定句子的权重;然后,通过句子之间的语义距离计算,修改句子的权重,据此进行排序,权重大的作为文本的主题句;最后,对文摘句进行平滑处理,生成文字流畅的文本摘要.实验表明,该算法在不同的压缩率下生成的摘要接近于人工摘要,具有较好的性能.  相似文献   

9.
多文本摘要的目标是对给定的查询和多篇文本(文本集),创建一个简洁明了的摘要,要求该摘要能够表达这些文本的关键内容,同时和给定的查询相关。一个给定的文本集通常包含一些主题,而且每个主题由一类句子来表示,一个优秀的摘要应该要包含那些最重要的主题。如今大部分的方法是建立一个模型来计算句子得分,然后选择得分最高的部分句子来生成摘要。不同于这些方法,我们更加关注文本的主题而不是句子,把如何生成摘要的问题看成一个主题的发现,排序和表示的问题。我们首次引入dominant sets cluster(DSC)来发现主题,然后建立一个模型来对主题的重要性进行评估,最后兼顾代表性和无重复性来从各个主题中选择句子组成摘要。我们在DUC2005、2006、2007三年的标准数据集上进行了实验,最后的实验结果证明了该方法的有效性。  相似文献   

10.
提出的摘要方法,以句子为基本抽取单位,以兴趣主题词为句子的加权特征。对句子基于潜语义聚类,提出语义结构,这种结构对摘要质量的提高有重要作用,并且提出了较为客观和有效的摘要评价方法。实验表明,本文方法是行之有效的。  相似文献   

11.
宋长平  李婧 《计算机应用研究》2020,37(11):3297-3301
传统序列到序列模型未充分利用输入文本的句子结构,导致其无法生成结构严谨、语法更好的摘要。因此,提出了一种融合句子基本结构的摘要生成方法。首先,明确提出融合句子结构生成文本摘要的概念。再者,在摘要生成器上增添了句子基本结构模块和监督模块,句子基本结构模块从输入文本中捕捉一系列句子结构,监督模块评估已捕获句子结构的重要性,以此协助句子基本结构模块从中提取可用的句子结构。最后,摘要生成器融合可用的句子结构生成最终摘要。在数据集LCSTS上的实验表明,此方法的ROUGE得分相较于seq2seq皆有提高,即其生成摘要的准确性优于seq2seq模型。实验也验证了句子基本结构模块和监督模块存在的必要性。  相似文献   

12.
文本可见水印技术主要用于明确文本类数字媒体的版权标识,防止非法使用。现有文本可见水印算法的抗二值化攻击能力较差,为克服此缺陷,根据文本图像的灰度分布和纹理的特点,提出了一种基于灰度均匀分布的自适应文本可见水印算法。首先提取文本行轮廓,然后依据行轮廓自适应产生嵌入强度,再由嵌入强度对水印黑色像素进行筛选,最后将载体文本与筛选后的水印映射到同一灰度范围。该算法具有嵌入强度自适应、嵌入位置随机和抗二值化攻击等特点。实验结果显示,算法在不影响载体文本可读性的同时,具有良好的水印可视性和鲁棒性,适用于任何形式的二值文本和图形水印。  相似文献   

13.
李婧  房鼎益  何路 《计算机应用》2012,32(9):2603-2605
为了解决传统的密写分析技术对文本零水印失效的问题,提出一种基于词法的主动攻击算法。该算法将目前鲁棒性较好的混沌文本零水印作为攻击对象,采用同义词替换技术,定义了同步攻击和生日攻击两种方法,通过将这两种方法相结合,在词这一级别上实现了对文本零水印的主动攻击。实验结果表明,该算法无需大量改写载体文本即可有效地破坏零水印。  相似文献   

14.
为了有效地保护各种数字化产品的版权,防止产品被篡改,假冒和盗用,提出一种新的数字产品版权保护技术即数字水印.针对目前数字水印技术的研究主要集中在图像、视频和音频等方面的现象,分析了几种常用的文本数字水印技术,并按各自不同的嵌入方法对它们进行归类,设计并实现了一种基于文本内容的文本数字水印算法,利用中英文逗号的替换完成水印的嵌入与提取.测试结果表明了该算法的可行性,并分析了算法的鲁棒性、隐蔽性及水印容量.  相似文献   

15.
提出了一个基于病毒思想的英文文本数字水印算法,该算法基本思想是把整个英文文本的字符以某些字母为界划分成若干小段(元素),再把这些元素按规则归类成若干个集合,然后在每一个集合中分别嵌入一个水印信息片。检测水印的时候,只要这个集合的某个元素中的水印信息没被破坏,那么这个集合嵌入的水印信息片就可以被提取出来。由于该算法完全可以在纯TXT文本上做,所以格式攻击对其是无效的。实验证明:该算法的鲁棒性能达到理论上的预期效果。  相似文献   

16.
一种可抗二值化攻击的文本图像可见水印算法   总被引:1,自引:0,他引:1  
一些在文本图像中嵌入可见水印标识的方法会在二值化攻击下完全失效,因此提出一种基于灰度均匀分布的文本图像可见水印算法。该算法通过对二值水印图像的黑色像素进行概率筛选来控制水印的嵌入强度,然后将二值文本图像和筛选后的水印图像映射到相同的灰度分布范围,以得到含可见水印标识的文本水印作品。仿真实验表明,该算法生成的文本图像可见水印作品灰度均匀分布,能够抵抗二值化攻击,具有良好的鲁棒性。  相似文献   

17.
文本文档水印质心检测方法的改进   总被引:1,自引:0,他引:1  
戴祖旭  洪帆  李小刚  董洁 《计算机应用》2007,27(5):1064-1066
对Brassil等的文本水印质心检测方法作了改进,通过模拟扩展初始文本行,综合应用再生文本行轮廓和初始文本行轮廓信息构造了一个再生模拟文本行质心序列,证明了该序列依概率收敛于初始文本行质心。实验结果表明改进后的检测方法在处理含有短行的文本文档水印时较之与Brassil方法,误检概率可减少一半,因此用行移编码嵌入水印时可不受文本行长度限制,提高了文档水印容量。  相似文献   

18.
为了提高文本数字水印的鲁棒性,需确定具体在载体的哪些部位进行映射层替换,根据虚词结构变换规则提出了一种定位层分层的思想。通过将中文文本按照虚词规则分组,再利用密钥对规则进行随机组合,将文本根据可嵌入水印的关键字动态分层,使文本形成一个多层的立体空间,在各层之间嵌入相关的数据,从而使嵌入的数据形成一个立体构架,增强了水印的抗攻击能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号