共查询到20条相似文献,搜索用时 234 毫秒
1.
2.
3.
文本信息隐藏技术可应用于数字媒体版权和完整性保护.自然语言文本经词性标注处理后变换为词性标记序列,提出了利用序列逆序数奇偶性隐藏信息的算法.证明了逆序数奇偶性在序列符号对换、增加和删除变换下的性质.根据隐藏信息的要求,先对词性标记序列做适当变换,再在变换后的词性标记序列指导下修改自然语言句子,从理论上保证了可行修改的存在性,并能避免直接在自然语言句子层面上做修改的盲目性. 相似文献
4.
用YACC实现基于词性标记文法的文本信息隐藏 总被引:1,自引:0,他引:1
将词性标记文法语言作自然语言的变换域,分别使用分词与词性标记软件和模拟函数将载体文本与秘密信息都变换到该域;运用字符串匹配技术计算秘密信息句子在载体文本中的位置,位置即为密钥;接收方根据密钥提取文法的句子,再通过语法分析的规约动作读出秘密信息,语法分析程序可利用YACC自动生成。该算法不改变载体文本,能较好地解决Wayner的载体文本生成技术面临的载体文本符合语法但不符合语义的问题。 相似文献
5.
文本信息隐藏是将秘密信息隐藏到文本中的一种技术。与加密后的密文通常是无意义的一串编码不同,文本隐藏生成的隐写文本看起来与普通文本无异,不容易引人怀疑。但是因为文本本身的冗余度低,与图像、视频等载体相比,文本隐藏算法较少且容量偏低。该文提出了一个新的利用宋词的文本隐藏算法,并设计实现了由编码器、解码器、词典和词牌模板组成的系统。秘密信息被隐藏到在字数、行数、句子形式、格律和韵脚等方面符合某个词牌的隐写宋词中。系统在保证良好安全性的同时,嵌入率达到了16%。据我们所知,这是第一个利用特殊体裁的文本信息隐藏算法。 相似文献
6.
一种提高自然语言文本水印容量的算法 总被引:1,自引:0,他引:1
自然语言文本水印算法通过对文本句子的语法结构或语义结构进行转换来嵌入水印信息.对句子的语法和TMR(Text Meaning Representation)语义结构进行分析,利用句子语法结构的转换不会改变句子TMR语义结构这一性质将语法水印技术和语义水印技术有效结合起来,提出了一种提高自然语言文本水印嵌入容量的算法.该算法的优点是将控制信息和水印信息分离,并根据每个句子本身的特性动态嵌入相应数量的水印信息.实验表明该算法和原有的语法或语义水印算法相比,水印嵌入容量有一定程度的提高. 相似文献
7.
生成式自然语言信息隐藏在自然语言生成过程中嵌入秘密信息。目前主流的生成式自然语言隐藏方法采用一个简单的循环神经网络(Recurrent Neural Networks, RNN)或长短时记忆网络(Long Short-Term Memory, LSTM)进行载密文本的生成。这种方法生成的载密文本长度有限,且句子和句子之间没有语义关联。为了解决这个问题,提出了能够生成长句且句与句之间能保持语义关系的机器翻译隐写算法Seq2Seq-Stega。采用序列到序列(Sequence to Sequence, Seq2Seq)模型作为文本隐写的编码器和解码器,源语句的信息可以保证目标载密句的语义关联性。此外,根据每一时刻模型计算的单词概率分布,设计了候选池的选词策略,并引入了平衡源语句与目标句的贡献度的注意力超参数。通过实验比较了不同选词阈值和注意力参数下模型的隐藏容量和生成文本的质量。与其他3种生成式模型的对比实验表明,该算法能够保持长距离语义关联,并具有较好的抗隐写分析能力。 相似文献
8.
已有的基于文本生成的无约束型自然语言信息隐藏方法主要利用不同的文本生成模型在秘密信息的控制下实现隐写文本的生成,它们生成的隐写文本质量较好且嵌入容量高.但这些方法大都局限于生成短隐写文本,整体的文本质量和句间语义相关性会随着句子长度增加而急剧下降.与无约束型方法不同,已有的约束型自然语言信息隐藏方法能针对特定场景实现长文本生成任务下的信息隐藏,具有更高的语言隐蔽性和安全性.为提高约束型方法面对各类应用场景的普适性,本文提出了一种通用的序列到隐写序列模型框架,该框架包含语言编码器和隐写器两部分,能实现从一种约束信息序列到另一种隐写文本序列的变换.以摘要生成为例,本文以序列到隐写序列模型为基本框架,提出了一种新颖的约束型自然语言信息隐藏方法.该方法在语言编码器中引入注意力优化单元以提升特征学习性能,在隐写器中融合复制机制和新设计的基于多候选优化的自适应隐写编码方法,使得隐写器可以根据候选单词序列的概率分布情况和待嵌入的秘密信息自适应地选择不同的输出优化策略,通过输出多个候选序列以及仅在嵌入时刻选择合适位置嵌入信息的方式来提高隐写文本质量.实验结果表明,本文提出的方法能够通过优化语言编码器和... 相似文献
9.
针对秘密信息的安全传输,提出了一种信息隐藏算法,将混沌置乱变换及行程压缩编码同时应用于秘密信息预处理,旨在改善隐藏载体的嵌入容量和鲁棒。该算法将直方图移位技术应用于信息嵌入过程,在绝对矩阵块截断编码(AMBTC)生成的高低平均值序列上隐藏预处理后的秘密信息,实现了载体的无损隐藏并提升了嵌入容量,且嵌入容量高于直接在由AMBTC生成的高低平均值序列上进行隐藏的算法。实验结果表明,在受到某些攻击后仍保证提取出的秘密信息具有较高的可辨识度,归一化系数始终高于0.6,证明了该算法在鲁棒性和隐藏效率方面的优势。因此,提出的信息隐藏方法能达到秘密信息安全传输的目的,同时具有很好的抗攻击性。 相似文献
10.
数字水印技术是文本版权保护的有效手段之一。通过对自然语言文本水印特征的分析,提出了一种基于句长的中文文本水印算法。该算法通过句式变换修改句子的长度来嵌入水印,在水印嵌入前采用DES加密算法并结合散列表技术对段和句子的索引序列进行置乱处理以提高水印的鲁棒性,水印嵌入时算法引入了冗余嵌入和大多数投票机制,通过分析表明该算法具有较高的鲁棒性和较低的误判率。 相似文献
11.
12.
基于规则挖掘和Naive Bayes方法的组合型歧义字段切分 总被引:1,自引:0,他引:1
组合型歧义字段切分是中文自动分词的难点之一。在对现有方法进行深入分析的基础上,提出了一种新的切分算法。该算法自动从训练语料中挖掘词语搭配规则和语法规则,基于这些规则和Naive Bayes模型综合决策进行组合型歧义字段切分。充分的实验表明,相对于文献中的研究结果,该算法对组合型歧义字段切分的准确率提高了大约8%。 相似文献
13.
14.
针对基于随机上下文无关文法(SCFG)建模的多功能雷达(MFR)辐射源识别问题,提出了一种基于随机无穷自动机(SISA)的MFR辐射源识别方法。在文法建模的基础上,对“水星”MFR控制模块文法产生式和系统特征文法产生式进行重新构造生成SCFG,利用SCFG构造随机无穷自动机作为识别器,从而实现对测量辐射源的识别。通过理论分析和实验仿真得出:该方法能实现对MFR辐射源的识别;在一定范围内,通过增加文法产生式个数,可以提高平均识别率,且识别性能优于通过SCFG构造的随机下推自动机(SPDA)。实验结果表明了该方法的正确性和有效性。 相似文献
15.
16.
In the paper an intelligent speech production system is established by using language information processing technology.The concept of bi-directional grammar is proposed in Chinese language information processing and a corresponding Chinese characteristic network is completed.Correct text can be generated through grammar parsing and some additional rules.According to the generated text the system generates speech which has good quality in naturalness and intelligibility using Chinese Text-to-Speech Conversion System. 相似文献
17.
18.
19.
20.
现有的命名实体识别算法多半采用统计与规则相结合的办法,但是这些方法有的没有考虑全局信息,有的没有解决好统计模型的时间复杂性问题.提出一个简约语法规则和最大熵模型相结合的混合命名实体识别方法,该方法采用简约语法规则与最大熵模型级联,首先使用简约语法规则模型进行识别,降低了使用复杂语法规则的时间复杂度,并把它的输出进行部分匹配,很好的弥补了由于简约语法规则带来的召回率偏低的问题,然后将得到的中间结果作为输入传递给最大熵模型,再由最大熵模型进行识别,得到最终的识别结果.实验结果表明,在MUC-7的命名实体识别评测中,系统的准确率、召回率和F值分别达到了94%,91%和92.48%,与已有的系统相比在性能上有很大的提升. 相似文献