共查询到20条相似文献,搜索用时 93 毫秒
1.
2.
传统的文本隐写方案很难均衡隐藏容量和隐蔽性之间的矛盾。利用宋词载体语义丰富、句法灵活的特点,文章提出BERT(Bidirectional Encoder Representations from Transformers)词嵌入结合Attention机制的Seq2Seq模型生成隐写宋词的算法。该算法采用BERT词嵌入作为生成模型的语义向量转换部分,其丰富的词向量空间保证了生成句子间语义的连贯性,提高了生成宋词的质量。另外,该算法采用格律模板和互信息选词方法约束隐写语句的生成,增强了隐藏算法的安全性。通过与现有文本隐藏算法在嵌入率方面的对比实验和分析表明,文章所提算法的嵌入率相比Ci-stega提高了7%以上,且在安全性和鲁棒性方面均有良好的表现。 相似文献
3.
4.
在基于文本生成的信息隐藏算法研究中,如何在保证生成文本质量的同时提高隐藏容量是主要存在的挑战.为此本文提出一种基于宋词生成的构造式信息隐藏算法.首先对宋词文本数据进行预训练,然后基于自回归语言模型搭建宋词生成模型;其次根据宋词词牌固有的格式信息设计格律模块,在宋词生成阶段,需要向生成模型输入该格律模块,并通过符号集设计、编码等综合作用,生成宋词诗句.在利用宋词生成模型进行秘密信息隐藏的过程中,对格律模块进行重构,通过平仄韵词牌、词牌格式模板、关键字、韵律及押韵字符的不同选择,有效实现秘密信息的隐藏.信息提取是隐藏的逆过程,且提取过程不需要利用宋词生成模型,仅需根据模板和词典库来进行索引即可,提高了信息提取的效率.实验结果表明,本文提出的算法能够生成格式严格、韵律清晰、句子完整性高的宋词,且生成的宋词文本的信息隐藏容量均值可达21比特/句、安全性高,整体性能优于已报道的主流算法. 相似文献
5.
6.
信息隐藏技术具有良好的隐蔽性和安全不可见性,正在被广泛应用于版权保护、隐藏标识和安全不可见通信等领域.本文介绍了一种基于BMP图像的文本信息隐藏算法,该算法对图像的LSB(Least Significant Bits,最低有效位)进行嵌入,具有良好的隐蔽性. 相似文献
7.
8.
随着加密术局限性的增大,在近几年中,人们更加关注信息安全的另一个分支:信息隐藏。将电子商务中的私密信息(如秘钥等)隐写到图像的位平面中,利用位平面算法,进行信息隐藏,对于未授权的第三方,很难觉察到秘密信息的存在,从而保障了客户私密信息在Internet上的安全传输。 相似文献
9.
10.
11.
基于虚词变换的自然语言信息隐藏算法研究 总被引:2,自引:1,他引:1
简要分析了一般文本信息隐藏的方法,提出了一种利用汉语中的高频虚词来进行信息隐藏的思想。以助词“的”为例,总结出了若干可以在不影响文本语义的前提下修改“的”字结构的语法规则。以这些规则为基础给出了一个具体的基于虚词变换的文本信息隐藏算法,并对该算法的隐蔽性和隐藏容量、鲁棒性等进行了分析。 相似文献
12.
对灰度图像LSB匹配隐写提出了一种新的检测方法.通过引入不同幅度的修改,分析了消息嵌入过程对载体和载密图像影响的差异,并利用这种嵌入影响的变化率构造了一个分类器.实验表明该方法对于经过JPEG转换的灰度图像和非压缩灰度图像均有较好的检测效果. 相似文献
13.
14.
基于文本的信息隐藏技术研究 总被引:2,自引:0,他引:2
信息隐藏技术是近几年来信息安全领域出现的一种新技术,不同于传统的密码学技术。它主要研究如何将机密信息隐藏于另一公开的信息中,然后通过公开信息的传输来传递机密信息。作为信息隐藏载体的公开信息可以是一般的文本文件、数字图像、数字视频和数字音频等等。而该文主要介绍了现有的几种基于文本的信息隐藏技术。 相似文献
15.
改进的OPTICS算法及其在文本聚类中的应用 总被引:1,自引:0,他引:1
基于密度的OPTICS聚类算法以可视化的结果输出方式直观呈现语料结构,但由于其结果组织策略在处理稀疏点时的局限性,算法实际性能未能得到充分发挥。本文针对此缺陷提出一种有效的结果重组织策略以辅助稀疏点的重新定位,并针对文本领域的特点改变距离度量方法,形成了OPTICS-Plus文本聚类算法。在真实文本分类语料上的实验表明,我们的结果重组织策略能够辅助算法产生更为清晰反映语料结构的可达图,与K-means算法的比较则证实了OPTICS-Plus具有较为良好的聚类性能。 相似文献
16.
基于规则的自动分类在文本分类中的应用 总被引:8,自引:3,他引:8
文本自动分类是指将文本按一定的策略归于一个或多个类别中的应用技术。本文首先介绍三种基于统计的自动分类技术(k近邻分类器、支持向量机分类器和朴素贝叶斯分类器),剖析了基于统计的自动分类的优势及不足。基于统计的自动分类的不足主要表现为:当类别之间分类特征的交叉变大时,分类精度呈下降趋势,在多层分类的情况下,此局限尤为突出。针对此局限性,为了提高自动分类的精度,我们引入了基于规则的自动分类来对其进行改进和扩充,并整合两种自动分类技术的优点,设计出了混合分类器系统,从而获得了比较理想的分类效果。 相似文献
17.
汉语意见型主观性文本类型体系的研究 总被引:1,自引:0,他引:1
主观性文本是一种描述个人想法、情感和意见等的非约束性文本。它与主要描述以事实为主的客观性文本在内容和结构上有很大的不同。意见型文本是包含有意见元素(意见持有者、意见陈述范围、意见主题和意见情感)的一种主观性文本,它大量出现在网上的电子公告板、论坛和博客等媒介中,受到广泛的关注,并成为研究意见挖掘方法和技术的语料。该文介绍了主观性文本的定义及其与客观性文本的差异,同时着重讨论了意见型文本的定义、特点、类型体系及其在意见挖掘技术中的应用。 相似文献
18.
基于COSA算法的中文文本聚类 总被引:5,自引:0,他引:5
传统聚类算法在计算两个对象间的距离时,每个属性对距离的贡献相同。COSA(Clustering On Subsets of Attributes)算法[1]认为在不同的分组中,每个属性对计算距离所起的作用可能并不相等,因为不同分组中的对象可能在不同的属性子集上聚集。文献[1]在此基础上定义了新的距离,并提出了两种COSA算法: COSA1算法是一种分割的聚类算法;COSA2算法是一种层次聚类算法。为了对比COSA距离和传统的欧氏距离在文本聚类中的表现,本文对中文文本进行了分割聚类和层次聚类的实验。实验结果显示出COSA算法较基于欧氏距离的聚类算法有更好的性能,而且对于属性数的变化,COSA算法更加稳定。 相似文献
19.
20.
生物医学文本挖掘技术的研究与进展 总被引:1,自引:0,他引:1
生物医学研究是二十一世纪最受关注的研究领域之一,该领域发表了巨量的研究论文,已经达到年平均60万篇以上。如何在规模巨大的研究文献中有效地获取相关知识,是该领域研究者所面临的挑战。作为生物信息学分支之一的生物医学文本挖掘技术就是一项高效自动地获取相关知识的新探索,近年来取得了较大进展。这篇综述介绍了生物医学文本挖掘的主要研究方法和成果,即基于机器学习方法的生物医学命名实体识别、缩写词和同义词的识别、命名实体关系抽取,以及相关资源建设、相关评测会议和学术会议等。此外还简要介绍了国内研究现状,最后对该领域近期发展作了展望。 相似文献