共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
文本信息隐藏技术可应用于数字媒体版权和完整性保护.自然语言文本经词性标注处理后变换为词性标记序列,提出了利用序列逆序数奇偶性隐藏信息的算法.证明了逆序数奇偶性在序列符号对换、增加和删除变换下的性质.根据隐藏信息的要求,先对词性标记序列做适当变换,再在变换后的词性标记序列指导下修改自然语言句子,从理论上保证了可行修改的存在性,并能避免直接在自然语言句子层面上做修改的盲目性. 相似文献
3.
针对当前DNA序列图形表达模式中存在简并现象的相关问题,提出了一种新的二元符号图形表达方式。将四类碱基的编码过程看成是构成DNA序列的元素在直角坐标平面上的移动过程,以两种不同的标志符号来解决可能出现的元素重叠情况。此方案所标志的图形不存在自交现象,从而在DNA序列和图形表达之间建立了一一对应的关系。通过实例说明该方法在对无向图和有向图表达中均能有效地降低图形简并度,并引入人工代谢系统中的编码模式作为分析工具对DNA序列进行比较分析;以代谢中间物值作为参数,研究不同物种的DNA序列之间的相似性。实例分析表明,该参数能较好地表征不同物种之间的相似性程度高低,是一种简便可行的DNA序列特征的比较方法。 相似文献
4.
5.
6.
7.
针对目前聚类算法在分析DNA序列数据时的低效性和分类精度低问题,提出一种基于蚁群优化聚类算法(ACOC)的DNA序列分类方法,在密度函数中加入自适应感应量并应用模拟退火中的α-适应量的冷却策略,采用DNA序列分布特征对DNA序列进行特征提取,并将pearson相关系数引入蚁群聚类算法作为相似性度量。在EMBL-DNA数据库中4个数据集上进行性能测试,与统计聚类和k-means算法的比较表明,该方法具有一定的时间和精度的优越性,适于解决大规模DNA序列数据分类问题。 相似文献
8.
在定性不确定推理中,定性信任度集并不是惟一的。Akdag等人提出的不同定性信任度集中元素之间的序比较方法存在缺陷,与定性运算并不协调,这将会导致不确定性的定性表达和操作上的矛盾。提出了新的属于不同集的定性信任度的序比较方法,并定义了不同定性信任度集中元素之间的定性混合运算。这种序比较方法不仅更加符合直观,而且与定性运算保持一致,有利于在不确定推理中对属于不同集的定性信任度进行操作。 相似文献
9.
文章第1节对软件流水下多重循环中数据元素的调度进行了分析,着重讨论了用地址计数器完成简单地址运算的意义、ILSP(interlaced inner and outer loop software pipelining)算法的基本思想及其在此基础上分析了软件流水下多重循环中数据元素的调度特点;第2节进一步探讨了为完成调度而寻找地址控制信息序列的一般方法;第3、4节则分别讨论了用求得的地址控制信息序列控制地址计数器对数据元素的访问和将地址控制信息序列化简为精简地址控制信息序列的步骤;最后两节分别是实验结果和结 相似文献
10.
11.
针对传统方法在分析DNA序列相似性方面的不足, 提出了一种新的基于信息量的DNA序列相似性分析算法, 该方法将DNA序列视为基于符号集{A, C, G, T}的信号序列, 全部待比较的DNA序列组合成一个以字符A、C、G、T为属性值的信息系统。在所得数据库系统中引进DNA序列的信息量、联合信息量、条件信息量、交互信息量等概念, 讨论这些信息量的性质并给出它们之间的一些关系式, 然后在此基础上构建DNA序列相似性分析模型。仿真实验结果表明, 该方法不但能快速、有效地分析DNA序列相似性, 而且较好地克服了DNA碱基数量很大且不同物种的DNA序列长短不同的不足。 相似文献
12.
13.
无监督多元时间序列(MTS)异常检测方法因标注成本低而广受关注,但传统方法一般基于两个假设:1)服从独立同分布(IID)假设,即假设时序数据样本之间和属性之间不存在依赖关系;2)高净度启动假设,即假设可拥有完全正常态的时序数据集进行训练。以上假设在实际场景中往往难以满足。为此,提出一种基于边缘异常候选集的迭代式主动多元时序异常检测算法(EraseMTS)。首先,利用一种多粒度时序特征学习方法捕捉子序列内和子序列间的依赖关系,并在此基础上对原始多元时间序列进行再表示;其次,提出一种利用边缘异常候选集的选择策略,以子序列异常得分为基础,同时考虑异常程度,选择待人工交互的范围;最后,提出一种迭代式子序列权重更新机制,将异常反馈信息融入无监督异常检测模型的训练过程中,通过迭代方式不断优化初始训练模型性能。在UCR时间序列库中的4个数据集和1个人工合成数据集上对所提算法的检测性能、可扩展性和稳定性进行验证,实验结果表明该算法能够有效且稳定运行。 相似文献
14.
偏序集、包含度与形式概念分析 总被引:28,自引:0,他引:28
在形式背景上建立了3个偏序集:G偏序集、M偏序集和GM偏序集,并将包含度的概念引入到3个偏序集上,讨论了偏序集上的偏序关系和包含度与概念格之间的联系,并且证实了形式概念分析中的内涵、外延和蕴涵规则均可归结为偏序集上的序表示及包含度表示,这将有助于人们深刻理解形式概念分析中概念的含义及概念格的结构,为从定量分析角度研究形式概念分析提供了依据。 相似文献
15.
根据DNA序列数据的特点,提出对DNA序列数据进行多重压缩的思想。多重压缩的首要步骤是扩展字母表。首先对DNA序列数据进行0/1编码,然后每8位转换成一个ASCII码字符,将原来的DNA序列数据仅含有的4个字符扩展到256个字符。第二步采取基于统计模型的Huffman编码压缩算法和基于转换模型的Burrows-Wheeler算法,对扩展后的DNA序列数据进行二次压缩。最后对各种算法的压缩结果进行性能分析比较,比较结果显示,多重压缩算法有较优的压缩比。 相似文献
16.
在逆P-集合(F,-F)与元素迁移随机性的基础上,给出了元素迁移概率的概念与内逆Pρ-集合pF的结构;讨论了内逆Pρ-集合pF与内逆P-集合F的关系:pF是F的一般形式,F是pF的特例;给出pF与元素迁移概率关系定理、内逆Pρ-集合族与内逆P-集合族不可辨识定理,并进一步分析了内Pρ-集合pF的概率特征。 相似文献
17.
启动子是DNA序列中的关键元件,直接影响生物的转录与表达,启动子的研究对转录机制的阐明以及整个基因组功能的注释都具有重要作用。然而,用实验方法对启动子进行检测费时费力,发展启动子预测的方法具有十分重要的意义。本文基于离散小波变换建立伪三碱基组成表征DNA序列,支持向量机建模,预测大肠杆菌启动子的启动强度。首先采用二维映射法对DNA序列进行映射,得到二维离散的数字序列,并将之合并为一维数字序列;采用离散小波变换对数字映射序列进行转换,将得到的小波变换结果与三碱基组成结合构建伪三碱基组成,离散小波变换中小波函数与小波分解尺度的优化通过5-折交叉验证选取;构建得到的伪三碱基组成作为支持向量机的输入参数,建模进行预测。训练集得到的预测相关系数R为0.9830,RMSE为0.0907;测试集得到的预测相关系数R为0.8606,RMSE为0.1014。结果表明,模型的预测效果良好,说明基于离散小波变换的伪三碱基组成能够有效地反映DNA序列中碱基的顺序信息,本文方法不仅能够有效地实现大肠杆菌启动子启动强度的预测,也为DNA其他生物功能的预测提供了参考。 相似文献
18.
19.
间隙(gap)填充方法有助于获取更加完整和准确的基因组序列,可以促进基因表达与调控、结构变异分析和物种进化的研究。虽然已有较多填充gap的方法被提出,但是填充的准确性和完整性仍有待提高。设计一种基于长读数和多序列比对的gap填充方法GapLM。将包含gap的序列集合切割成不含gap的序列集合,基于长读数和序列之间比对位置的差异对结果进行修正。通过分析比对确定覆盖每个gap区域的左侧、右侧和跨过3个序列集合。针对1个gap和其相关联的3个序列集合,采用多序列比对方法分别对3个集合中的序列进行处理和融合,并生成一致序列对gap区域进行填充。将GapLM与GMcloser、PBjelly、LR_Gapcloser 3种填充方法在2个真实数据集上进行比较,实验结果表明,GapLM具有更加完整和准确的填充结果。 相似文献
20.
针对未知的数字和规则的模式构建问题,本文提供了一种从图像角度解决数字序列逻辑学习问题的手段。该方法是在计算机不知道图像间关系和图像内包含的内容的意义的前提下,让计算机自主地学习出其中包含的内在逻辑模式,从而进行数字序列的预测。本文构建了4个大型数据集:Linear序列、Multiplication序列、Fio序列和Nested序列,然后使用几种代表性的深度神经网络来完成数字序列逻辑学习任务,并对实验结果加以分析比较,事实证明,本文所提出的方法在一定程度上可以解决未知的数字和规则的模式构建问题,这为一系列未知逻辑模式构建任务提供了一种可能性。 相似文献