首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
遗传变异是生命的基本特征,遗传变异与表型差异之间的关系,是现代生物学的一个基本问题.由基因决定生物体的遗传特征和主要个体差异的观念正在逐渐改变,过去几年的许多研究显示,基因组中大尺度的结构变异与个体的表型差异和疾病等有一定的关联.有关遗传变异和表型多样性的研究,需要比较生物体个体基因组间的各种不同.利用NGS数据全面分析结构变异的技术目前仍然不成熟.因此本文根据生物学知识,利用高通量测序数据,对植物基因组结构变异的识别问题深入系统的研究,提出新的结构变异识别方法和精确的断点预测方法.  相似文献   

2.
检测基因组中的结构变异对遗传学研究具有重要意义, 基于测序技术的结构变异检测将成为主流发展方向。全面总结了现有面向下一代测序技术的结构变异检测算法:配对末端匹配法、读深度法、分裂读数据法和序列拼接法, 分析各算法核心思想及其特点, 给出其适用范围和优缺点, 并探讨了检测算法存在的问题和发展趋势。  相似文献   

3.
二代测序NGS(Next-generation sequencing)数据的迅速发展加快人们对于基因的探索,同时也给测序数据分析任务带来更大的挑战。癌细胞特异变异的识别是测序数据分析的一项重要基础性工作。当前的变异识别工具大多采用贝叶斯模型方法,特异度、灵敏度和速度都远远满足不了需求。K-means是一种简洁高效的无监督聚类算法,基于此将位点信息映射成多维的特征,再进行类别个数为2的聚类过程。该算法明显提高了准确度和召回率,实验结果验证了算法的有效性。  相似文献   

4.
对导致变异测试高代价的原因之一--测试过程中容易产生数目庞大的变异体进行了研究,提出基于遗传算法聚类的变异体约简方法。把具有相似特征的变异体置于同一簇中,再从每个簇中随机选择一个作为代表,从而实现变异体的约简。实验表明:1)该方法可在不降低构造出的测试用例集的测试充分度的前提下,约简变异体;2)与K-means算法和凝聚型层次聚类算法相比,该方法能够在自动产生合适的聚类数目的同时,具有更优的约简效果。  相似文献   

5.
针对模糊C-均值FCM(Fuzzy C-Means)聚类算法易陷入局部最优解,对初始值敏感的缺点。提出基于混沌和动态变异蛙跳SFLA(shuffled frog leaping algorithm)的FCM算法。该算法先用混沌的Tent序列初始化青蛙群体以增强群体的多样性,提高初始解的质量;并根据青蛙的适应度方差值选择相应的变异概率。再将改进后的蛙跳算法优化FCM算法,最后求取全局最优。人工数据及经典数据集的仿真结果表明,该算法(CMSFLA-FCM)与SMSFLA-FCM、SFLA-FCM和FCM聚类算法相比,寻优能力更强,聚类效果更优。  相似文献   

6.

针对K-means 聚类算法过度依赖初始聚类中心、局部收敛、稳定性差等问题, 提出一种基于变异精密搜索的蜂群聚类算法. 该算法利用密度和距离初始化蜂群, 并根据引领蜂的适应度和密度求解跟随蜂的选择概率P;  然后通过变异精密搜索法产生的新解来更新侦查蜂, 以避免陷入局部最优; 最后结合蜂群与粗糙集来优化K-means. 实验结果表明, 该算法不仅能有效抑制局部收敛、减少对初始聚类中心的依赖, 而且准确率和稳定性均有较大的提高.

  相似文献   

7.
遗传算法具有良好的全局搜索能力,但有过早收敛和过慢结束的缺点。K-Means算法具有很强的局部搜索能力,但算法有对初始聚类中心敏感而易陷入局部最优解。针对上述问题,提出了基于K-Means变异算子的混合遗传算法聚类,将K-Means算法的局部搜索能力与遗传算法的全局寻优搜索能力相结合,在遗传算法中引入K-Means变异算子,采用符号编码、自适应变异、最优个体保留策略的混合遗传算法。仿真实验表明,该算法有效克服了遗传算法过慢收敛和K-Means算法陷入局部收敛的问题,从而得到更好的聚类效果。  相似文献   

8.
聚类可以看成是寻找K个最佳聚类中心的过程。把一组聚类中心视为一个粒子,把总类内离散度和的倒数看成优化函数,采用变异概率作为粒子变异的条件,从而提高了粒子群的探索能力,克服粒子群收敛到局部最优值的缺点。因此通过变异粒子群算法能够找到最佳聚类中心。实验结果表明该算法有很好的稳定性,提高了聚类效果。  相似文献   

9.
基于投票机制的融合聚类算法   总被引:1,自引:0,他引:1  
以一趟聚类算法作为划分数据的基本算法,讨论聚类融合问题.通过重复使用一趟聚类算法划分数据,并随机选择阈值和数据输入顺序,得到不同的聚类结果,将这些聚类结果映射为模式间的关联矩阵,在关联矩阵上使用投票机制获得最终的数据划分.在真实数据集和人造数据集上检验了提出的聚类融合算法,并与相关聚类算法进行了对比,实验结果表明,文中提出的算法是有效可行的.  相似文献   

10.
为了改进模糊C-均值(FCM)聚类算法对初始值和噪声数据敏感,且易陷入局部极小值的缺点,提出一种基于选择和变异机制的蛙跳FCM算法(SMSFLA-FCM)。该算法首先将线性递减的惯性权重引入蛙跳算法的更新策略中,按照一定的概率选择适应度值较优的青蛙代替较差青蛙,并对每只青蛙个体以不同的概率变异;再用改进后的蛙跳算法求得最优解作为FCM算法的初始聚类中心;然后利用FCM优化初始聚类中心;最后求得全局最优解,从而有效克服了FCM算法的缺点。人造数据和经典数据集的实验结果表明,SMSFLA-FCM与SF-LA-FCM和FCM聚类算法相比,提高了算法的寻优能力,且迭代次数更少,聚类效果更好。  相似文献   

11.
K-means聚类算法的性能依赖于距离度量的选择,k-means算法将欧几里德距离作为最常用的距离度量方法。欧氏距离认为所有属性在聚类中作用是相同的,但是这种距离度量方法并不能准确反映样本间的相异性。针对这种不足,提出了融合变异系数的k-means聚类分析方法(CV-k-means),利用变异系数权重向量来减少不相关属性的影响。实验结果表明,该方法的聚类结果优于k-means算法。  相似文献   

12.
结构变异检测是基因组大数据分析的一项重要任务,其中倒位变异是一种常见的结构变异,并往往与多种严重的疾病相关联,因此获取准确的倒位变异发生位置是一项具有重要研究意义的工作.提出了一种基于长读数和重比对的倒位变异检测方法,首先在长读数和基因组参考序列比对结果中提取每条长读数被剪切掉的序列;然后将剪切序列重新比对到基因组参考序列上,基于原始的比对信息和剪切序列的比对信息确定倒位变异信号;最后,对倒位变异信号进行聚类确定倒位变异发生的位置.该方法与较常见的其他两种倒位变异检测方法在两组数据集上进行了性能比较,实验结果表明该方法能取得更令人满意的检测结果.  相似文献   

13.
目的 为了得到精确的显著对象分割结果,基于深度学习的方法大多引入注意力机制进行特征加权,以抑制噪声和冗余信息,但是对注意力机制的建模过程粗糙,并将所有特征均等处理,无法显式学习不同通道以及不同空间区域的全局重要性。为此,本文提出一种基于深度聚类注意力机制(deep cluster attention,DCA)的显著对象检测算法DCANet (DCA network),以更好地建模特征级别的像素上下文关联。方法 DCA显式地将特征图分别在通道和空间上进行区域划分,即将特征聚类分为前景敏感区和背景敏感区。然后在类内执行一般性的逐像素注意力加权,并在类间进一步执行语义级注意力加权。DCA的思想清晰易懂,参数量少,可以便捷地部署到任意显著性检测网络中。结果 在6个数据集上与19种方法的对比实验验证了DCA对得到精细显著对象分割掩码的有效性。在各项评价指标上,部署DCA之后的模型效果都得到了提升。在ECSSD (extended cornplex scene saliency dataset)数据集上,DCANet的性能比第2名在F值上提升了0.9%;在DUT-OMRON (Dalian University of Technology and OMRON Corporation)数据集中,DCANet的性能比第2名在F值上提升了0.5%,平均绝对误差(mean absolute error,MAE)降低了3.2%;在HKU-IS数据集上,DCANet的性能比第2名在F值上提升了0.3%, MAE降低了2.8%;在PASCAL (pattern analysis,statistical modeling and computational learning)-S (subset)数据集上,DCANet的性能则比第2名在F值上提升了0.8%,MAE降低了4.2%。结论 本文提出的深度聚类注意力机制通过细粒度的通道划分和空间区域划分,有效地增强了前景敏感类的全局显著得分。与现有的注意力机制相比,DCA思想清晰、效果明显、部署简单,同时也为一般性的注意力机制研究提供了新的可行的研究方向。  相似文献   

14.
3D车辆检测是自动驾驶场景中的一个关键问题,涉及到3D目标检测与目标分类。目前的3D检测与分类网络对于所有输入的点云数据一视同仁,但在实际检测过程中,点云中不同点对于检测的重要程度可能并不相同。为了得到更好的检测结果,通过引入注意力机制来得到不同点的特征的权重,从而在回归时让部分点的特征得到更多的重视。实验表明,该算法在保证实时效率的前提下,与现有算法相比,具有更高的准确度。  相似文献   

15.
针对现有的增量聚类算法对参数敏感度较高、时空复杂度较高等问题,提出了一种基于代表点的增量聚类算法。首先采用代表点聚类算法对静态的数据库进行聚类;然后根据新增加的节点与已存的代表点之间的关系,判断是否将其添加到已存的代表点所属的类簇中,或是提升为新的代表点;最后,再次采用代表点聚类算法对其进行聚类。实验结果证明,该算法对参数的敏感性低、效率高、占用空间小。  相似文献   

16.
现有的大多数孤立点检测算法都需要预先设定孤立点个数,并且还缺乏对不均匀数据集的检测能力。针对以上问题,提出了基于聚类的两段式孤立点检测算法,该算法首先用DBSCAN聚类算法产生可疑孤立点集合,然后利用剪枝策略对数据集进行剪枝,并用基于改进距离的孤立点检测算法产生最可能孤立点排序集合,最终由两个集合的交集确定孤立点集合。该算法不必预先设定孤立点个数,具有较高的准确率与检测效率,并且对数据集的分布状况不敏感。数据集上的实验结果表明,该算法能够高效、准确地识别孤立点。  相似文献   

17.
赵姝  柯望  陈洁  张燕平 《计算机应用》2014,34(10):2812-2815
为了实现复杂网络社团发现算法的复杂度和精确度间的均衡,提出一种基于聚类粒化的社团发现算法(CGCDA),将网络粒化获得的粒子视为一个社团,粒化结果即为对网络的社团划分。首先,将网络中的每个节点视为基本粒,通过初始粒化操作实现对网络的粒化;然后,针对获得的粒化集合中满足粒化系数的粒子进行聚类粒化操作,分层粒化直到不存在满足要求的粒子对;最后,将粒子对中的重叠节点视为孤立点,用邻居节点投票法把孤立节点归并到相应的粒子中,实现对复杂网络的社团划分。实验实现了Newman快速算法(NFA)、标号传播算法(LPA)和CGCDA。实验结果表明,CGCDA在四个基准数据集上可获得平均高于LPA 7.6%的模块度和低于NFA 96%的时间。CGCDA时间复杂度较低,获取的社团模块度较高,实现了社团发现时间和精确度的均衡,相比NFA、LPA总体性能更优。  相似文献   

18.
利用数据挖掘技术对网络中的海量数据进行分析从而发现入侵行为已成为目前异常检测研究的重点.为了进一步提高入侵行为检测的质量,提出了一种改进的异常检测算法.该方法首先将训练数据集转换为标准的单位特征度量空间,然后利用改进算法对数据进行划分,以找到聚类中心.最后对改进算法进行了性能分析与比较,实验结果表明:算法具有良好的稳定...  相似文献   

19.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号