DNA序列分析系统的开发应用 |
| |
引用本文: | 李晓艳,张玉冰.DNA序列分析系统的开发应用[J].数字社区&智能家居,2014(8):5220-5222. |
| |
作者姓名: | 李晓艳 张玉冰 |
| |
作者单位: | 河南师范大学计算机与信息工程学院,河南新乡453007 |
| |
摘 要: | 20世纪90年代,人类基因组计划的启动,有力推动了DNA测序工作的发展。寻找某些特征片段(功能片段)在序列中的分布规律,对遗传学、生物信息学等都有重要的应用意义。在教学、研究中发现,应用数学分析软件MATLAB的字符串处理功能,可以容易地达到功能片段分析的目的,本系统通过分析DNA序列链之间的关联程度,构造出特征矩阵,根据模糊C均值算法较准确的对DNA序列的集合进行了分类,同时利用matlab的图像显示功能将聚类的最终结果清楚明了的显示在图像中,使用户能清楚的看到聚类效果。本系统主要研究了DNA链碱基序列分析、多个DNA链特征矩阵提取、模糊C均值聚类算法分类DNA等三大部分。首先该系统对DNA序列的总长度和功能序列的长度进行了测量,利用一维数组确定功能片段在DNA序列中的位置特征,从而完成了对DNA碱基序列的分析;其次该系统对用户给出的数个DNA链进行序列之间的特征分析,统计出每个序列的(A,T,C,G)碱基密度,得到一个特征矩阵,有效的为模糊聚类分析方法提供数据来源。最终该系统应用模糊C均值聚类算法,利用特征矩阵的数值,将数个DNA序列聚类并分为两类。
|
关 键 词: | 模糊C均值 特征片段 系统开发 |
本文献已被 维普 等数据库收录! |
|