首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
针对传统差异表达基因识别方法不能处理异质性数据集以及分析结果偏差较大的问题,提出了一个基于元分析及标准差过滤技术的差异表达基因识别算法标准差排序分析(RS-DM)。对来自于不同实验平台的数据进行整合分析,过滤掉伪差异表达基因PDEGs,并找出遗失的真正的差异表达基因TDEGs。经实验验证,算法简单有效。  相似文献   

2.
针对RankComp算法存在统计效能低的问题,为提升统计效能,提出RankComp+算法。RankComp+算法通过调整RankComp算法筛选稳定基因对的策略,并添加差异表达基因迭代筛选过程对RankComp算法进行改进。在仿真数据实验和肺癌配对样本数据实验中,RankComp+算法均表现稳定且优于其他算法。在缺血性心肌病数据中,RankComp+算法找出的差异表达基因显著富集到新的生物学通路,证明了RankComp+算法得出的结果具有生物学意义。综上,RankComp+算法能够稳定用于个体化差异表达基因识别并为疾病机理研究提供新的信息。  相似文献   

3.
针对传统差异表达基因分析方法使用单一数据集,不能处理异质性特性数据集、分析结果偏差大的问题,提出了联合驱动排除的概念,设计实现一种使用多研究数据集的元分析算法。应用公共数据库GEO中GDS2490和GDS2491数据集对设计的算法与微芯片显著性分析方法进行了对比。实验结果表明:设计的算法可以对数据集实行联合驱动排除,与微芯片显著性分析方法相比,可以有效分析异质性特性的数据集,准确找到差异表达的基因,验证了算法的有效性。该方法为差异表达基因识别提供了新思路。  相似文献   

4.
针对当前方法识别精度不高的问题,提出了基于连续密度隐马尔可夫模型的矿下异常行为识别算法。获取待识别矿下视频帧数据,通过级联分类器实现运动区域的初步检测,并读入下帧数据,直到所有帧检测完毕。引入连续密度隐马尔可夫(HMM)模型,将人体图像分解成若干相等区域,获取图像区域中的标准差值特征,对连续密度HMM进行训练,完成异常行为识别。实验结果证明,本文算法的识别结果具有精度高和检测率高的特性,说明其具有可靠性。  相似文献   

5.
提出了一种基于HSV(Hue-Saturation-Value)空间的Haar小波特征和多SVM(Support Vector Machine)分类器的摩托车识别算法,以解决因样本比例不平衡所导致的对摩托车识别性能差的问题.首先在HSV颜色空间基于无符号小波系数构造特征提取算法,然后对训练数据应用所提出的样本重构方法得到若干训练子集,基于各个训练子集训练相应的SVM分类器,识别时将各SVM的输出结果进行融合即可得到最终识别结果.实验结果表明:该方法识别性能高,鲁棒性好,对于受数据的不平衡性严重影响的对象识别具有较好的应用和推广价值.  相似文献   

6.
基因芯片数据具有维数高、样本少、高冗余的特点,以基因芯片数据进行特征选择及分类处理为研究对象。粗糙集理论能很好地消除冗余数据,但它不适应连续型的基因芯片数据,通过基于邻域粗糙集模型的方法能很好地解决这一问题,但如何选择好邻域半径来提高分类效率一直没有固定的方法。从各条件属性标准差来得到一组邻域半径,进而得到各样本邻域。经典的芯片数据实验表明:基于优化的邻域半径组比传统设定单一的邻域半径能取得较好的分类效果,和传统的特征选择算法做比较也能得到较少的特征基因和较高的分类能力。  相似文献   

7.
采用基因芯片技术检测了人脐带与骨髓两种不同来源间充质干细胞中miRNA的表达.结果表明:有26个miRNA差异表达,其中miR-29b、miR-20a、miR-31、miR-20b及miR-106a在人脐带间充质干细胞(UMSCs)中表达显著上调,差异倍数均高于3,miR-138则表达下调.在此基础上,采用实时荧光定量PCR技术对差异性显著的6个miRNA进行验证,检测结果一致.最后对特异性基因进行靶点预测,发现靶基因与mRNA转录、翻译以及细胞增殖、分裂、信号转导等功能相关.  相似文献   

8.
针对微阵列数据的标准化方法进行系统阐述,对高密度寡核苷酸阵列(Affymetrix芯片)的两类主要标准化算法:全数据算法和基线算法进行了探讨,同时对其他标准化算法(复合算法、VSN算法、全局loess算法、Invariant set算法等)进行了综合的论述和分析.基于标准数据集对前两类标准化算法处理的效果和效率做了对比测试,结果表明,算法在数据变异性的消除方面,对于非差异表达数据,全数据算法可以达到比较优秀的处理结果;对于差异表达数据,Quantile和Non-linear算法比较有效.在算法的耗时方面,Scale算法最优.全面考虑时间效率和标准化处理效果,Quantile算法具有一定的综合优势.  相似文献   

9.
集成数据选择特征基因   总被引:2,自引:0,他引:2  
特征选择技术在利用基因芯片进行疾病的分类和诊断中起到了关键作用。该文提出了一种新的集成数据选择特征基因的方法;针对多来源数据中的每一个,首先计算每个基因在这一数据上的差异表达统计量,然后用这些统计量来代替这一原始数据进而提取特征。在4个真实的基因表达数据集上对提出的方法进行测试并与对照的方法比较,实验结果显示,提出的方法所选出的特征应用于分类的效果更好。  相似文献   

10.
拟构建乳腺癌相关基因网络并从系统生物学角度解析乳腺癌发病的分子机制,采用基于SNP基因型谱和乳腺癌基因芯片表达谱数据分别进行全基因组关联分析和差异表达基因的筛选,并以此为基础构建乳腺癌相关基因网络,网络分析结果显示乳腺癌相关基因主要参与代谢、信号传导、蛋白质修饰等功能。该网络能够从系统层面上解释乳腺癌的遗传互作机制,并为研究其它复杂疾病提供一定的理论依据。  相似文献   

11.
现有基于稀疏表示的基因选择方法通过回归类标的值确定基因的相关性.对于同一个问题,类标的取值不同,对应的基因选择结果也不同.针对这一问题,提出了一种基于稀疏表示基因表达数据一维投影的基因选择方法.该方法用稀疏表示技术回归基因表达数据在其最可分的方向上的投影,并根据回归得到的基因集的相关性向量选择基因.在6组基因表达数据上...  相似文献   

12.
常用的排列法从微阵列数据中选择的基因集合会包含相关性较高的基因,这会影响分类器的性能,为了去除这些冗余基因(特征),提出了无监督的特征选择算法.该算法主要包含:将原始特征集划分为一组相似的子集(聚类);从每个聚类中选择代表性特征.特征的划分采用特征间的相关性作为测度以k近邻原则来完成.该算法无需指定聚类数量,时间复杂度低.真实的生物学数据实验证明该算法可显著提高分类器的分类准确性.  相似文献   

13.
基于谱的错误定位(SBFL)是减小软件调试困难的有效方法。SBFL方法将运行特征组合成不同的错误定位模型,可这些模型受特定程序及测试集影响,性能并不稳定。基于此,提出一种排序学习方法LTR-sbfl,针对不同的程序及其测试集,能学习到相应的错误定位模型。LTR-sbfl首先收集已标注错误语句的程序旧版本,采用与SBFL相同的方法,获得程序语句的运行特征。接着,将错误行与正确行代码的运行特征两两相减,确定为训练数据的一个实例。最后,使用分类算法,从训练数据构造排序模型。在3个基准数据集的实验结果证实,LTR-sbfl的定位精度优于其他SBFL方法。  相似文献   

14.
基于模糊c-均值聚类的微阵列基因表达数据分析   总被引:5,自引:2,他引:3  
微阵列技术已成为染色体研究的主要工具,但是它所面临的挑战是如何对海量数据进行分析.利用模糊c-均值聚类对这些数据进行分析,从而发现有差异的基因表达.结果表明,模糊聚类是一种用来为微阵列基因表达数据寻找有差异的基因表达的一种有用工具.  相似文献   

15.
基于人工神经网络集成的微阵列数据分类   总被引:2,自引:0,他引:2  
基因数量远多于样本数量是基因表达微阵列数据进行疾病诊断所面临的主要挑战,为此提出了采用人工神经网络集成的组织分类方法.该方法使用Wilcoxon测试选择用于与分类相关性较高的重要基因,通过凸伪数据法产生神经网络集成中各个体的训练集,用简单平均法集成网络个体的测试结果.采用实际的微阵列实验数据集分别进行独立测试和交叉验证测试,结果表明,该方法性能优于单个神经网络、最近邻法和决策树.受试者特征曲线测试表明,神经网络集成性能优于单个神经网络.  相似文献   

16.
Several users use metasearch engines directly or indirectly to access and gather data from more than one data sources. The effectiveness of a metasearch engine is majorly determined by the quality of the results and it returns and in response to user queries. The rank aggregation methods which have been proposed until now exploits very limited set of parameters such as total number of used resources and the rankings they achieved from each individual resource. In this work, we use the neural network to merge the score computation module effectively. Initially, we give a query to different search engines and the top n list from each search engine is chosen for further processing our technique. We then merge the top n list based on unique links and we do some parameter calculations such as title based calculation, snippet based calculation, content based calculation, domain calculation, position calculation and co-occurrence calculation. We give the solutions of the calculations with user given ranking of links to the neural network to train the system. The system then rank and merge the links we obtain from different search engines for the query we give. Experimentation results reports a retrieval effectiveness of about 80%, precision of about 79% for user queries and about 72% for benchmark queries. The proposed technique also includes a response time of about 76 ms for 50 links and 144 ms for 100 links.  相似文献   

17.
为了找出肿瘤特征基因,将14种不同组织类型的肿瘤作为一个整体.分析其与对应的正常组织样本间基因表达的差异,提取出反映样本类别特征的特征基因,为生物医学研究中分析基因表达数据提供参考.首先利用相关系数,在一定范围内排除噪声基因,然后采用质心收缩法提取出能够反映样本组织类型的特征基因.提取出的特征基因对样本聚类的正确率为87.9%,对测试集样本分类的正确率为81.1%,优于特征基因提取前的聚类和分类结果.  相似文献   

18.
为了揭示肿瘤发生发展的分子机制,结合基因功能分类体系数据库(gene ontology,简称GO),采用网络分解算法对结肠癌基因表达谱数据进行了研究.研究结果表明,与结肠正常组织基因模块相比,结肠癌基因模块与细胞周期调节、抗细胞程序性死亡、信号转导、细胞增殖等功能类相关,由此推论结肠癌基因功能模块结构的改变导致了结肠癌的发生.  相似文献   

19.
针对自由格式的手写体汉字,提出一套系统完整的笔迹图像预处理算法,其中我们将汉字宽度的统计特性与高斯分布的特性结合进行粘连字的滤除,然后根据粘连字的投影图中波谷点的位置,选择某一阈值作为最佳切分点将其分割开来,从而很容易实现了字符大小的归一化、汉字的任意拼接和行倾斜的校正.该算法使得整个预处理子系统更加稳定与完善,为后续的笔迹鉴别提供了可靠的保证.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号