共查询到19条相似文献,搜索用时 102 毫秒
1.
在癌症研究中,随着高通量测序技术发展已经产生了海量的复杂数据。尽管有了一些利用深度学习和统计学方法进行多组学数据整合的研究,但目前仍缺乏较为有效率的整合方法。因此提出一种基于深度自编码器的多组学数据整合方法(deep autoencoder for multi-omics integration,DAEMI)。它利用自编码器中的瓶颈层,学习多组学数据的特征表示。与先前利用深度学习整合的研究相比,DAEMI可以发现明显生存差异的癌症亚型。同时因为不需要生存数据来选择特征,DAEMI可以使用更多特征进行K均值聚类,进而完成癌症分型任务。将DAEMI应用于模拟数据集与四个癌症数据集实验,通过与高阶路径相似度网络的融合模型(HOPES)、相似性网络融合(SNF)、iClusterPlus和moCluster进行比较,结合模拟数据集测试结果与真实癌症数据集测试结果来看,DAEMI要优于其他方法。相应的生物功能分析揭示,神经退行性疾病与线粒体功能障碍可能与癌症共享某些生物学通路。 相似文献
2.
【目的】作物组学研究是农业作物科学发展的未来研究趋势,在数据密集型科学研究背景下,作物组学数据存在数据量大、来源多、结构复杂的特点,对多源异构作物组学数据的融合有利于优质作物种质资源的挖掘,助力农业科技发展。【方法】运用文献调查和网络数据收集法,对当前作物组学数据的分布和数据组织结构进行了分析,得出了多组学数据资源的主要特征;以高粱为例通过语义分析和文献查询方法,优化设计得到新的高粱多组学数据标准元数据,并开发脚本实现了不同数据库元数据到标准元数据的映射和转换,基于元数据实现了对多源数据的融合;通过整合mapping、变异分析、DEG计算等多种生物信息学方法,实现了对异构组学数据的融合。【结果】形成了高粱多源异构组学数据融合方法,能够实现对NCBI、EMBL、PlantGDB、国家农业科学数据中心等数据库中基因组、转录组、代谢组、表型组数据的融合。【局限】需进行数据源、标准元数据的针对性开发,以满足在其它作物中推广的实际需求。【结论】本文基于元数据和生物信息学方法,开发得到了作物多源异构组学数据的融合方法,具有普适性,可在其它作物品种中推广应用。 相似文献
3.
4.
针对生存分析中多组学数据带来的维数灾难和过拟合问题,提出了一种基于多组学数据和稀疏变分自编码器的生存分析算法VAESCox。该算法将变分自编码器的基本结构与稀疏编码和生存分析相结合,在无监督阶段训练变分自编码器学习低维表示,在监督阶段将训练的权重迁移到生存分析模型,并对传递权重进行微调和稀疏编码。实验结果表明,在八种不同癌症类型的数据集上,VAESCox模型在消融和对比实验中均取得了较高的C指数值。与其他四种基准生存分析方法相比,所提算法不仅缓解了多组学数据融合的过拟合问题,也显著提高了生存预测性能,表明不同组学数据的融合有助于预后生存结果的精准预测。 相似文献
5.
6.
随着诚信建设进一步推广,信用系统建设越显重要。从分布异构数据库中提取有用数据以及数据整合,是信用系统的核心技术。文中介绍了分布异构数据库的特征和连接技术,以及数据交换技术。采用了TUXEDO/Q消息传递机制和SAX文档解析标准,使信用数据可靠传输和异构数据库得以无缝连接,实现了分布异构数据源系统的信用数据整合共享。得出了一种基于XML和TUXEDO的异构信用数据有效整合的方法。 相似文献
7.
多源异构数据整合在信用系统中的应用研究 总被引:2,自引:1,他引:2
随着诚信建设进一步推广,信用系统建设越显重要。从分布异构数据库中提取有用数据以及数据整合,是信用系统的核心技术.文中介绍了分布异构数据库的特征和连接技术,以及数据交换技术。采用了TUXEDO/Q消息传递机制和SAX文档解析标准,使信用数据可靠传输和异构数据库得以无缝连接,实现了分布异构数据源系统的信用数据整合共享。得出了一种基于XML和TUXEDO的异构信用数据有效整合的方法。 相似文献
8.
为改善上海市河道水环境,针对现有河湖水质存在的问题,依靠信息化和数字化技术,汇聚各类水质相关数据,开展数据整合与分析,推出河道水质变化三级报警预警,建立相应业务处置机制和流程,探索河湖水质智能化应用,重点研究河湖水质数据监测、变化趋势分析、波动报警预警、整改处置和结果反馈等5个环节闭环管理.通过河湖水质智能应用研究,并在上海市河长制办公室工作平台和城市运行"一网统管"水务专题中进行实际应用.实际应用表明:河湖水质智能应用可有效发挥作用,强化对河湖水质恶化等问题的持续跟踪和有效监督,提高河湖水质治理效率,推进河湖协同治理,有效改善河湖水环境质量. 相似文献
9.
多维数据解析方法越来越引起人们的重视,非负矩阵因子分解算法已较广泛地用于图像分析。基于PARAFAC模型,将非负矩阵因子分解算法拓展为三维非负矩阵因子分解算法(three dimension non-negative matrix factorization,NMF3)。其原理简明,算法易于执行。与基于向量计算的其他三维化学计量学算法不同,NMF3基于矩阵计算单个元素,所以不必将三维数据平铺处理,就可直接解析,为三维数据解析研究提供了一种全新的思路和方法。应用NMF3解析模拟三维数据和代谢组学数据,结果令人满意。 相似文献
10.
多生物特征识别技术综述 总被引:3,自引:0,他引:3
介绍了生物认证的发展状况和多生物特征提出的背景,提出了多生物特征认证的整体框架和具体参数的表征,并对不同的整合方法做了比较,分析了各自的优缺点。提出了最后关于多生物特征识别发展的看法。 相似文献
11.
12.
13.
一种基于XML的数据集成系统框架及其应用 总被引:9,自引:0,他引:9
该文首先较为全面地分析了现有的数据集成方式,在此基础上提出了一种基于XML的数据集成系统框架XDIFrame,并进一步阐述了XDIFrame实现中的关键技术,给出了该框架在法院综合信息系统中的具体应用。 相似文献
14.
15.
本文首先通过讨论 CIMS系统集成、信息集成以及数据完整性之间的关 ,系强调了数据完整性在 CIMS中的地位 ,然后阐述了其概念、内涵 ,并提出数据完整性层次或级别的概念及相关的几个问题 ,接着讨论并给出了基于DBMS的信息系统的数据完整性实现机制 ,最后利用上述机制完成了某 CIMS应用示范工程信息集成中数据完整性的设计和实现方案 . 相似文献
16.
刘本发 《电脑编程技巧与维护》2012,(16):54-55
随着企业的发展、信息化技术在企业的大量运用,过去不同时间、不同地点、采用不同技术建立的局部的应用系统越来越多,成为一个个信息孤岛。以SOA、Web Services、XML等技术为支撑的数据集成系统,可以实现一个资源共享的统一的数据平台,解决信息孤岛问题。 相似文献
17.
首先通过讨论CIMS系统集成、信息集成以及数据完整性之间的关系强调了数据完整性在CIMS中的地位,然后阐述了其概念、内涵,并提出数据完整性层次或级别的概念及相关的几个问题,接着讨论并给出了基于DBMS的信息系统的数据完整性实现机制,最后利用上述机制完成了某CIMS应用示范工程信息集成中数据完整性的设计和实现方案。 相似文献
18.
针对解决因分时建设开发造成应用系统的应用环境和数据规范不一、信息孤岛严重等问题,而产生的数据集成、展现的需求进行了分析,提出了2种集成策略。对数据的采集、抽取、转换和加载处理过程进行了分析探讨,集成的数据可以以数据视图的形式直接给用户使用或展现,也可以用来构建数据仓库,进行深入的分析和挖掘。 相似文献
19.
赵振佳 《网络安全技术与应用》2013,(11):85-85,89
企业信息系统建设从办公自动化升级到业务承载,企业需要管理的数据越累越多.企业信息系统建设需要更加综合化和开放化.本文描述了数据融合的特征,及数据融合对企业经营管理的影响.并提出了基于数据融合的企业信息系统建设的措施建议. 相似文献