首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 109 毫秒
1.
大规模化合物子结构检索的并行实现与优化   总被引:3,自引:1,他引:2  
化合物的子结构检索在计算机辅助药物设计、波普学、化学数据库等领域是不可或缺的工具.然而由于子结构检索是一个NP完备性的问题,获得用户可接受的平均检索时间一直是研究人员十分关注的问题,其方法主要有改进算法和提升硬件条件2个方面.当化学结构数据库的规模达到百万乃至千万级别时,尽管改进算法的方式能够获得一定的检索效率提升,但其提升的空间有限,因而,集群并行方式是大规模化合物子结构检索应用的必然选择.本文以Chem D B Portal的化学子结构检索系统为基础,实现了基于集群并行的化学子结构检索系统,并进行了任务均分、多线程并行等优化.在包含800万个化合物结构的化学结构数据库中,利用5个节点的小型集群,选取10个较为典型的提问结构进行子结构检索测试.测试结果为基于集群的化学子结构检索的平均检索时间由初始单节点时的34.1 min降低为2.75 min,检索效率平均提高12.4倍,表明在大规模乃至超大规模的数据条件下,集群并行化方式能够显著地提高子结构检索系统的执行效率.  相似文献   

2.
为了有效地获取分子结构数据库中的分子结构信息,就必须首先解决分子二维子结构检索问题。本文采用了一种通用图同构算法—VF2算法来对2个分子二维结构图进行匹配,程序采用标准C 语言开发,在运行效率和可移植性方面都可以满足要求。同时,还使用了开源化学软件OpenBabel来解决在检索时遇到的芳香环的识别问题。经过与商业软件ISIS/Base对照实验,检索结果正确,检索时间可以满足要求。  相似文献   

3.
设计了一种基于大型数据库管理系统Oracle的化学结构数据存储模式,并实现了相应于此模式的高效化学结构检索方法。结构检索方法建立在图子图匹配算法VF2的基础上,对其进行了必要的改造和扩展,使之适合于化学结构检索。在此基础上,针对美国NCl(National Cancer Institute)25万个化合物的2D结构建立了数据库,成功进行了结构检索试验。结果表明,这种实现方法不仅能高效存储并准确检索化合物的结构信息,而且也容易实现与药物研发过程中所产生的大量其它数据(如生物筛选数据和DNA芯片基因表达数据等)进行高效整合。这个设计的改进版已经集成于微芯公司的药物研发生化信息学软件系统——TASS(Target Activity Structure System)中。  相似文献   

4.
采用关系数据库插件能够实现化合物描述符(FingerPrint)的生成、建立索引和化合物的子结构检索。本文以PubChem有机化合物Molfile为数据源,在Oracle关系数据库上分别安装插件OrChem(JAVA)和Bingo(C~(++))构建了化合物分子结构数据库。本文从FingerPrint的构成和索引策略两方面讨论了OrChem和Bingo的主要差异,并选取10个特征化合物进行子结构检索测试。对存储40万种化合物的分子结构数据库的测试结果显示,OrChem可满足用户检索响应,Bingo则更为快捷。对于存储2600万种化合物的分子结构数据库,针对Bingo通过优化Oracle数据库内存管理、数据表结构、子结构预筛选参数,实现了满足用户的高效检索。  相似文献   

5.
设计了在数据库中化学结构的存储方式,并在系统分析化学结构在计算机中的不同描述法的基础上,提出了一种基于Web的化学结构搜索法。该方法由Robot抓取Web文档中的化学结构信息,利用Oracle建立化学结构数据库,通过建立化学结构的索引,实现对化学结构的全结构、子结构、结构相似性检索。  相似文献   

6.
工程化学数据库(ECDB)中,分子结构信息的存储、子结构检索和图形显示查询结果是实现结构数据库功能的基础.本文就研究这三问题,在数据存储方面设计了按MOL文件结构的特殊存储方法,压缩大量存储;在子结构检索方面,改进VF2算法的效率;开发图形显示模块,设计子结构检索平台.  相似文献   

7.
化学结构相似性检索在现代化学研究中具有重要作用。而化学结构的相似性度量是进行相似度检索的基础和前提。目前在化学信息学的研究中,有数量众多的化学结构距离度量和相似度表示方法。本文采用了Daylight的分子指纹方法,并采用了Tanimoto系数定义的相似度度量方法。并根据这种度量方法使用CDK来进行计算化学结构的相似度指数。在上述研究工作的基础上,开发了基于浏览器/服务器模式的化学结构相似度检索系统,通过该系统可以在中药活性成分数据库中进行化学结构相似度检索。用户在进行化学结构相似度检索时,可以选择已存在的化学结构,也可以采用JME来绘制新的化学结构。下一步将在该数据库中进行聚类分析和分子多样性的研究。  相似文献   

8.
随着互联网技术的不断发展,使在线资源变得丰富而便于查询.对于科研工作者来说,在线免费检索化合物结构与活性变得更方便快捷.本文介绍了几个常用的化合物活性数据库.并对其站点,内容,检索方式以及各自特点等做了简要阐述.其中PubChem、ChemBank和ChEBI是关于小分子生物活性的公共数据库,eMolecules和ChemExper是关于商购化合物的数据库,他们的检索方式主要有文本检索和结构检索.DrugBank是1个包含药物的结构、药效、作用靶标等信息的综合数据库,有ChemQruery,TextQuery、SeqSearch和Data Extractor,4种检索形式.ZINC数据库是1个免费的用于虚拟筛选的化合物数据库,主要进行化合物结构检索.ADME/Tox Boxes和Molinspiration Cheminformatics是对分子性质进行计算和预测的数据库,用户可以通过分子结构的输入或SMILES进行检索.  相似文献   

9.
利用JSP实现基于Internet中药化学数据库的检索   总被引:1,自引:2,他引:1  
JSP(JavaServer Pages)是Sun公司推出的一种服务器端动态技术,是目前最先进的Web服务技术。中药化学数据库包含中药材,化合物及相关信息8500余条记录,本文用JSP技术在Internet上实现了中药化学数据库的检索。  相似文献   

10.
基于B/S模式,利用JSP Web开发技术,采用一种新的技术路线在维吾尔药资源化合物数据库上设计和实现了一个化合物结构检索系统.系统用C++编程实现了VF2算法,作为DLL提供给系统进行JNI调用,从而实现了化合物的结构检索.系统同时实现了匹配结构的二维和三维动态显示.测试结果表明,该系统运行安全可靠,完全可以应用于实际工作中.  相似文献   

11.
JAVA在SQLite嵌入式数据库中的应用   总被引:6,自引:2,他引:6  
SQLite作为一个开源的嵌入式数据库产品,具有系统开销小,检索效率高的特性,适用于手机、PDA、机顶盒设备等电器,并且作为嵌入式数据库在可下载的消费类应用程序中运行的很好。这篇文章介绍嵌入式数据库产品SQLite的技术特点,并着重讨论研究与Java语言之间的接口,并以实例说明如何使用JAVA开发基于SQLite的应用程序。  相似文献   

12.
ISIS Base化学数据库向关系数据库的迁移   总被引:2,自引:2,他引:0  
雷静 《计算机与应用化学》2005,22(11):1044-1046
ISIS Base是MDL公司提供的一个基于桌面的化学信息管理系统。利用ISIS Base用户可以对化学结构及相关的科学数据进行存储、搜寻和检索等管理工作。ISIS/Base基于表格的搜寻功能,可以让用户根据不同的需要将化学结构、文本及数字等类型的检索要求组合在一起,对相关的数据库进行检索和管理。但是它需要其它软件系统才能实现局域网和Internet应用。为了实现ISIS Base数据库中的数据在网络中的应用,本文介绍了一种ISIS Base数据向关系数据库迁移的方法。  相似文献   

13.
随着近年来开源软件的蓬勃发展,现代化软件的开发和供应模式极大地促进了开源软件自身的快速迭代和演进,也提高了社会效益.新兴的开源协作的软件开发模式,使得软件开发供应流程由较为单一的线条转变为复杂的网络形态.在盘根错节的开源软件供应关系中,总体安全风险趋势显著上升,日益受到学术界和产业界的重视.针对开源软件供应链,厘清了其关键环节,基于近10年的攻击事件,归纳了开源软件供应链的威胁模型和安全趋势,并通过对现有安全研究成果的调研分析,从风险识别和加固防御这两个方面总结了开源软件供应链安全的研究现状,最后对开源软件供应链安全所面临的挑战和未来研究方向进行了展望和总结.  相似文献   

14.
介绍了11世纪中国突厥语言学著作"突厥语大词典"的电子词典软件的设计与实现。突厥语大辞典的电子版是突厥语大辞典的维、土、汉、英版本的基础上研究了多语种(维吾尔语、土耳其语、汉语、英语)突厥语大辞典电子版的构建技术。实现了具有通过原词或原词在以上四种不同语言中的词义来快速查找的功能。详细介绍了本词典的总体结构、功能、数据库设计、查找算法、系统运行机制。最后提出了进一步增强、改进系统的一些设想。  相似文献   

15.
嵌入式数据库SQLite加密方法分析与研究   总被引:3,自引:0,他引:3  
SQLite作为一个开源的嵌入式数据库,具有系统开销小、检索效率高等特性.主要讨论SQLite数据库的安全问题,对在Windows中的加密方法进行研究和分析,深入分析了其实现步骤和接口.同时将加密方法对性能的影响与其他数据库作了比较分析,证明了加密方法的有效性.  相似文献   

16.
介绍了11世纪中国突厥语言学著作“突厥语大词典”的电子词典软件的设计与实现。突厥语大辞典的电子版是突厥语大辞典的维、土、汉、英版本的基础上研究了多语种(维吾尔语、土耳其语、汉语、英语)突厥语大辞典电子版的构建技术。实现了具有通过原词或原词在以上四种不同语言中的词义来快速查找的功能。详细介绍了本词典的总体结构、功能、数据库设计、查找算法、系统运行机制。最后提出了进一步增强、改进系统的一些设想。  相似文献   

17.
XML作为网络数据交换标准,在关系型数据库仍占市场主流的局面下,我们不得不经常面对两种模型数据之间的转换.本文首先讨论了一个XML和关系型数据交换的简单模型,并且针对目前计算机硬件运行越来越快的情况,基于开源软件应用,提出了实现该模型的一种快捷使用的方法.  相似文献   

18.
基于数据库的Internet化学资源导航系统与用户的交互   总被引:7,自引:6,他引:1  
针对基于文件方式管理的Internet化学化工资源导航系统的问题,结合ChIN的发展需求,在第二版ChIN中采用了关系数据库来管理整个导航系统,本文介绍了第二版ChIN的数据库设计和模块设计,着重对导航系统与用户的交互性进行分析设计,建立了Web用户资源提交、用户对资源投标及评价信息的提交、信息订阅与发送、全文检索与关系数据库检索相结合的站点检索等系统,极大地提高了ChIN与用户的交互能力,既有助  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号