首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 883 毫秒
1.
设计了一种基于大型数据库管理系统Oracle的化学结构数据存储模式,并实现了相应于此模式的高效化学结构检索方法。结构检索方法建立在图子图匹配算法VF2的基础上,对其进行了必要的改造和扩展,使之适合于化学结构检索。在此基础上,针对美国NCl(National Cancer Institute)25万个化合物的2D结构建立了数据库,成功进行了结构检索试验。结果表明,这种实现方法不仅能高效存储并准确检索化合物的结构信息,而且也容易实现与药物研发过程中所产生的大量其它数据(如生物筛选数据和DNA芯片基因表达数据等)进行高效整合。这个设计的改进版已经集成于微芯公司的药物研发生化信息学软件系统——TASS(Target Activity Structure System)中。  相似文献   

2.
哈希表示能够节省存储空间,加快检索速度,所以基于哈希表示的跨模态检索已经引起广泛关注。多数有监督的跨模态哈希方法以一种回归或图约束的方式使哈希编码具有语义鉴别性,然而这种方式忽略了哈希函数的语义鉴别性,从而导致新样本不能获得语义保持的哈希编码,限制了检索准确率的提升。为了同时学习具有语义保持的哈希编码和哈希函数,提出一种语义保持哈希方法用于跨模态检索。通过引入两个不同模态的哈希函数,将不同模态空间的样本映射到共同的汉明空间。为使哈希编码和哈希函数均具有较好的语义鉴别性,引入了语义结构图,并结合局部结构保持的思想,将哈希编码和哈希函数的学习融合到同一个框架,使两者同时优化。三个多模态数据集上的大量实验证明了该方法在跨模态检索任务的有效性和优越性。  相似文献   

3.
高选择性拓扑指数和网络上化学结构的检索系统   总被引:1,自引:0,他引:1  
描述以高选择性拓扑指数EAID为基础构建的结构检索系统。此系统以EAID指数来表征化合物的结构,即每一化合物,运用EAID计算方案得到一个数学的量,以此为基础,来进行化合物结构的检索。由于是一简单数据的比较,所以检索准确快捷,适合于网络传输和交流。现已成功地应用于检索本实验室的结构数据库。另外,文中还介绍了EAID的算法和验证。  相似文献   

4.
随着互联网技术的不断发展,使在线资源变得丰富而便于查询.对于科研工作者来说,在线免费检索化合物结构与活性变得更方便快捷.本文介绍了几个常用的化合物活性数据库.并对其站点,内容,检索方式以及各自特点等做了简要阐述.其中PubChem、ChemBank和ChEBI是关于小分子生物活性的公共数据库,eMolecules和ChemExper是关于商购化合物的数据库,他们的检索方式主要有文本检索和结构检索.DrugBank是1个包含药物的结构、药效、作用靶标等信息的综合数据库,有ChemQruery,TextQuery、SeqSearch和Data Extractor,4种检索形式.ZINC数据库是1个免费的用于虚拟筛选的化合物数据库,主要进行化合物结构检索.ADME/Tox Boxes和Molinspiration Cheminformatics是对分子性质进行计算和预测的数据库,用户可以通过分子结构的输入或SMILES进行检索.  相似文献   

5.
开源软件在化学数据库分子结构检索中的应用   总被引:2,自引:2,他引:0  
分子结构检索是化学数据库必备的检索手段,利用开源化学软件是实现分子结构检索的有效途径.不同于商业软件的解决方案,开源本身就体现了经济性和可重复开发的特点.本文利用Java开源化学软件开发工具包如Chemistry Development Kit(CDK)、JOELib的基本构件,基于JSP Servlet Bean MySQL技术搭建了一个网络化学数据库结构检索平台.其中包括分子全结构和子结构检索,并实现了在线提交分子和化合物结构的三维显示等.对包含12万化合物结构信息的数据库的测试表明,该系统在经过预处理和一系列优化措施下,实现了较好的检索性能.  相似文献   

6.
为解决专业型化学数据库化合物检索和筛选难题,从研究化合物分子式的定义和基本构成入手,总结和归纳植物化学成分数据库中化合物分子式数据的类型及特点,得出的分子式表达式通式,设计算法程序分析和处理分子式数据,并生成分子式特征数据。在植物化学成分数据库中,结合分子式特征数据对化合物进行检索和筛选,实现了化合物的分子式综合检索技术。介绍分子式综合检索的应用实例,以此来丰富植物化学成分数据库的检索和筛选方式。分子式数据处理方法解决了用户在分子式检索时输入与数据库表达不一致的问题,提高了化合物检索和筛选效率。分子式数据处理方法还可以应用于功能材料数据库、药物化学数据库、天然产物数据库等专业型化学数据库的化合物检索和筛选。  相似文献   

7.
为了满足大规模零件库的实时检索要求和零件模型以结构单元重用特点,提出一种基于区域分割的零件三维模型检索方法.该方法将平面划分为边界凸平面、边界凹平面和混合边界平面;利用边界邻域曲率、垂直边界曲率和沿边界曲率定义曲面在该边界的表面边界凹凸性,提出了马鞍面在区域凹凸性分析时计为凹、凸和平表面的约定条件.根据两表面合并后区域凹凸性是否保持不变,提出了边分类规范;通过外部边闭合规范、待定边转换规范和表面平区域合并规范,实现零件三维模型的区域分割.通过表面区域编码规范对分割区域编码,利用区域结构码实现相似结构零件的检索.实验结果表明,区域分割后零件整体相似结构检索更加有效,局部相似结构检索可以通过二元邻接区域结构求交集实现.  相似文献   

8.
摄影测量中一种新的编码点识别和提取算法   总被引:1,自引:0,他引:1  
描述一种符合摄影测量要求的编码点,并提出一种新的识别和提取编码点算法。这种编码点有15位编码,编码的数量达到2191,完全能够满足摄影测量的要求。通过CannY算子边缘提取和椭圆拟合,极大地提高了识别的正确率,能够实现解码的高鲁棒性。编码点中心坐标的精度达到亚像素级。该解码方法简单,且编码点识别率极高。  相似文献   

9.
当前,信息检索系统通常采用“检索+重排序”的多级流水线架构。基于稠密表示的检索模型已经被逐渐应用到第一阶段检索中,并展现出了相比传统的稀疏向量空间模型更好的性能。考虑到第一阶段检索所需的高效性,大多数情况下这些模型的基本架构都采用双编码器(bi-encoder)结构。对查询和文档进行独立的编码,分别得到一个稠密表示向量,然后基于获得的查询和文档表示使用简单的相似度函数计算查询-文档对的得分。然而,在编码文档的过程中查询是不可知的,而且文档相比查询而言通常包含更多的主题信息,因此这种简单的单表示模型可能会造成严重的文档信息丢失。为了解决这个问题,设计了一种新的语义检索方法 MDR(multi-representation dense retrieval),将文档编码成多个稠密向量表示。同时,该方法引入覆盖率(coverage)机制来保证多个向量之间的差异性,从而能够覆盖文档中不同主题的信息。为了评估模型性能,在MS MARCO数据集上进行了段落排序和文档排序任务,实验结果证明了MDR方法的有效性。  相似文献   

10.
李应 《计算机应用》2008,28(4):1012-1015
提出一种用小波包最好基结构系数和多分辨塔型算法检索音频数据的方法。这种方法首先对音频数据文件进行预处理,即把音频原数据文件变换成小波包最好基结构系数和小波不同级多分辨分析系数;最后用最好基结构系数对这些文件进行初步分类;最后再用塔型算法进行不同层次的检索。把这种方法与使用不同级小波逼近系数算法比较,结果表明这种方法对音频数据文件检索是有效的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号