首页 | 本学科首页   官方微博 | 高级检索  
     

HotDataSpider,一个生物医学文献热点数据自动化抽取工具
引用本文:许庆炜,郭坚. HotDataSpider,一个生物医学文献热点数据自动化抽取工具[J]. 计算机与数字工程, 2010, 38(11): 69-71,85
作者姓名:许庆炜  郭坚
作者单位:[1]湖北第二师范学院计算机科学与工程系,武汉430205 [2]华中科技大学中英HUST-RRes作物基因工程和基因组学联合实验室,武汉430074 [3]中国科学院上海生命科学研究院系统生物学重点实验室生物信息中心,上海200031
摘    要:学术期刊中的附加数据是进行数据分析和文本挖掘的重要依据,具有的分散性、多样性和时效性的特点,难以管理和维护,文章将这类数据称HotData。HotDataSpider以生物医学类文献为研究对象,对生物信息学领域15本国际权威期刊提供的附加数据进行分析,实现了自动抽取、转换,最终将整理好的数据集批量导入到上海生物信息技术研究中心提供的HotData主题数据库中。

关 键 词:HotData  ETL  生物医学  附加数据

HotDataSpider, An ETL Tool for Supplementary-Data Extraction of Biomedical Journals
Xu Qingwei,Guo Jian. HotDataSpider, An ETL Tool for Supplementary-Data Extraction of Biomedical Journals[J]. Computer and Digital Engineering, 2010, 38(11): 69-71,85
Authors:Xu Qingwei  Guo Jian
Affiliation:),)(Computer Science and Technology,HuBei University of Education1),Wuhan 430205)(China-UK HUST-RRes Crop Genetic Engineering and Genomics Joint Laboratory2),Wuhan 430074)(Shanghai Center for Bioinformation Technology3),Shanghai 200235)
Abstract:Journal's supplementary-data play an important role in data analysis and text mining,which need to be kept in public repositories.This kind of supplementary material will be named HotData.In this paper,we developed HotDataSpider which investigated how to extract,annotate and load these HotData from the 15 international authoritative biomedical journals.
Keywords:HotData  ETL  biomedicine  supplement data
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号