首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
学术引用信息可视化方法综述   总被引:1,自引:0,他引:1  
学术文献中蕴含着丰富的引用信息,文献引用是科研评价和文献计量领域的主要分析对象和研究热点.相比基于数学和统计学的定量分析方法,利用可视化方法既可以实现引用信息时序、层次结构的直观呈现,也可以实现复杂引用网络的交互式挖掘,对科研评价改革和文献计量方法创新具有重要意义.文中首先介绍了近年来国内外学术引用信息分析的相关研究,...  相似文献   

2.
命名实体是文本中承载信息的重要单元,正确分析存在歧义的命名实体对文本的理解起着关键性作用。该文提出基于多源知识和Ranking SVM的中文微博命名实体链接,结合同义词词典、百科资源等知识产生初始候选实体集合,同时从文本中抽取多种组合特征,利用Ranking SVM对候选实体集合进行排序,从而得到目标实体。在NLP&CC2014中文微博实体链接评测数据集上进行了实验,获得了89.40%的平均准确率,与NLP&CC2014中文微博实体链接评测取得最好成绩的系统相比,本文的系统具有一定的优势。
  相似文献   

3.
应用链接分析的web搜索结果聚类   总被引:3,自引:0,他引:3  
随着web上信息的急剧增长,如何有效地从web上获得高质量的web信息已经成为很多研究领域里的热门研究主题之一,比如在数据库,信息检索等领域。在信息检索里,web搜索引擎是最常用的工具,然而现今的搜索引擎还远不能达到满意的要求,使用链接分析,提出了一种新的方法用来聚类web搜索结果,不同于信息检索中基于文本之间共享关键字或词的聚类算法,该文的方法是应用文献引用和匹配分析的方法,基于两web页面所共享和匹配的公共链接,并且扩展了标准的K-means聚类算法,使它更适合于处理噪音页面,并把它应用于web结果页面的聚类,为验证它的有效性,进行了初步实验,实验结果显示通过链接分析对web搜索结果聚类取得了预期效果  相似文献   

4.
DOI在数据引用中的应用:问题与建议   总被引:1,自引:0,他引:1  
数字对象唯一标识符(DOI)是为解决互联网环境下数字资源的多重链接和版权转移问题而提出的唯一标识符系统,已在图书馆和出版领域得到广泛应用。数字对象唯一标识符也可用于科学数据共享,具有跟踪价值、引用价值、集成价值和互联价值。基于DOI的数据引用是推动数据出版的重要环节,由于数据知识产权信息不清晰、数据引用标准不规范,基于DOI的数据引用在国内并没有得到有效推广。建议数据中心、DOI注册代理中心和期刊编辑部加强合作,DOI注册中心明确数据DOI注册与数据出版的区别,建立类似DataCite的数据出版机构,允许所有类型数据注册DOI,将符合数据出版和数据引用的科学数据引文信息另行集中管理。数据中心要理清数据版权信息,为符合条件的数据补充数据引用信息。期刊编辑部要引导作者在论文中规范化引用数据和标注数据。  相似文献   

5.
在上一期的本栏目中,我们介绍了相关文档间的链接功能,实际上是建立了不同文档中的两个单元格间的简单链接。可是,当源文件中的数据排列没有规律性,而又记录众多时,想要找准所需要的数据就必须首先对源文件进行查寻后再引用。 运用EXCEL97提供的VLOOKUP、HLOOKUP、LOOKUP三个有条件查寻与引用函数便可轻易完成上述操作。为方便讲解,我们只在同一文件中进行操作示范。  相似文献   

6.
当今社会是一个高速发展的时代,科技发展迅速,信息流通便捷,人们的生活、交流也越来越方便、密切,大数据就是高科技时代的产物,对大数据的获取、存储、共享、分析,成为了当前重要的研究课题.大数据让科技文献服务的资源更加丰富,同时也为科技文献服务带来了新的机遇与挑战,对科技文献的服务水平与发展创新提出了更为严苛的要求.本文重点...  相似文献   

7.
目前中国有3.73亿网民拥有博客,博客网站上已经存在海量的信息。对这些博客资源进行挖掘,可以获得有价值的信息。博客资源挖掘是Web数据挖掘的一种具体应用。探讨了国内外学者对博客资源进行数据挖掘的已有成果、各种方法与技术,涉及到博客网页的识别、博客传播特征、语义博客系统、博客之间的链接与交互、博客作者信息挖掘、博客主题挖掘、博客分类与聚类算法等。热点话题挖掘是博客数据挖掘的一种具体形式,也介绍了博客热点话题挖掘的方法与技术。  相似文献   

8.
从模仿到创新、从跟随到引领,不仅是现阶段我国科学技术发展需要完成的重大转变,更是国家发展的重大战略需求.近年来,国内外相关学者陆续开展了科技发展趋势分析和热点跟踪等方面的研究,但由于缺乏系统的大数据采集与治理体系,其数据分析与挖掘范围往往局限于科技文献这一单一数据样本.文中面向科技发展前瞻预测这一目标,全面分析了影响科学技术发展过程的各类科技文献、学者动态、论坛热点和社交评论等海量异构数据,通过构建数据驱动的大数据治理体系,解决科技大数据在探测发现、精准采集、清洗聚合、融合处理、模型构建、预测计算过程中的数据整治难题.同时,在大数据整治基础上采用LDA模型实现技术趋势预测与分析,研究成果为系统解决海量科技大数据中隐含信息发现和关系推理提供了技术支撑.  相似文献   

9.
结合<沈阳农业大学学报>编辑实践,分析了农业科技论文引言写作中的常见问题.引言一般包括本研究的学术价值和经济意义、本研究的学术背景、本研究的切入点和创新点、拟解决的关键问题四部分内容.在农业科技论文引言部分的写作中,常见的问题是:内容缺乏有效性,包括交代研究的学术价值和经济意义时,没有紧密围绕论文主题和研究内容;介绍学术研究背景时引用前人研究成果与本研究不相关;交代本研究的切入点和创新点时,没有与前人研究进行对比,交代研究拟解决的关键问题时没有扣题.引言的结构安排缺乏逻辑性,包括结构不全和结构混乱.另外,引言中文献引用不当,引用的文献与主题不相关,直接引用未经提炼他人研究结果,没有引用近期国内外相关研究结果.  相似文献   

10.
歧义的存在使得实体链接任务需要大量信息的支撑。已有研究主要使用两类信息,即实体表述所在的文本信息和外部的知识库信息。但已有研究对信息的使用存在以下两个问题: 首先,最新通用知识库规模更大、覆盖面更广,但目前的实体链接模型却未从中受益,其性能没有得到相应提升;其次,表述所在的文本信息既包含表述所处的局部上下文信息,也包含文本主题之类的全局信息,文本自身信息的利用率还需进一步提高。针对第一个问题,该文给出了一个融合文本相关度和先验知识的实体候选集抽取策略,提高了对知识库中有效知识的提取;针对第二个问题,该文给出了一个融合局部和全局信息的自注意力机制与高速网络相结合的神经网络实体链接框架。在6个实体链接公开数据集上的对比实验表明了该文提出方案的有效性,在最新的通用知识库上该文给出的实体链接模型取得了目前最好的性能。  相似文献   

11.
【目的】为了满足学科交叉融合对科学数据互操作的需求,解决科学数据中心资源重复存储问题,促进跨学科数据资源的有效利用。【方法】本文调研了现有的科学数据互操作技术与模式、国内外科学数据中心间互操作的现状,分析了各种互操作模式与技术适用的条件以及我国科学数据中心的特点。【结果】最终,提出了两大类共7种科学数据中心间互操作的模式,即基于元数据收割的转接板模式、基于元数据框架的元数据信息交换站模式、基于多领域本体映射的关联数据模式、元数据映射模式、本体模式、现有系统再整合模式和统一信息化系统模式,同时提供了我国科学数据中心互操作模式的实施建议。【结论】本研究提出的科学数据中心互操作模式具有可落地性和可实施性,能大大促进交叉学科科学数据资源的共享与利用,具有非常重要的推广意义和价值。  相似文献   

12.
[目的]面向中国科学院紫金山天文台"十三五"战略布局和重大应用需求——暗物质粒子探测卫星在轨运行与科学研究,建设形成支撑暗物质卫星科研活动的特色数据资源体系和统一应用服务平台.[方法]充分汇集暗物质卫星科学系统数据资源,通过统一设计和整体部署,深入进行系统整合和信息化支撑系统建设.建立了精确检索封装集成化、多点同步的伽...  相似文献   

13.
刘旭勇 《计算机时代》2011,(12):16-17,20
云计算(Cloud computing)借助互联网的庞大资源体系,以其强大的计算能力和安全可靠的数据存储向用户提供服务。云计算作为一项迅速发展的信息技术,目前已应用在国内外诸多领域。文章从当前信息资源建设状况出发,介绍了云计算的概念、特点,阐述了云计算对信息资源库建设所产生的影响,分析了当前信息资源建设存在的问题,提出了云计算环境下的信息资源库建设的思路。  相似文献   

14.
15.
随着移动互联网的普及以及网络信息指数的增长,如何有效地提取和利用这些信息面临巨大挑战。介绍了主题爬虫的工作原理、分类;回顾了近年来国内外关于主题爬虫的研究状况,分析了各种主题相似度的方法以及搜索策略,得出相比于普通的爬虫系统,基于网页内容和基于链接分析的爬虫系统的查准率、查全率都大幅度地提升;最后分析比较了主题网络爬虫两种动态搜索策略并指出了未来研究方向。  相似文献   

16.
随着网络技术的不断发展,望远镜的远程控制系统成为国内外天文台的研究热点,观测者通过Internet就可以控制望远镜进行天文观测。望远镜的远程控制系统对天文科普活动的开展起到了积极促进作用,家长不再为孩子的夜间出行而担心,只要通过网站预约远程观测,在家中就可以进行天文观测,有效的提高了管理效率,减少了管理成本,对天文研究有着实际的意义,也为科普知识得以普及提供了基础条件。  相似文献   

17.
网络教学资源的不断发展,使得设计并整合这些教学资源以便能够充分利用成为一种必须。通过分析和比较国内外各种专业教学资源库,在此基础上设计并实现了基于Internet的初等数学教学资源库,并详细探讨了如何解决系统实现过程中的公式编辑、动态作图、数据检索等关键技术。  相似文献   

18.
ABSTRACT

Learning analytics is an emerging field of research, motivated by the wide spectrum of the available educational information that can be analysed to provide a data-driven decision about various learning problems. This study intends to examine the research landscape of learning analytics to deliver a comprehensive understanding of the research activities in this multidisciplinary field, using scientific literature from the Scopus database. An array of state-of-the-art bibliometric indices is deployed on 2811 procured publication datasets: publication counts, citation counts, co-authorship patterns, citation networks and term co-occurrence. The results indicate that the field of learning analytics appears to have been instantiated around 2011; thus, before this time period no significant research activity can be observed. The temporal evolution indicates that the terms ‘students’, ‘teachers’, ‘higher education institutions’ and ‘learning process’ appear to be the major components of the field. More recent trends in the field are the tools that tap into Big Data analytics and data mining techniques for more rational data-driven decision-making services. A future direction research depicts a need to integrate learning analytics research with multidisciplinary smart education and smart library services. The vision towards smart city research requires a meta-level of smart learning analytics value integration and policy-making.  相似文献   

19.
Reading scientific articles is more time-consuming than reading news because readers need to search and read many citations. This paper proposes a citation guided method for summarizing multiple scientific papers. A phenomenon we can observe is that citation sentences in one paragraph or section usually talk about a common fact, which is usually represented as a set of noun phrases co-occurring in citation texts and it is usually discussed from different aspects. We design a multi-document summarization system based on common fact detection. One challenge is that citations may not use the same terms to refer to a common fact. We thus use term association discovering algorithm to expand terms based on a large set of scientific article abstracts. Then, citations can be clustered based on common facts. The common fact is used as a salient term set to get relevant sentences from the corresponding cited articles to form a summary. Experiments show that our method outperforms three baseline methods by ROUGE metric.  相似文献   

20.
网络信息的爆炸式增长,使得当前任何搜索引擎都只可能索引到Web上一小部分数据,而其中又充斥着大量的低质量信息.如何在用户查询无关的条件下找到Web上高质量的关键资源,是Web信息检索面临的挑战.基于大规模网页统计的方法发现,多种网页非内容特征可以用于关键资源页面的定位,利用决策树学习方法对这些特征进行综合,即可以实现用户查询无关的关键资源页面定位.在文本信息检索会议(TREC)标准评测平台上进行的超过19G文本数据规模的实验表明,这种定位方法能够利用20%左右的页面覆盖超过70%的Web关键信息;在仅为全部页面24%的关键资源集合上的检索结果,比在整个页面集合上的检索有超过60%的性能提高.这说明使用较少的索引量获取较高的检索性能是完全可能的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号