首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
文章主要讨论了XML技术在信息组织领域的某一个方面应用,即XML用于主题图的实现,或称为XTM技术。它是使用XML语法来处理主题图中数据的一种方法。围绕该主题,文章介绍了XTM标准、使用XTM代码或使用集成开发工具这两种方法构建基于XML技术主题图,并列举了国内外使用基于XML技术实现主题图的应用案例。  相似文献   

2.
基于主题图的本体信息检索模型研究   总被引:1,自引:0,他引:1  
针对本体在定义领域概念时具有规范性、明确性和可共享性等特点,结合主题图对文档资源组织方式具有语义可导航性,提出了一种基于主题图的本体信息检索模型,并给出了模型的形式化定义。选择旅游领域作为研究对象,定义了旅游本体和旅游文档资源主题图,分析了在信息检索模型中利用本体来规范用户自然语言查询输入,识别用户检索意图和扩展查询语义方面的作用,并展示了主题图在语义导航和用户相关度排序方面的价值。最后通过实验表明基于主题图的本体信息检索模型较传统的检索系统有较好的性能。  相似文献   

3.
文章探讨了将主题图技术应用于公安案件的信息资源组织。通过对主题图技术的概念和理论的介绍,建立了公安案件主题图概念体系。结合实际的公安案件,分析了公安案件中主题及主题间的关联。运用OKS知识开发组件工具进行了具体的构建,最终达到了用Omnigator实现基于语义的主题图浏览,Vizigator实现主题图可视化。  相似文献   

4.
主题图作为一种新型的信息知识组织工具,在很多领域得到了应用.将主题图用于公安信息资源整合中,提出解决信息孤岛问题的公安信息资源整合模型,对该模型进行研究和探索.  相似文献   

5.
主题图融合技术研究综述   总被引:1,自引:0,他引:1  
主题图在信息资源上层构建了一个结构化的语义网,提供了一个良好的语义模型,可以弥补web 2.0在应用上存在的语义缺陷,而主题图融合作为主题图的重要研究内容,是将分布式环境下同一领域内分散的局部主题图合并为一个全局主题图,实现Web信息的有效组织和管理以及信息的集成与共享.归纳总结了主题图融合的处理过程,分析评价了主题图融合中的难点--主题图的相似性算法,并对融合的原则和算法进行了分析总结,明确了高相似度主题融合的过程.此外,在分析主题图融合冲突的基础上,提出了主题图融合冲突检测与消除的整体设计方案,并将主题图的动态更新进行了阶段划分,最后指出了主题图融合未来的研究方向.  相似文献   

6.
陈琳  邓万宇 《现代计算机》2011,(12):55-57,65
网络课件作为一种新型的学习资源被越来越多的人使用,但目前的网络课件多数以单一的知识罗列为目标,并不能真正地体现学习者对网络课件的个性化需求。因此,提出一种基于主题图的导航式新型网络学习课件,试图从不同的知识粒度和更符合人类认知的网状知识表现形式来展现教育资源,提高教育资源的学习效果,更好地为学习者服务。  相似文献   

7.
Web中存在着海量的各类科技文献,研究人员虽然可以利用各种搜索工具对这些文献进行检索,但是,如何高效地找到与自身研究相关的文献变得越来越困难。最近出现的一系列在线研究者社区为解决这一问题提供了一种新的方案。提出一个基于主题模型的协作文献推荐,此模型将传统的协同过滤和概率主题模型,以及知识协作网络模型相结合,提供了一个可判别的隐语义结构。在考虑不同的用户评价所给出的文献索引率,以及新发表的文献的主题分布的基础上,利用语义相似度的计算工具,提出基于概率的跨学科的检索推荐。采用来自于CiteULike的一组数据,验证了该方法的有效性和可行性。  相似文献   

8.
提出了基于主题图的课程领域知识管理方法,建立了TMDKM的知识管理模型,并利用描述逻辑对TMDKM中的知识模型和知识服务进行研究,最后利用TMAPI和Java开发出TMDKM的原型系统,对该模型进行了验证。TMDKM在完整准确地反映课程领域知识的同时为知识的交流、共享与创新提供了有力支持,从而达到了课程领域知识管理的目的。  相似文献   

9.
为了解决传统领域知识的主题图构建方法中大量时间和人力耗费的问题,提出了面向课程领域知识的主题图学习方法,分析了TMLDK的主要活动流程,建立了学习活动图,讨论了TMLDK中领域关键词提取、关键词向主题的转换以及信息集成等关键技术,并利用浅层解析、相似度计算等技术完成了网络课件向TMC的半自动转换,最后利用TM4J和Java开发出TMLDK的原型,对其学习过程进行了验证.TMLDK的实现能够协助领域专家方便地构建领域知识的主题图,可以节省大量的人力和时间,而且有利于TMC后期的维护和更新.  相似文献   

10.
农业模型组件主题图的生成方法   总被引:1,自引:0,他引:1       下载免费PDF全文
分析农业模型的信息组织需求,提出一种农业模型组件主题图的生成方法,对模型组件的元数据信息进行XTM标注,形成属性元主题图。利用实例化和反射技术,生成具体模型组件的局部原子主题图。通过主题信息的字符匹配算法,融合同类模型的原子主题图,形成农业模型组件的全局原子主题图。以作物生育期模型组件的主题图为实例,验证了该方法的有效性。  相似文献   

11.
提出一种潜在文档相似模型(LDSM),把每对文档看作一个二分图,把文档的潜在主题看作二分图的顶点,用主题问的加权相似度为相应边赋权值,并用二分图的最佳匹配表示文档的相似度。实验结果表明,LDSM的平均查准率和平均查全率都优于用TextTiling和二分图最佳匹配方法构建的文档相似模型。  相似文献   

12.
基于三维文档向量的自适应话题追踪器模型   总被引:1,自引:0,他引:1  
话题追踪(TT)是研究自动追踪事件动态发展过程的一种信息智能获取技术,是话题检测与追踪(TDT)技术的一个子任务,其目标在于自动发现新闻报道信息流中与某一已知话题有关的新报道。该文通过分析传统文档向量空间模型的不足,结合新闻报道的特征,提出了一种三维文档向量模型,在此基础上建立了一种符合新闻报道特征的话题模型。该话题模型在追踪过程中能够根据事件的动态发展进行自我学习和自我修正。结合话题模型,该文还设计了一种自适应的KNN新闻话题追踪器,从而形成了一种完整的中文话题追踪器模型。实验数据表明该方法在描述新闻话题、避免话题漂移方面具有一定优势,在中文话题追踪领域取得了较好效果。  相似文献   

13.
缅甸语属于资源稀缺型语言,汉缅双语可比文档是获取平行句对的重要数据资源。该文提出了一种融合主题模型及双语词向量的汉缅双语可比文档获取方法,将跨语言文档相似度计算转化为跨语言主题相似度计算问题。首先,使用单语LDA主题模型分别抽取汉语、缅甸语的主题,得到对应的主题分布表示;其次,将抽取到的汉缅主题词进行表征得到单语的主题词向量,利用汉缅双语词典将汉语、缅甸语单语主题词向量映射到共享的语义空间,得到汉缅双语主题词向量,最后通过计算汉语、缅甸语主题相似度获取汉缅双语可比文档。实验结果表明,该文提出的方法得到的F1值比基于双语词向量方法提升了5.6%。  相似文献   

14.
In this paper, we study the problem of extracting variable-depth "logical document hierarchy" from long documents, namely organizing the recognized "physical document objects" into hierarchical structures. The discovery of logical document hierarchy is the vital step to support many downstream applications (e.g., passage-based retrieval and high-quality information extraction). However, long documents, containing hundreds or even thousands of pages and a variable-depth hierarchy, challenge the existing methods. To address these challenges, we develop a framework, namely Hierarchy Extraction from Long Document (HELD), where we "sequentially" insert each physical object at the proper position on the current tree. Determining whether each possible position is proper or not can be formulated as a binary classification problem. To further improve its effectiveness and efficiency, we study the design variants in HELD, including traversal orders of the insertion positions, heading extraction explicitly or implicitly, tolerance to insertion errors in predecessor steps, and so on. As for evaluations, we find that previous studies ignore the error that the depth of a node is correct while its path to the root is wrong. Since such mistakes may worsen the downstream applications seriously, a new measure is developed for a more careful evaluation. The empirical experiments based on thousands of long documents from Chinese financial market, English financial market and English scientific publication show that the HELD model with the "root-to-leaf" traversal order and explicit heading extraction is the best choice to achieve the tradeoff between effectiveness and efficiency with the accuracy of 0.972,6, 0.729,1 and 0.957,8 in the Chinese financial, English financial and arXiv datasets, respectively. Finally, we show that the logical document hierarchy can be employed to significantly improve the performance of the downstream passage retrieval task. In summary, we conduct a systematic study on this task in terms of methods, evaluations, and applications.  相似文献   

15.
当前监督或半监督隐藏狄利克雷分配(latent Dirichlet allocation,LDA)模型多数采用DSTM(down-stream supervised topic model)或USTM(upstream supervised topic model)方式加入额外信息,使得模型具有较高的主题提取和数据降维能力,然而无法处理包含多种额外信息的学术文档数据。通过对LDA及其扩展模型的研究,提出了一种将DSTM和USTM结合的概率主题模型ART(author & reference topic)。ART模型分别以USTM和DSTM方式构建了文档作者和引用文献的生成过程,因此可以对既包含作者信息又包含引用文献信息的文档进行有效的分析处理。在实验过程中采用Stochastic EM Sampling 方法对模型参数进行了学习,并将实验结果与Labeled LDA和DMR模型进行了对比。实验结果表明,ART模型不仅拥有高效的文档主题提取和聚类能力,同时还拥有优良的文档作者判别和引用文献排序能力。  相似文献   

16.
通过对当今常用检索方法的研究与分析,提出一种相对新颖的检索模式与方法,并对这种新的检索方法进行理论分析与实践验证. 新的检索模式还将把最常用的几项文案处理功能集合在同一平台下,为用户提供更为便捷、准确、高效的信息服务.  相似文献   

17.
RDF标准与主题图标准之比较分析   总被引:5,自引:0,他引:5  
张佩云  吴江贾晖 《微机发展》2005,15(5):91-93,96
RDF标准和主题图标准均是信息领域中两个基本的技术标准。文中分析了两个标准的共同点,并基于数据模型详细探讨了两者的不同点,比较了各自的优缺点,研究了两者的主要应用领域及应用侧重点,最后分析了两者在技术应用上基于数据模型的互补和融合。  相似文献   

18.
互联网技术的飞速发展使得数据的规模达到了空前的水平,人们从海量数据中获取有价值的信息变得越来越困难。主题模型是近年来计算机领域出现的一种新的概率模型,在自然语言处理、文本挖掘以及信息检索等领域都有很广泛的应用。基于主题模型的主题追踪技术和时态分析技术可以帮助人们从海量数据中快速找到感兴趣的内容,时态主题模型逐渐成为计算机科学领域的一个研究热点。首先,介绍主题模型以及时态主题模型的基本概念;然后,对各种时态主题模型进行分类,介绍了几种具有代表性的时态主题模型,分析比较了各种主题模型的优缺点;接着,分析了时态主题模型在社交媒体、学术文献和数据社区中的应用;最后,对时态主题模型未来的发展趋势进行了探讨。  相似文献   

19.
图模型是文本分类中一种比较新的方法,它可以很好地表达词与词之间的关联信息,弥补了传统的以向量空间为基础的文本分类方法的不足。本文介绍了图模型的定义、权值的计算、图的建立方法及分类方法。实验表明,这种方法是有效可行的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号