首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
介绍了本体、地理本体和地名本体的基本概念,探讨了在文本工程通用框架GATE(General Architecture for Text Engineering)下,以自然语言处理为基础,借助地名本体,完成Web文本的中文地名识别与歧义消除的关键问题,设计并实现了一个原型系统。通过geo/non\|geo和geo/geo地名歧义的消除,使得识别出来的地名与地球表面具体的地理位置相对应,进而为Web文本中的中国行政区划地名赋予地理坐标和地理语义。做了验证实验,并对实验结果进行了分析。  相似文献   

2.
地名本体属于地理信息领域本体范畴,是维护地理要素位置的本体,在地理空间语义网的发展中有着十分重要的作用,尤其为地理信息与资源的发现提供便利.从基于地理空间语义网的日常地理信息查询需要出发,设计了地名本体概念模型,在此基础上构建了地名本体实例存储数据库模式,实现了基于Geodatabase的地名本体实例数据存储.通过地名本体模型的构建,探讨语义网条件下的地名本体模型设计与地名本体实例化问题,对于实现地理要素数据组织与关系表达具有重要理论和实践意义.  相似文献   

3.
地名信息与人们日常生活息息相关,存在于各行各业,在行政管理中不可或缺。结合地名学与空间地理的研究成果,参考地名分类与类别编制规范,构建了基于SUMO的地名本体模型,表达不同领域的地名信息。该模型可表示地名的历史演化、空间关系、行政区域,作为地名引擎的知识描述模型,可进行空间查询与推理。以地名本体模型为指导,构建了地名知识库和规则库以及语义地名搜索引擎。  相似文献   

4.
基于异构网络面向多标签系统的推荐模型研究   总被引:1,自引:0,他引:1  
王瑜  武延军  吴敬征  刘晓燕 《软件学报》2017,28(10):2611-2624
标签成为信息组织的重要方式之一,随着推荐系统的蓬勃发展,标签推荐成为学者们研究的重要问题之一.目前存在各种各样的标签系统,其功能千差万别,标签数据信息越来越复杂.目前研究往往针对特定类型标签数据,缺乏既综合考虑标签数据中不同类型对象的复杂信息又能适用于多种标签系统数据的标签推荐模型.构建了标签推荐模型HnMTR,该模型首先针对标签数据中不同类型对象构建异构网络模型,其次对异构网络模型中不同类型顶点进行同空间映射,使不同类型的顶点和边可在同一空间进行量化比较;最后基于同空间映射后网络,引入多参数马尔可夫模型进行标签评分和推荐.通过基于豆瓣、Delicious和Meetup这3个标签系统数据实验,其结果表明,HnMTR模型平均准确率比目前主流算法提高10%以上,取得了较好的推荐结果.  相似文献   

5.
用户推文中的地名信息是定位推特用户的重要基础数据之一,但现有推特用户定位方法提取的地名在数量和可靠性方面均存在欠缺,影响了用户定位准确性。提出基于单点地名匹配和局部地名筛选的推特用户定位方法。设计一种基于地名位置聚集度的地名类型判别算法,根据位置分布的聚集程度构建单点地名库,获取推文中更多可靠地名;提出一种基于用户位置聚集度的局部地名筛选算法,分别以地名经纬度和用户平均经纬度为中心,计算用户位置聚集度,筛选更高聚集度、更可靠的局部地名;基于用户社交关系、用户对地名的提及关系构建用户-地名异构图,并利用图表示学习和神经网络定位用户。基于常用公开数据集GEOTEXT和TW-US进行大量用户定位实验,并与HGNN、ReLP、GCN等9种现有推特用户位置推断典型方法进行了对比,结果表明,所提方法对推特用户的位置推断准确率具有明显优势,相比9种现有典型方法,在GEOTEXT数据集上,平均误差降低了7.3~342.8 km,中位数误差降低了2.4~354.4 km,大地区级定位准确率提高了1.3%~26.3%;在TW-US数据集上,平均误差降低了8.6~246.6 km,中位数误差降低了5.7~1...  相似文献   

6.
在多标签文本分类任务中,每个给定的文档都对应一组相关标签。目前主要面临以下三方面问题:(1)对标签-文本和标签-标签关系的联合建模不充分;(2)对标签本身语义的挖掘不足;(3)忽略了对标签内部结构信息的利用。对于以上问题,提出了一种基于联合注意力和共享语义空间的多标签文本分类方法。提出了融合多头注意力机制,该方法旨在同步地对标签与文档的关系和标签之间的关系进行建模,利用两者交互信息的同时避免误差传递。提出了解耦的共享语义空间嵌入方法,改进了利用标签语义信息的方法,使用共享参数的编码器提取标签和文档的语义表示,减少其在建模相关性阶段的偏差。提出了一种基于先验知识的层次提示方法,利用预训练模型中的先验知识增强标签层次结构信息。实验结果表明,该方法在公开数据集上优于目前最先进的多标签文本分类模型。  相似文献   

7.
国际疾病分类(ICD)是用于临床目的和健康管理的分类工具,是卫生统计数据的建立基础,在其庞大的分类体系中,含有与疾病健康问题和临床治疗相关的分类和对应的代码。针对在国际疾病分类的庞大标签空间中的多标签分类问题,提出一种端到端的深度学习方法。采用改进的图注意力网络对标签空间进行建模,基于注意力重构的多标签分类器进行分类。在标签空间建模中,结合国际疾病分类中手术与操作分类的层次结构,构建出三种不同的图结构,利用图注意力网络将标签空间的结构信息融入到模型中,从而利用标签之间的依赖关系进行多标签文本分类。所提出的方法与实际应用场景有着紧密联系。实验表明,在临床国际疾病分类数据集上,相比于传统文本分类和其他标签空间建模方法,所提方法在分类性能上有明显的提升。  相似文献   

8.
地理编码技术通过将位置信息的文字表述转化为经纬度坐标为地理位置信息相关的科研提供数据支持。在地理编码过程中,地址描述性文字可能存在大量内容不正确、不准确、错别字、同音字等问题,从而导致无法进行准确地址匹配。该文针对以上问题提出了一种地址规范化的方法,通过地名相似度算法将待规范地名与标准地名库记录进行匹配,并结合空间场景相似性对结果进行评价,从而提高地址匹配的准确度。最后通过相关公共卫生数据验证了方法的可行性与准确性。  相似文献   

9.
联合嵌入式多标签分类算法   总被引:1,自引:0,他引:1  
刘慧婷  冷新杨  王利利  赵鹏 《自动化学报》2019,45(10):1969-1982
现有的一些多标签分类算法,因多标签数据含有高维的特征或标签信息而变得不可行.为了解决这一问题,提出基于去噪自编码器和矩阵分解的联合嵌入多标签分类算法Deep AE-MF.该算法包括两部分:特征嵌入部分使用去噪自编码器对特征空间学习得到非线性表示,标签嵌入部分则是利用矩阵分解直接学习到标签空间对应的潜在表示与解码矩阵.Deep AE-MF将特征嵌入和标签嵌入的两个阶段进行联合,共同学习一个潜在空间用于模型预测,进而得到一个有效的多标签分类模型.为了进一步提升模型性能,在Deep AE-MF方法中对标签间的负相关信息加以利用.通过在不同数据集上进行实验证明了提出Deep AE-MF方法的有效性和鲁棒性.  相似文献   

10.
朱旭东  熊贇 《计算机工程》2022,48(4):173-178+190
图像多标签分类作为计算机视觉领域的重要研究方向,在图像识别、检测等场景下得到广泛应用。现有图像多标签分类方法无法有效利用标签相关性信息以及标签语义与图像特征的对应关系,导致分类能力较差。提出一种图像多标签分类的新算法,通过利用标签共现信息和标签先验知识构建图模型,使用多尺度注意力学习图像特征中目标,并利用标签引导注意力融合标签语义特征和图像特征信息,从而将标签相关性和标签语义信息融入到模型学习中。在此基础上,基于图注意力机制构建动态图模型,并对标签信息图模型进行动态更新学习,以充分融合图像信息和标签信息。在图像多标签分类任务上的实验结果表明,相比于现有最优算法MLGCN,该算法在VOC-2007数据集及COCO-2012数据集上的mAP值分别提高了0.6、1.2个百分点,性能有明显提升。  相似文献   

11.
This study develops an ontology building process for extracting conceptual tags and hierarchies in textual corpus. Though humans have been creating ontologies for many years, efficient ontology building processes in textual corpus are extremely ad hoc. Several issues have identified including how to recognize terminology in textual document, name concept tags in terminologies, and derive conceptual hierarchies among concepts. The proposed approach is extraction technique combinations to produce ontology prototype for editors. The empirical feedback indicates that elicitation synergy is productive during the early stages of building. Additionally, this elicitation synergy is especially useful for ontology editors who lack reference models of a working domain and who encounter textual corpus as major knowledge sources.  相似文献   

12.
Current implementations of gazetteers, geographic directories that associate place names to geographic coordinates, cannot use semantics to answer complex queries (most gazetteers are just thesauri of place names), use domain ontologies for place name disambiguation, make their data sets available in the Semantic Web or support the use of Volunteered Geographic Information (VGI). A new generation of gazetteers has to tackle these problems. In this paper, we present a new architecture for gazetteers that uses VGI and Semantic Web tools, such as ontologies and Linked Open Data to overcome these limitations. We also present a gazetteer, the Semantic Web Interactive Gazetteer (SWI), implemented using this architecture, and show that it can be used to add absent geographic coordinates to biodiversity records. In our tests, we use this gazetteer to correct geographic data from a big sample (around 142,000 occurrence records of Amazonian specimens) from SpeciesLink, a big repository of biodiversity collection records from Brazil. The tests showed that the SWI Gazetteer was able to add geographic coordinates to around 30,000 records, increasing the records with coordinates from 30.29% to 57.5% of the total number of records in the sample (representing an increase of 90%).  相似文献   

13.
为了解当前自发地理信息的发展现状、存在问题和发展前景,对自发地理信息展开了研究。首先,介绍了自发地理信息的概念及其研究背景。然后,归纳统计了目前相关的研究文献,分析了自发地理信息的研究现状及其研究中亟待解决的难题。接着,根据研究侧重点的不同,将当前的自发地理信息研究领域总结为数据获取、数据处理和数据应用三个方面,并分别探讨各方面的研究现状、研究成果以及不足。最后,结合大数据研究背景,展望了自发地理信息的未来研究方向。研究表明,自发地理信息已成为地理信息的一个重要发展方向,但其数据处理、应用的理论和方法仍有待完善。  相似文献   

14.
冷烁  李孙伟  胡振中 《图学学报》2020,41(6):1001-1011
摘 要:针对城市地理信息平台构建过程中存在的数据获取困难、研发成本较高等问题, 引入开源技术,对基于开源数据、开源开发平台与开源工具的城市地理信息平台构建技术进行 研究。所提出的城市地理信息平台由数据模块与可视化模块 2 部分组成。为构建数据模块,由 开源地理信息项目(OSM)获取了建筑与区划数据,并设计了建筑合并算法以提升数据质量。建 筑数据随之基于行政区划分级存储,通过由 ASP. NET 构建的数据接口提供给具体应用。可视 化模块则基于开源地理信息系统(GIS)项目 Cesium 实现,并设计了完善的用户界面。以北京市 为例,完成了原型系统的开发与测试,证实了该技术体系的可行性,通过开源技术降低平台研 发成本,推进城市地理信息平台的研究与应用。  相似文献   

15.
基于本体的政务数据仓库构建方法研究   总被引:1,自引:0,他引:1  
针对当前的政务数据仓库构建过程中面临需求难于确定和元数据不能重用的问题,提出通过建立政务领域本体来构建政务数据仓库.阐述了政务数据仓库构建的一般开发过程以及数据仓库中元数据的作用和意义,然后引入本体的思想指导政务数据仓库的构建,用于解决需求不确定以及元数据缺乏标准的问题,最后给出采用领域本体来构建政务数据仓库的过程.在此基础上,给出了实例来说明基于本体的政务数据仓库构建的过程,并将该方法成功用于企业基础信息数据仓库的构建.  相似文献   

16.
针对目前基于语义网的本体映射算法中背景本体搜索面少、本体收集不精确的问题,利用基于虚拟文档的映射技术提取在Word-Net中与概念同义的同义词集,将对单个概念进行搜索转换成对同义概念集进行搜索,从而扩大本体搜索面,获取更多背景本体.提出基于语义环境的动态本体映射算法来排除错误背景本体,使本体收集更加精确.实验结果表明,该算法可有效提高映射的查全率和查准率.  相似文献   

17.
钟将  宋娟 《计算机工程》2011,37(14):44-46
针对电力系统数据集成中存在的语义异构问题,提出一种基于本体的数据集成框架。依据电力参数估计系统的数据需求模型,分析数据集成存在的语义冲突类型,在传统数据集成框架的数据集成中间件模块中加入本体语义描述模块。采用本体描述信息资源域中的概念,通过实现语义冲突主动发现并构建语义映射关系。实验结果表明,该框架能有效解决数据集成过程中的语义异构问题。  相似文献   

18.
针对大规模本体映射中存在查全率和查准率不高的问题,提出了一种新的基于参考点的大规模本体分块与映射的方法.该方法的主要思想是用参考点来指导分块,并同时对待映射的两个大规模本体同时分块,即联合分块.首先对大规模本体进行预处理,将本体中的实体名称归一化并将其表示成本体树的形式,然后采用一些简便的方法找到参考点,最后以参考点为聚类中心对两个本体树的概念进行聚类,并同时实现块映射.理论分析和实验结果表明,该方法能够有效地解决大规模本体映射问题,并能获得较好的查全率和查准率.  相似文献   

19.
一种基于语义网的本体映射改进算法   总被引:1,自引:1,他引:0       下载免费PDF全文
针对目前基于语义网的本体映射算法中背景本体搜索面少、本体收集不精确的问题,利用基于虚拟文档的映射技术提取在Word—Net中与概念同义的同义词集,将对单个概念进行搜索转换成对同义概念集进行搜索,从而扩大本体搜索面,获取更多背景本体。提出基于语义环境的动态本体映射算法来排除错误背景本体,使本体收集更加精确。实验结果表明,该算法可有效提高映射的查全率和查准率。  相似文献   

20.
OWL本体在知识工程中有着广泛应用,人们考虑用它来解决软件开发中的问题。该文分析OWL本体和Java面向对象模型问的差别,指出直接映射存在的问题,阐述OWL本体映射到面向方面模型的特点,并提出OWL本体向AspectJ面向方面模型映射的具体方法,较好实现OWL本体向软件代码模型的映射。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号