首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 406 毫秒
1.
随着信息技术的迅猛发展,建设新型高效智慧型城市已成为趋势。智慧城市中有大量以地理信息为基础的应用场景,如在城市规划建设、城市便民生活服务、城市细化管理等都离不开地理信息。由于中文地址的复杂性与人工输入的不确定性,地址数据不规范性、不一致、不明确现象给业务系统之间与内部带来了很多困难。急需优秀的中文地址匹配方法。现有的匹配方法仅从地址文字出发进行匹配,而忽略地址作为一个实体蕴含着丰富的地理知识,这些知识可以有效地协助匹配过程,由此,提出注意力知识图谱的中文地址匹配方法,从而解决复杂中文地址匹配准确率低的问题。通过对传统的标准地址库进行地址分词以及特征抽取,建立标准地址知识图谱与POI知识图谱;采用基于选择注意力机制的知识图谱关系抽取方法来进行对地址的特征提取,从而进行地址分类;通过计算知识图谱实体相似度,从而进行非标中文地址的地址匹配。实验结果表明,该方法较基于Jaccard相似度的地址匹配方法、基于动态规划的地址匹配方法、基于Sorensen Dice的全文检索地址匹配方法和基于bert4keras预训练模型的地址匹配方法准确率分别提高了11.05%、15.30%、11.05%、0.95%,有效对复杂中文地址进行匹配。  相似文献   

2.
化学品危险评估与人民生命财产安全密切相关,化学品信息的运用直接影响危险评估的快捷程度和准确度。建立化学品危险评估知识图谱能有限管理和应用化学品信息。本文对化学品危险评估领域知识进行了梳理,在确定了领域范围、知识内容和基本本体层次关系基础上,提出了一种准确高效的领域知识构建方法—"NLP及人工智能辅助法":首先,利用爬虫技术对数据进行采集和清洗通过数据抓取及数据清洗;从获得7.8亿条结构化数据中利用中文分词、语义分析等技术进行了知识抽取,构建化学品危险评估知识主体层次关系;通过关系映射、语义分析等技术手段抽取本体属性;基于自然语言处理和人工智能技术苟安知识本体及知识图谱。本研究在一定程度解决了化学品评估知识图谱专业性强、数据量大、过程复杂;中文知识图谱构建的开放链接相对缺乏,导致目前国内尚没有成熟的化学品评估中文知识图谱的问题。化学品危险分类信息匹配为场景实现了初步应用,结果表明,化学品危险评估知识图谱在危险分类信息数据查询、匹配验证的应用将人工平均时间从4460秒压缩到137秒,准确率从86.2%提升到94.3%,大幅提高了化学品危险评估数据查询和匹配的效率。本文的工作进一步表明利用知识图谱可以更好的实现行业或专业领域知识的管理,具有重要应用价值。  相似文献   

3.
自动化构建的中文知识图谱系统   总被引:1,自引:0,他引:1  
为解决当前中文知识图谱构建的准确率低、耗时长且需要大量人工参与的问题,提出一种端到端基于中文百科数据的完整中文知识图谱自动化构建解决方案,并在此基础上开发实现了面向用户的中文知识图谱系统。在此方案中,通过自定义的网络爬虫,原始百科数据的词条属性以及相关的文本信息会不间断地被抓取到本地系统中,并以带扩展属性的三元组形式保存。后端系统则自动通过图数据库Cayley以及MongoDB数据库系统,对三元组文件数据进行导入,转换为庞大的知识图谱系统,从而在前端为用户提供丰富的基于知识图谱的应用服务。通过与其他知识图谱系统的比较,该方案在构建时间上明显减少,并且知识图谱中的实体及关系数量总规模高于YAGO、知网(HowNet)和中文概念词典等中文知识图谱系统至少50%。  相似文献   

4.
为提高测试用例复用的准确率及软件缺陷的发现率,提出一种基于知识图谱的测试用例复用方法,根据已有的项目测试数据,构建测试用例复用模型。对测试用例领域进行研究,分析测试用例的特征,利用本体设计构建测试用例知识图谱,通过问题模板与知识图谱匹配,改进朴素贝叶斯分类模型,利用多属性、多条件检索相似度最高的测试用例。基于模型匹配精度和知识图谱检索效率对复用方法进行验证,实践对照表明该方法能够提升测试用例复用率以及缺陷发现率。  相似文献   

5.
开放关系抽取从海量数据中获取知识,是自然语言处理的一个关键技术。开放关系抽取可以实现多种关系的抽取,由于中文领域可供训练的标注数据较少且语义句式较为复杂,面向中文的开放关系抽取存在较多困难。现有的中文开放关系抽取方法存在实体识别覆盖率较低且抽取关系种类单一的问题,无法满足知识图谱扩展等应用需求。该文提出了多策略的开放关系抽取方法,该方法综合利用知识图谱提高了实体识别的覆盖度,依靠实体上下文信息实现了实体对关系的抽取,根据依存句法分析抽取得到全要素三元组,并实现了从文本中抽取实体属性的方法。实验证明,该文的抽取方法准确率高,抽取关系种类多样,可以服务于知识图谱扩展等任务。  相似文献   

6.
传统的中文地名地址匹配技术难以处理大数据环境下海量、多样和异构的智慧城市地理信息空间中的中文地名地址快速匹配问题。提出了一种Spark计算平台下基于中文地名地址要素的匹配框架及应用智能决策的匹配算法(An Intelligent Decision Matching Algorithm,AIDMA)。首先,从中文地名地址中富含的语义性和中文字符串、数字与字母之间的自然分隔性两个方面进行地址要素解析,构建了融合多距离信息的贝叶斯推理网络,从而提出了基于多准则评判的中文地名地址匹配决策方法。然后,利用芜湖市514967条脱敏后的燃气开户中文地名地址信息库与1770979条网格化社区中的中文地名地址信息库(包含网格化地址的地理空间信息)进行实验与分析。实验结果表明,在处理大规模中文地名地址信息时,相比于传统的中文地名地址匹配方法,该方法能够有效提高单条中文地名地址的匹配效率,同时在匹配度与精确度两个指标上匹配结果更加均衡。  相似文献   

7.
秦鹏  唐忠 《计算机仿真》2023,(2):279-283
为加强知识图谱实体间的关联性,提高知识图谱的表达精度,以深度学习为技术支持,构建可视化知识图谱建构模型。采用清洗、jieba分词、卷积神经网络分类等手段处理初始数据集,基于BiLSTM-CRF算法与BiGRU-Attention模型,建立知识实体识别模型与实体关系识别模型。将识别的知识实体与实体关系储存至Neo4j图数据库中,令建构的知识图谱可视化。仿真环节,从人工标注数据集合中随机抽取中文语料,设立测试集与训练集,利用测试集训练识别模型,更新模型参数,采用多指标客观评价训练集的实体与关系识别效果,经指标评估结果验证,所建模型具有相对理想的可视化知识图谱建构效果。  相似文献   

8.
基于分级地名库的中文地理编码的研究   总被引:2,自引:0,他引:2  
孙存群  周顺平  杨林 《计算机应用》2010,30(7):1953-1955
地理编码在城市空间定位和分析领域内具有非常广泛的应用,但由于中文地址没有统一的规范和固定的模式,目前中文地址编码尚无很完善的解决方案。针对这一问题,采用基于分级地名数据库的中文地理编码方法,并详细阐述了实现该方法的关键技术:地名数据库的数据模型、地址串的拆分和地址匹配技术。最后通过实际数据进行验证,实验结果表明,该方案能较好地解决绝大多数地址数据的匹配问题。  相似文献   

9.
【目的】在自然语言处理领域,文本分类是十分重要的基础研究,可以应用于许多下游任务中,例如文章检索、推荐系统、问答系统等。受到知识图谱在文本推理领域发挥作用的启发,本文探索了将知识图谱应用于文本分类任务的方法,在降低对标注训练数据依赖的同时利用知识图谱的推理能力提升文本分类的效果。【方法】本文提出了基于知识图谱的图匹配文本分类算法。具体而言,依据分类目标,为每一个类别构建了该类别的知识图谱,模型基于类别知识图谱中的语义和连接信息对文本与各个类别的相关性进行推理,综合各个知识图谱的推理评估结果。【结论】为了证明本文提出的方法的有效性,本文构建了分类所需的知识图谱并在两个数据集上进行了实验,实验结果证明在允许一定拒绝的前提下,此模型具有很高的准确率,进一步推动了算法的应用落地。  相似文献   

10.
以中国古典文学为代表的古文是中文的重要组成部分,其语法、词汇相对于现代文而言更加复杂、讲究,给中文自然语言处理带来了机遇和挑战.针对上述问题,利用自然语言处理和知识图谱技术,以中国古典文学文本中具有代表性的《三国演义》为例,进行知识图谱构建.该方法通过语料库的网页标签匹配生成了一个分词与词性标注数据集,用来训练神经网络...  相似文献   

11.
中文地名地址的标准化在当前智慧城市的建设中起到至关重要的作用。传统的地名地址标准化技术通常使用基于文本字符层面的相似度计算或规则库匹配的方法,对复杂、特殊或冗余地址的处理效果较差。通过将地址标准化任务转换为针对地址相似的匹配度计算任务,提出了一种融合注意力机制与多层次语义表征的地址匹配算法。首先依据地址文本特殊的语法结构,利用Trie语法树构建标准地址树;而后基于注意力机制,利用Bi-LSTM网络与CNN网络生成地址对的多层次语义表示;最后通过曼哈顿距离计算相似度。在自主构建的数据集上,提出的SGAM模型的匹配准确度(91.22%)相比TextRCNN、FastText、基于注意力的卷积神经网络(ABCNN)等模型提升了4%~10%,表明SGAM模型在地址匹配任务上有着更好的性能表现。  相似文献   

12.
王婷娴  贾克斌  姚萌 《自动化学报》2021,47(9):2194-2204
轻轨作为城市公共交通系统的重要组成部分, 对其实现智能化的管理势在必行. 针对城市轻轨定位系统要求精度高、实时强且易于安装等特点, 本文提出一种基于全局?局部场景特征与关键帧检索的定位方法. 该方法在语义信息的指导下, 从单目相机获取的参考帧中提取区别性高的区域作为关键区域. 并结合像素点位置线索利用无监督学习的方式筛选关键区域中描述力强的像素对生成二值化特征提取模式, 不仅能够提升匹配精度还显著提高了在线模块场景特征提取与匹配的速度. 其次, 以场景显著性分数为依据获取的关键帧避免了具有相似外观的场景给定位带来的干扰, 并能辅助提高场景在线匹配的精度与效率. 本文使用公开测试数据集以及具有挑战性的轻轨数据集进行测试. 实验结果表明, 本系统在满足实时性要求的同时, 其定位准确率均可达到90%以上.  相似文献   

13.
地理编码技术通过将位置信息的文字表述转化为经纬度坐标为地理位置信息相关的科研提供数据支持。在地理编码过程中,地址描述性文字可能存在大量内容不正确、不准确、错别字、同音字等问题,从而导致无法进行准确地址匹配。该文针对以上问题提出了一种地址规范化的方法,通过地名相似度算法将待规范地名与标准地名库记录进行匹配,并结合空间场景相似性对结果进行评价,从而提高地址匹配的准确度。最后通过相关公共卫生数据验证了方法的可行性与准确性。  相似文献   

14.
针对试卷智能批阅场景模式,由于Tesseract-OCR缺少特殊符号包,直接定位符号存在较多漏检等问题,提出具有覆盖保留机制的多模板匹配方法。通过OCR定位空白试卷中的符号分别建立多类型元素的方块、圆圈、括号模板集;而对于试卷中的直线,通过筛选查找轮廓的方法建立多类型元素的直线模板集,综合多模板匹配技术提高试卷中符号的识别性能及定位准确率。经实际试卷测试结果表明:该算法符号定位准确率、精确度和召回率均高于94%;查找轮廓法定位直线准确率达96%,模板匹配直线定位准确率、精确度和召回率高于87%;将空白试卷符号坐标应用于学生作答试卷,能较完美地定位手写答案。  相似文献   

15.
Transportation-related hazardous materials releases pose obvious hazards to the general public and response personnel. Statistical risk assessment techniques are valuable in quantifying these hazards and evaluating methods to reduce the risk. In this paper, we describe a quantitative risk assessment approach for hazardous materials transportation that has a strong emphasis on consequence modeling and employs considerable statistical data from past incidents. We illustrate application of this method to evaluating distances to which the public should be protected immediately following an accidental release of toxic materials that pose an inhalation hazard. While this paper focuses on emergency response aspects of the problem, the framework we describe has applications to societal risk estimation and routing optimization for a wide variety of hazardous materials.  相似文献   

16.
浮动车GPS数据作为交通信息处理的基础,随着被监控车辆数量的高速增长,产生了海量GPS数据,对地图匹配提出了高挑战,为了解决传统匹配方法难以满足匹配效率和精度的不足,提出一种针对于海量GPS数据的实时并行地图匹配算法,能够同时保证较高匹配精度和运算效率。构建一种面向实时数据流的高效、准确实时地图匹配算法,首先通过引入速度、方向综合权重因子对依赖历史轨迹的离线地图匹配算法进行重构,进而引入Spark Streaming分布式计算框架,实现地图匹配算法的实时、并行运算,大幅提升实时地图匹配效率。实验结果表明,该算法在复杂路段的匹配准确率较常规拓扑匹配算法提高10%以上,整体匹配准确率达到95%以上;在匹配效率方面,较同等数量的单机服务器可提高效率4倍左右。实验结果表明,该算法在由11台机器组成的计算集群上实现8 000万个GPS数据点的实时地图匹配,证明了该算法可以完成城市地区的实时车辆匹配。  相似文献   

17.
针对基于线特征的单目SLAM(同时定位与地图构建)中的数据关联问题,提出了一种基于线段端点Patch确认的迭代数据关联算法。算法依据近似共线和端点近似重合两个指标来获取线特征的最近邻关联对,使用基于线段端点Patch的定向匹配确认机制来剔除最近邻关联对中的错误项,同时以迭代处理的方式提高数据关联的准确性,综合利用了线特征间的几何约束和图像相似性约束。上述算法在公开数据集上进行了测试,与现有线特征数据关联算法的对比实验结果表明,该算法在满足系统实时性的前提下,在线特征关联对数目和关联准确率上均达到了较好效果。  相似文献   

18.
该文研究跨数据源的论文集成问题,旨在将不同数据源中的同一论文匹配起来。该文提出了两个算法来解决论文匹配的问题,第一个算法(MHash)利用哈希算法来加速匹配,第二个算法(MCNN)利用卷积神经网络(CNN)来提高匹配的准确率。实验表明,结合论文的各种属性,MHash能够在快速得到匹配结果的同时,保持较高的准确率(93%+),而MCNN能够达到非常高的准确率(98%+)。同时,设计了一个针对大规模论文匹配的异步搜索框架,在15天内得到了64 639 608对AMiner和MAG论文的匹配结果。论文匹配结果和AMiner、MAG的全部论文数据已作为公开数据集发布。  相似文献   

19.
为了解决设计面向点云数据的神经网络需要大量人工介入的问题,提出了基于注意力机制和点卷积的神经网络架构搜索方法。针对不同尺度点云的信息融合问题,提出了一种基于注意力机制的多尺度融合模块。针对点云的处理效率问题,设计了基于点卷积的特征提取模块作为候选操作,并与多尺度融合模块组成搜索单元。将多个搜索单元叠加成的神经网络作为搜索空间,并采用基于可微分神经网络架构搜索算法搜索出最优神经网络。在公开点云数据集ModelNet上的实验结果证明,该方法得到的神经网络具有领先的精度,同时具有较少的可学习参数,并且该方法大幅减少了人工介入的工作量。该数据集上的消融实验结果表明,在基线模型中加入提出的基于注意力机制的多尺度融合模块,精度提升了1.1个百分点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号