首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 61 毫秒
1.
知识实体的类型标注是专业文献的结构化管理和知识脉络挖掘中的一个重要问题。然而,由于知识实体具有专业性强、类型多样等特点,传统的实体抽取方法并不能很好地实现知识实体的类型标注。为了解决这一问题,该文从数据中发现并总结出知识实体类型的独有特性,根据这些特性首先提出一种基于启发式规则的类型抽取方法、实现部分知识实体的类型标注,进而通过多标签加权的标签传播方法实现对所有知识实体的类型标注。与传统方法相比,该方法能够从数据中获得最有可能的类型标签,在无需人工标注的情况下获得有效的知识实体类型标注。实验结果表明,所提出方法具有较好的灵活性,更适用于专业文献知识实体的类型标注。  相似文献   

2.
医疗文本数据是推行智慧医疗的重要数据基础,而医疗文本为半结构或非结构化数据,难以对其直接进行应用。对医疗文本中所包含的实体及实体关系进行标注是文本结构化的重要手段,也是命名实体识别、关系自动抽取研究的基础。传统的人工标注方法费力费时,已难以适应大数据发展的需求。该文以构建中文医学知识图谱的任务为驱动,构建了半自动化实体及关系标注平台。该平台融合多种算法,能够实现文本预标注、进度控制、质量把控和数据分析等多种功能。利用该平台,进行了医学知识图谱中实体和关系标注,结果表明该平台能够在文本资源建设中控制标注过程,保证标注质量,提高标注效率。同时该平台也被应用于其他文本标注任务,表明该平台具有较好的任务移植性。  相似文献   

3.
针对传统实体关系标注方法存在效率低下、错误传播、实体冗余等问题,对于某些领域语料中存在“一实体(主实体)同时与多个实体之间存在重叠关系”的特点,提出一种面向领域实体关系联合抽取的新标注方法。首先,将主实体标注为一个固定标签,将文本中与主实体存在关系的其他每个实体标注为对应实体对间的关系类型,这种对实体和关系进行同步标注的方式节省了至少一半的标注成本;然后,直接对三元组进行建模,而不是分别对实体和关系进行建模,通过标签匹配和映射即可获取三元组数据,从而缓解重叠关系抽取、实体冗余以及错误传播等问题;最后,以作物病虫害领域为例进行实验,测试了来自转换器的双向编码器表征量(BERT)-双向长短期记忆网络(BiLSTM)+条件随机场(CRF)端到端模型在1 619条作物病虫害文档的数据集上的性能。实验结果表明该模型的F1值比基于传统标注方式+BERT模型的流水线方法提高了47.83个百分点;与基于新标注方式+BiLSTM+CRF模型、卷积神经网络(CNN)+BiLSTM+CRF等经典模型的联合学习方法相比,该模型的F1值分别提高了9.55个百分点和10.22个百分点,验证了所提标注方法和模型的有效性。  相似文献   

4.
传统的实体关系抽取方法主要针对语义信息较为完整的文本,基于抽取模式抽取文本中的实体关系,并采用启发式算法或者概率模型来选择抽取出的候选关系.而对于半结构化的页面,由于没有成句的实体信息展示,导致这些方法不能很好适用.论文提出的实体关系抽取系统能较好地处理半结构化的页面.该系统主要包括数据抽取规则学习、数据抽取、实体间关系计算等核心功能模块,并为用户提供了关系库查询接口.用户输入关键词和选定匹配类型,系统将根据关键词及匹配类型查询实体信息库,然后用满足条件的实体再去查询实体关系库,将包含这些实体的关系返回给用户.  相似文献   

5.
本研究利用JASIST数据库学术论文,制定软件实体标注规则,实现网站标注系统并手工标注程序,制定机器学习模型的特征模板.利用条件随机场模型构建软件实体识别自动抽取模型和人工的软件实体数据集合.对软件实体词频次数、左右词性进行统计,调用条件随机场模型进行训练,评测测试文本的P、R、F值,从中总结相应的规律结论,最后改变特征模板,对比增加词性后软件实体抽取指标值是否有所改进.  相似文献   

6.
互联网时代, 数据呈爆发式的增长, 怎样从这些数据中抽取出有用的信息, 已是人工智能研究中的一个核心问题. 知识图谱作为解决这一问题的重要方法, 已成为人工智能技术发展的核心推动力. 信息抽取是知识图谱构建过程中的首要环节, 它实现了从海量的数据中抽取出结构化实体以及实体之间的关系. 本文探讨知识图谱中信息抽取的发展趋势, 对实体抽取、关系抽取和事件抽取及其关键技术进行了综述, 分析和讨论了当前存在的问题、挑战以及未来发展的方向.  相似文献   

7.
跨境民族文化领域文本中存在较多的领域词汇,使得模型提取领域信息困难,造成上下文领域信息缺失,在该领域中实体密度分布高,面临实体关系重叠的问题。考虑到领域信息对跨境民族文化文本语义表征有着重要的作用,该文提出一种基于指针标注的跨境民族文化实体关系抽取方法,在字符向量表示中融入领域词典信息来增强领域信息用于解决领域实体标注不准确问题,通过多层指针标注解决跨境民族文化领域实体关系重叠问题。实验结果表明,在跨境民族文化实体关系抽取数据集上所提出方法相比于基线方法的F1值提升了2.34%。  相似文献   

8.
随着农业大数据及智慧农业的发展,面对海量的农业文本数据,构建知识图谱等自然语言处理应用需求逐渐增长。目前,在农业领域的实体语料库及实体标注体系仍处于空白状态。对农业文本进行处理时,面临如何定义实体类别及范围等问题。基于此问题,以农业科学叙词表为科学依据,提出面向农业知识图谱构建的农业文本数据实体标注准则,涵盖了农作物、病虫草害等多种农业实体,以及基于该准则设置标注原则构建基于农业文本的自注释语料库,并进行实验验证,证明了该准则的有效性。该准则为农业实体语料库的构建提供可参考的标注规范,以及为农业实体识别提供语料支持。  相似文献   

9.
针对目前机器学习方法在化学领域的资源实体及关系抽取任务上召回率低以及高度依赖人工特征工程和领域知识的问题,提出一种基于实体信息及关系信息融合标注的联合抽取方法(Information Fusion Tagging-Joint Model,IFT-Joint).该方法主要从以下两个方面改进:将联合抽取任务转化为序列标注问...  相似文献   

10.
关系抽取作为知识图谱等诸多领域的上游任务,具有广泛应用价值,近年来受到广泛关注。关系抽取模型普遍存在暴露偏差问题,抽取文本普遍存在实体嵌套和实体重叠问题,这些问题严重影响了模型性能。因此,提出了一种基于片段标注的实体关系联合抽取模型(span-labeling based model,SLM),主要包括:将实体关系抽取问题转化为片段标注问题;使用滑动窗口和三种映射策略将词元(token)序列进行组合排列重新平铺成片段(span)序列;使用LSTM和多头自注意力机制进行片段深层语义特征提取;设计了实体关系标签,使用多层标注方法进行关系标签分类。在英文数据集NYT、WebNLG上进行实验,相对于基线模型F1值显著提高,验证了模型的有效性,能有效解决上述问题。  相似文献   

11.
In recent years, high enrollment has greatly increased the counseling loads of academic advisors at American colleges and universities. Expert systems can assist academic counselors by solving a relatively easy class of problems which deal with the most encountered cases. In this paper, a prototype expert system, CLASS COUNSELOR, is presented. CLASS COUNSELOR recommends a set of courses after an interactive session with the student. It handles the upper division courses of the undergraduate program in the Department of Electrical Engineering, University of Florida. The program runs on IBM-AT personal computers and compatibles.  相似文献   

12.
一个无需词典支持和切词处理的中文文档分类系统   总被引:12,自引:0,他引:12  
报道了一个无需词典支持和切词处理的中文文档分类系统。其特点是利用N-gram信息进行中文文档分类,使中文文档分类摆脱了对词典和切词处理的依赖,实现了中文文档分类的领域无关性和时间无关性;采用开放的体系结构使文档分类系统易于功能扩充和性能完善。测试结果表明该系统具有令人满意的分类性能。  相似文献   

13.
深入分析NBA球员的各项数据,进行全面的球员各项能力分析,对教练了解每个球员的能力和优化出场人员及顺序有重要的意义.现有很多对NBA比赛数据进行分析的案例都仅针对球员的某一方面数据,对此提出一种从球员自身出发,分析其在赛季中的各项表现,以便于用户分析出球员能力的球员能力分析系统.该系统利用多维数据按照赛季和单场比赛两个...  相似文献   

14.
在海洋地震勘探中,海底地震仪OBS(Ocean Bottom Seismometer)导航定位系统可提高OBS投放精度。系统是在VS2010和OSG 3.0.0的可视化开发环境下,基于MFC框架,运用三维可视化技术搭建OBS投放场景,实现场景节点有效组织与管理,动态显示船只和OBS运动过程。采用Chunked LOD算法处理测深格网数据构建地形细节层次模型,应用OSG数据库分页管理和分页细节层次节点技术实现了OBS投放场景地形数据动态调度。通过场景漫游功能实现了OBS投放过程的多角度三维可视化监控,直观反映海底地形地貌与作业过程,提高了OBS投放精度和数据质量。  相似文献   

15.
本文研究程序代码可视化技术,即从现存的程序生成某种可视化表示,增强程序的易读性、易理解性和易维护性。首先介绍ProVS的设计思想和实现技术,然后给出输出例子。  相似文献   

16.
基于SOM-PNN分类器的体数据概率分类及绘制   总被引:1,自引:0,他引:1  
概率分类是三维医学体数据绘制必不可少的预处理环节。本文提出的SOM-PNN分类器,以贝叶斯置信度为基础,给出概率分类结果,并用于三维体制制,得到了良好的图像质量和较高的分类效率。  相似文献   

17.
交互式三维医学图像可视化系统MedVis   总被引:3,自引:0,他引:3  
本文介绍了我们开发的三维医学图像可视化系统MedVis。绘制的实时性和系统的交互性是设计MedVis的两个重要原则。  相似文献   

18.
介绍了医学图像数据传输与三维可视化系统的组成,讨论了与实现系统所具备功能有关的技术细节。借助DICOM3.0标准解决了医学图像数据传输中图像数据的兼容性问题,实现了医学图像的二维处理和三维可视化功能,有利于提高临床诊断的准确性和效率,并实现远程医疗。  相似文献   

19.
在移动互联网飞速发展的背景下,学术会议管理系统尚未能提供一个更方便、更即时的服务渠道给参会人员。针对这一问题,采用"基于前后端分离的多终端适配"方案构建了一个面向多终端服务的学术会议管理系统。为了节省人力、物力和时间,系统运用KNN算法实现了论文投稿自动分类的功能,并结合倒序贪婪算法解决了智能化分配审稿任务的问题。总之,移动互联网技术的运用提高了学术会议管理的网络信息化、规范化水平以及个性化服务质量。  相似文献   

20.
传统的温室大棚监测与控制系统一般采用布线方式,存在难度大、成本高等问题,已不能满足农业发展的需求。针对上述问题,研发一种基于DNN的WSN智慧大棚可视化与控制系统。在大棚内部署LoRa传感器网络采集环境信息。为直观地表达大棚内环境因子分布情况,采用Kriging方法构建环境因子分布图,并利用DNN神经网络建立专家知识库,能够自主科学地决策。通过反馈控制系统调节大棚内环境,使农作物具有最佳的生长环境。实验结果表明,该系统能够较好地展现环境因子分布情况且能够科学地调节大棚环境。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号