首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 250 毫秒
1.
癫痫病相关论文缺乏命名实体识别和关系抽取任务的标注数据,命名实体识别和关系抽取模型无法用常规方法训练。为解决该问题,针对癫痫病相关论文的数据特点,改进了命名实体识别和关系抽取模型,提出利用相近领域的医疗数据和预训练模型构建零资源癫痫病领域命名实体识别和关系抽取模型。评估了现有无监督和半监督模型在癫痫病领域论文数据集上的性能,并针对数据集特征引入域对抗网络和关系判别器,有效地提高了命名实体识别和关系抽取模型的性能。将癫痫患者的脑电特征以视觉模态嵌入知识图谱中,在提高脑电分析可解释性的同时,构建了更加直观的多模态知识图谱。  相似文献   

2.
利用序列数据语义标注学习方法来解决异构数据源的模式匹配问题,将从多个网站抽取的异构Web对象集成到关系数据库中.在线性链条件随机场的基础上提出了一种可叠加多阶链的组合条件随机场模型.该模型可以在由手工标注数据和关系数据库记录组成的联合样本集上进行训练,因此减少了对繁琐手工标注样本的依赖;此外,通过在线性链条件随机场模型上叠加高阶链,使得该模型能够有效地处理状态变量间的长距离依赖.在多个领域的真实数据集上的实验和分析结果表明,所提出的方法能显著提高异构Web数据的字段标注性能.  相似文献   

3.
为了解决在抽取过程中出现的关系三元组重叠问题,提出了一种基于位置辅助标记的实体关系联合抽取模型,使用BERT作为预训练语言模型,并且通过位置辅助矩阵方法,将关系三元组抽取转换成实体和关系的匹配问题,实现实体和关系的联合抽取,在中文数据集DuIE上进行了相关实验。实验结果表明,该模型抽取效果较好,提出的基于位置的辅助标记方法有效解决了关系重叠问题。  相似文献   

4.
针对Distant Supervision关系抽取方法训练语料存在大量噪声的问题,提出一种基于主题模型的噪声标注识别方法。该方法首先分析了中文Distant Supervision实体关系抽取方法面临的关系句子实例结构复杂的问题,然后利用自定义的模式以及模式聚类实现模式表示与聚合,最后使用主题模型识别噪声标注。实验结果表明,文章方法能有效识别噪声标注,用滤除噪声标注后的数据训练实体关系抽取模型,实验证明经过噪声滤除后实体关系抽取性能得到显著改善。  相似文献   

5.
针对目前云识别效率低下,同时缺乏公认且严谨、公开的地基云数据集问题,利用专业设备结合人工标注和迁移学习,构建了目前规模最大且符合国际气象组织标准的云公开数据集HBMCD,并且在此基础上,利用深度可分离卷积、膨胀卷积等技巧构建基本单元,通过组合不同的基本单元构建了轻量级云图分类模型LCCNet.经过多组对比实验,证明了LCCNet不仅参数量低、运算复杂度低,而且针对HBMCD数据集具有高达97.35%的准确率,为设备集成与实际应用提供了可能性.  相似文献   

6.
为了明确大气污染物、污染源、影响因素、评价指标、危害等之间的关系,分析大气污染传播路径,建立了一个较为清晰、完善的大气污染领域本体.首先,基于机器学习和自然语言处理等技术,提出一种基于注意力机制的序列标注联合抽取实体关系的方法,在双向长短时记忆(long short-term memory,LSTM)网络模型中加入注意力机制,并将实体和关系联合标注,从而进行实体关系抽取.其次,结合词频-逆文档频率(term frequency-inverse document frequency,TF-IDF)核心概念挖掘方法进行知识抽取,并将概念、属性、关系和实例组织起来,从而实现大气污染本体模型的半自动构建.最后,在本体和实例的基础上通过Protégé的SPARQL Query模块和HermiT推理机分别进行条件推理和可视化推理.结果表明,基于注意力机制的序列标注实体关系联合抽取方法所构建的大气污染领域本体包含核心实体68个,实例数360个,相较于现有的本领域本体,在全面性、有效性、准确性和可重用性方面都有较好表现,同时推理出了Ca2+和K+等污染离子的传播路径.因此,基于注意力机制的序列标注联合抽取实体关系的方法能够有效地半自动构建大气污染领域本体,推理出清晰的大气污染传播路径.  相似文献   

7.
在实体关系抽取研究领域中,目前多采用任务串联式的方式对实体关系进行抽取,此方式忽视多任务之间的联系,导致抽取效果不佳,对数据中客观存在的关系重叠问题也不能很好解决.针对上述问题,本文提出了一种基于Roberta语言模型的实体关系联合抽取模型.该模型结合条件随机场、卷积神经网络和自注意力机制,实现了实体关系的准确联合抽取.实验结果表明,本方法在中文的实体关系联合抽取方面表现比经典的Multi-head Selection以及DGCNN模型好,尤其体现在解决典型关系重叠问题方面.  相似文献   

8.
针对学业预警体系中“事前事中预防”措施不足、过程化与可视化较低的问题,进行了学业预警知识图谱的构建与应用。首先,通过protégé完成模式层的构建,对知识的数据结构(包含实体、关系、属性)进行了设计,采用了树状结构,使每个子类继承其祖先节点的属性;其次,以事实三元组为单位,存储具体的信息;然后,通过关系型数据库实现数据与本体的映射,对关系型数据库的结构化数据进行知识抽取,通过D2RQ工具将结构化数据转化为三元组数据,存储在SQL中;最后,使用Neo4j图数据库可视化展示,完成学业预警知识图谱的构建。公开数据集实验测试结果表明,所构建的学业预警知识图谱能够对学生学业进行预警,对实体及属性进行校验标注,经过采样标注后得到准确率为94.23%,且时效性良好,系统平均在9 ms后开始传输,并在25 ms后完成,同时在过程化与可视化方面有较大提升,可以实现“事前事中预防”。  相似文献   

9.
基于信息熵的半监督领域实体关系抽取研究   总被引:1,自引:1,他引:0  
针对监督机器学习方法抽取实体关系受限于标注语料的规模问题,提出采用信息熵方法来不断扩展小规模训练数据的半监督领域实体关系抽取。结合领域词汇选取小规模训练数据,构建了一定准确率的初始最大熵分类器,用来从未标记数据中预测出候选新实例。采用信息熵方法,通过设定不同熵值,多次循环以选取可信度较高的新实例来扩展训练数据。使用扩展后的训练数据重新迭代训练分类器,分类器性能趋于稳定迭代终止,实现了半监督学习的领域实体关系抽取。实验表明,和已有方法相比,本文提出的半监督领域实体关系抽取通过结合信息熵方法,在小规模标注样本环境中取得了较好的学习效果。  相似文献   

10.
针对铝硅合金轧制过程中,不同形状硅晶粒对铝基体影响不明的问题.根据有限元方法,以球形和板片状硅晶粒为研究对象,建立了变质前后不同形状硅晶粒有限元模型,分析晶粒周围等效应力、等效应变云图及曲线.解决了普通实验只能以拉伸实验数据判定变质处理前后铝硅合金性能,而不能从材料内部应力、应变角度解读性能差异的问题.分析结果表明:板片状硅晶粒与球状硅晶粒相比,周围应变不均现象更加明显,等效应力值更大,对材料性能影响更加不利.证明了通过变质处理对铝硅合金性能提高的重要性.模拟结束后,通过对变质处理前后试样进行拉伸试验,间接验证数值模拟方法的可行性和模拟结果的正确性.  相似文献   

11.
从文本大数据中快速准确地抽取文本的实体关系信息是构建知识图谱的关键.针对目前主流的远程监督关系抽取方法常常忽略实体对的类型信息和句子语法信息的问题,该文提出了一种基于深度强化学习的文本实体关系抽取方法.首先,利用结合实体周围词注意力机制的双向长短期记忆网络作为句子编码的第一个模块;然后,在此基础上加入实体类型嵌入模块,...  相似文献   

12.
医疗病历命名实体识别的主要任务是将临床电子病历中的非结构化文本转化为结构化数据,进而为面向医疗领域任务开展的数据挖掘提供基础支撑. 提出一种基于ALBERT模型融合学习的中文医疗病历命名实体识别模型. 首先,采用人工标注方式扩展样本数据集,结合ALBERT模型对数据集进行微调; 其次,采用双向长短记忆网络(BiLSTM)提取文本的全局特征; 最后,基于条件随机场模型(CRF)命名实体的序列标记. 在标准数据集上的实验结果表明,该方法进一步提高了医疗文本命名识别精度,减少了时间开销.  相似文献   

13.
围绕深度学习在NLP领域的应用,分析了BiLSTM、CRF、BERT、ALBERT的结构组成、运行机理及发展演进,提出使用ALBERT-BiLSTM-CRF模型提取联合训练文书信息实体的方法,并使用联合训练文书进行实验验证,最后用该模型的信息实体提取实验结果和模型训练时间与以往其他模型进行对比分析,得出该模型的综合性能...  相似文献   

14.
针对水稻病虫害知识图谱构建所需实体和关系,提出了一种基于FastBert模型的中文实体关系抽取方法. 首先,在中文语料收集的基础上,使用Hanlp工具和农业词典提取了与水稻病虫害相关的领域实体,并依据实体间关系的特点定义了病虫害别名、为害部位、为害地区、防治方法等7种类型. 然后,在词嵌入和句子嵌入的基础上通过FastBert模型实现水稻病虫害关系的抽取. 该模型与Robert、Electra、Distilbert等其它Bert相关模型的关系抽取结果比较显示,基于FastBert模型的中文水稻病虫害关系抽取效果更好,模型获得的实体间关系F1值达0.72,模型精度达0.69. 该方法为中文农业病虫害知识图谱的自动化构建提供了参考.  相似文献   

15.
介绍了E──R模型向关系模型转换过程中如何准确地据E──R模型对现实世界信息的描述定义完整性约束条件,详细讨论需定义参照完整性约束条件的几种情况,及其向关系模式转换的方法以及数据的存在依赖与参照完整性的联系。  相似文献   

16.
利用挤压铸造技术制备了Al2O3/Al─Si合金复合材料,研究了这种复合材料的凝固组织.结果表明,氧化铝纤维可作为铝硅合金中硅相非自发形核的衬底,但是未观察到纤维对α相的细化作用;氧化铝纤维与浸渗压力影响了复合材料的凝固过程,复合材料具有不同于普通基体合金的最终凝固组织.基于实验结果和凝固理论,提出了Al2O3/Al─Si合金复合材料的凝固模型.  相似文献   

17.
Dissolved hydrogen is harmful to mechanical properties of refined hypereutectic aluminum-silicon alloys. In the present work, by using a stepped-form mold and the hydrogen-detecting instrument HYSCAN Ⅱ, the relationship between the initial hydrogen content in the melt and the refinement effect on the casting of hypereutectic aluminum-silicon alloy was investigated. The experimental results show that the cooling rate, the hydrogen content and the grain refinement effect are three interactive factors. When the hydrogen content is above 0.20 mL/100 g and the cooling rate is lower than that in 50 mm-thick step, hydrogen dissolved in the alloy melt influences the grain refinement effect. With increasing the cooling rate, the critical hydrogen content increases too. It is expected that much hydrogen in the melt make the net interfacial energy larger than or equal to zero, resulting in the shielding of the particles AlP during solidification and that the critical gas content is closely related to the critical radius of embryo bubbles.  相似文献   

18.
SMT焊点在热循环加载条件下的应力应变过程分析是 SMT焊点可靠性研究的重要内容。SMT焊点的可靠性问题主要是焊点在热循环过程中 ,由于陶瓷芯片载体与基板材料之间的热膨胀失配而导致焊点的蠕变疲劳失效。以 CCGA焊点为例 ,利用 CCGA三维焊点形态预测表面节点输出结果 ,将焊点形态分析三维表面模型转换为焊点应力应变有限元分析三维实体模型 ,从而建立了 CCGA焊点可靠性分析模型 ,采用三维有限元方法分析了 CCGA焊点在热循环条件下的应力应变过程。在此基础上 ,对 CCGA焊点疲劳寿命进行了计算  相似文献   

19.
针对废储氢合金粉回收提出一种全新的方法,即提炼和冶炼相结合的方法,并研究提炼后的中间合金及再生新合金的性能.经测试,回收后储氢合金的电化学容量达到282 mAh/g,PCT测试固气吸氢量为1.032%(质量分数),X射线测得主体相为CaCu5型六方结构,但其中含有微量杂质相,这有待于对中间合金的提炼工艺做进一步的研究.总之,利用此种方法得到回收后储氢合金的性能与原合金相近,是一种具有广阔发展前景的回收方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号