首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
论述了近年来国内外在常规命名实体识别方面研究工作的进展状况,针对其中最为关键的产品命名实体识别技术,考虑到领域本体对产品命名实体识别的支持,提出了将本体特征融入到统计模型中,结合词性特征、上下文特征,以及本体特征的多特征模型进行产品命名实体识别实验,实验结果证明,该方法能有效地提高产品命名实体识别的性能。  相似文献   

2.
癫痫病相关论文缺乏命名实体识别和关系抽取任务的标注数据,命名实体识别和关系抽取模型无法用常规方法训练。为解决该问题,针对癫痫病相关论文的数据特点,改进了命名实体识别和关系抽取模型,提出利用相近领域的医疗数据和预训练模型构建零资源癫痫病领域命名实体识别和关系抽取模型。评估了现有无监督和半监督模型在癫痫病领域论文数据集上的性能,并针对数据集特征引入域对抗网络和关系判别器,有效地提高了命名实体识别和关系抽取模型的性能。将癫痫患者的脑电特征以视觉模态嵌入知识图谱中,在提高脑电分析可解释性的同时,构建了更加直观的多模态知识图谱。  相似文献   

3.
医疗病历命名实体识别的主要任务是将临床电子病历中的非结构化文本转化为结构化数据,进而为面向医疗领域任务开展的数据挖掘提供基础支撑. 提出一种基于ALBERT模型融合学习的中文医疗病历命名实体识别模型. 首先,采用人工标注方式扩展样本数据集,结合ALBERT模型对数据集进行微调; 其次,采用双向长短记忆网络(BiLSTM)提取文本的全局特征; 最后,基于条件随机场模型(CRF)命名实体的序列标记. 在标准数据集上的实验结果表明,该方法进一步提高了医疗文本命名识别精度,减少了时间开销.  相似文献   

4.
利用维基百科中命名实体页面的超链接信息,根据页面共现超链接计算得到命名实体的关联度.该方法计算得到的命名实体关联度与人工标注的结果比较,二者基本吻合,表明该方法计算得到的命名实体关联度具有较高的准确率.  相似文献   

5.
基于CRFs的多策略生物医学命名实体识别   总被引:1,自引:0,他引:1  
生物医学命名实体识别是生物医学文本挖掘的基本任务。机器学习方法是生物医学命名实体研究的主流方法,选取有效的机器学习算法和采取有效的识别策略是提高生物医学命名实体识别性能的关键,鉴于条件随机域算法在自然语言处理领域的优势,本文采用该算法并结合多种识别策略对生物医学命名实体识别进行研究。实验取得了良好的效果,F测度达到了70.52%,与其它相关系统比较,识别性能有了明显提高。  相似文献   

6.
分析数据集成中常见的数据迁移方法及它们的优缺点.利用Hibernate的实体映射功能,说明了如何建立实体映射规则,提出了一种解决多键值依赖的面向对象数据迁移方法.实际应用表明,该方法数据迁移速度快,不仅能够完整地迁移所有数据,同时还能保证数据迁移过程中数据精度的损失在可控范围内.  相似文献   

7.
提出了一种基于Transformer和隐马尔科夫模型的字级别中文命名实体识别方法。本文改进了Transformer模型的位置编码计算函数,使修改后的位置编码函数能表达字符之间的相对位置信息和方向性。使用Transformer模型编码后的字符序列计算转移矩阵和发射矩阵,建立隐马尔科夫模型生成一组命名实体软标签。将隐马尔科夫模型生成的软标签带入到Bert-NER模型中,使用散度损失函数更新Bert-NER模型参数,输出最终的命名实体强标签,从而找出命名实体。经过对比实验,本文方法在中文CLUENER-2020数据集和Weibo数据集上,F1值达到75.11%和68%,提升了中文命名实体识别的效果。  相似文献   

8.
命名实体识别是自然语言处理的核心任务。在基于深度学习的中文命名实体识别方法中,静态字向量无法表征字的多义性。针对该问题,提出了基于XLnet嵌入的中文命名实体识别方法。该方法首先通过XLnet(Generalized Autoregressive Pretraining for Language Understanding,XLnet)模型获取字级别的上下文表示。其次,利用BiLSTM-CRF模型获取文本依赖信息和标签信息。实验结果表明,该方法在人民日报、MSRA、Boson等3种数据集上分别达到91.9%、89.8%、74%的F1值,均高于其他主流的中文命名实体识别方法。  相似文献   

9.
基于STEP-NC应用数据模型和标准数据存储界面(SDAI),通过构造数据字典模型、实体实例数据结构模型和零件实例数据结构模型,建立了描述STEP NC加工程序的零件 实体分级数据结构,实现了STEP-NC数据到C++数据的转换.采用步进式构造方式提取STEP-NC程序信息,通过回溯递归方法构造了STEP-NC单元实体实例,进而匹配实体属性项内容,建立了零件级的数据结构.该方法避免了SDAI迟联编在实体建立和实体实例建立之间的时序矛盾.最后开发了信息提取原型系统,实例论证表明,该系统能够识别STEP-NC数控加工程序,并显示零件单特征几何形体.  相似文献   

10.
针对材料领域没有适合材料实体关系抽取技术研究工作的公开数据集这一问题,通过研究高硅铝合金喷射沉积文献提出铝硅合金实体关系抽取数据集的构建方法. 在材料领域专家的指导下制定铝硅合金实体关系抽取数据集的构建标准,并根据构建标准对收集的数据进行实体标注和关系标注. 在标注完成后,通过数据预处理生成铝硅合金实体关系抽取数据集. 通过实体关系联合抽取模型进行实验,验证该数据集可以应用于实体关系抽取任务. 与公开数据集相比,材料数据集句子的语义和语法更为复杂,长句更多,导致实体关系联合抽取模型在材料数据集上的表现略差. 针对上述问题,在实体关系联合抽取模型上加入自注意力机制,使该模型整体的F1值提高了约5.8%. 该数据集的构建方法具有普适性,可以通过该构建方法构建材料数据集.  相似文献   

11.
近年来,中文产品评论的特征情感分类是Web数据挖掘的重要研究内容之一.提出了一套完整的产品命名实体、特征词、情感词以及边界的标注规则,设计了多层次的混合标签模式;提出了双层HHMM(层级隐马尔科夫模型)结构,将词形标注和词性标注的特点进行融合;提出了基于词形标注的HHMM-1算法和基于词性标注的HHMM-2算法,实现复杂短语的自动标注.实验证明,双层HHMM模型起到了互补的作用,模型的查全率和F-score值均有较大提高.  相似文献   

12.
针对水稻病虫害知识图谱构建所需实体和关系,提出了一种基于FastBert模型的中文实体关系抽取方法. 首先,在中文语料收集的基础上,使用Hanlp工具和农业词典提取了与水稻病虫害相关的领域实体,并依据实体间关系的特点定义了病虫害别名、为害部位、为害地区、防治方法等7种类型. 然后,在词嵌入和句子嵌入的基础上通过FastBert模型实现水稻病虫害关系的抽取. 该模型与Robert、Electra、Distilbert等其它Bert相关模型的关系抽取结果比较显示,基于FastBert模型的中文水稻病虫害关系抽取效果更好,模型获得的实体间关系F1值达0.72,模型精度达0.69. 该方法为中文农业病虫害知识图谱的自动化构建提供了参考.  相似文献   

13.
针对新闻和微博2组有代表性的语料开展实验研究,旨在发现不同词性特征及其组合对2种通用网络平台话题检测的作用及其影响.研究表明:在选择单一词性特征时,名词特征可得到最好的检测结果,命名实体可在保证准确率的情况下大大降低聚类的特征维度.在选择词性组合作为特征时,名词或命名实体、数词、时间短语、形容词以及量词的组合特征可提升新闻网络话题检测的准确率,而名词或命名实体、形容词、量词、数词以及特殊符号与网址的组合特征可在微博语料上获得较好的检测结果.  相似文献   

14.
针对汽车领域命名实体识别中汽车属性名识别的准确率和召回率较低的问题,提出了一种基于本体特征的汽车领域命名实体识别方法。通过扩展现有叙词表,基于叙词表构建汽车领域本体,提取语料中的本体特征,利用CRFs模型对汽车领域命名实体进行识别。实验结果表明,本体特征能够有效地识别出汽车属性实体,准确率、召回率和F值分别为75.60%,66.12%和70.54%。  相似文献   

15.
一种造型设计方法UFF及其应用   总被引:2,自引:0,他引:2  
提出产品造型设计方法UFF,此方法结合了用户过程分析、功能论分析,以及模糊逻辑方法.UFF方法把用户过程分析作为设计前期发现、明晰设计问题的工具,通过传统公认的功能论设计思想,把产品的功能目标系统转化为技术、艺术和谐共存的创造性设计方案.鉴于造型设计方案评价的模糊性,最后通过模糊逻辑决策模式采集用户评分对种子设计方案进行评价优选,获得最优方案.从而提供一种可依托的产品开发中的造型设计途径,并以测量设备为例,进行了应用.  相似文献   

16.
随着电子病历数据量的快速增长,如何深层次、高效率地利用电子病历资源成为越来越迫切需要解决的问题. 从真实病历出发,研究电子病历的医学实体识别问题,为计算机更好地辅助医疗奠定基础. 通过人工标注的108份心血管科的真实病历数据与3类特征模板,运用条件随机场和双向长短时记忆网络联合条件随机场对心血管科电子病历疾病命名实体抽取的实验,并进行比较分析. 结果表明,结合合适的特征模版,条件随机场模型有更好的抽取性能,是一种较为适用的病历命名实体抽取方法.  相似文献   

17.
针对语音信号处理中语音短时幅度谱分布模型过于单一的问题,提出了一种基于隐马尔科夫模型的语音幅度谱分布估计算法。该算法利用瑞利混合模型作为语音幅度谱分布,采用隐马尔科夫模型将语音分成不同的状态,在每一状态中有一组瑞利混合模型参数与之相对应,通过把语音信号分成不同的状态对语音进行分类,为语音短时谱幅度建立更为准确的模型。  相似文献   

18.
由于缺乏大量已标注数据,在中文医疗命名实体识别中,主要利用外部资源来改善医疗实体识别的性能,这需要大量的时间和有效的规则加入外部资源.为了解决标注数据不足的问题,提出了一种基于生成对抗网络的数据增强算法,自动生成大量标注数据,提高医疗实体识别的性能.实验结果表明,该算法在性能方面优于实验中的基准模型,证明了该算法在医疗实体识别上的有效性.  相似文献   

19.
20.
根据图形消隐的基本原理,针对心射极平投影的特点,使用线、面比较法在极平投影面上判断晶面的可见性,进而消除矿物晶体形态图中的隐藏线.此方法简捷、可行,计算量较小.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号