共查询到20条相似文献,搜索用时 15 毫秒
1.
目的 为了解决包装行业相关文本命名实体识别困难问题,提出在BiLSTM(Bidirectional Long Short-Term Memory)神经网络中加入注意力机制(Attention)和字词联合特征,构建一种基于注意力机制的BiLSTM深度学习模型(简称Attention-BiLSTM),以识别包装命名实体。方法 首先构建包装领域词典匹配包装语料中词语的类别特征,同时将包装语料转换为字特征和词特征联合的向量特征,并且在过程中加入POS(词性)信息。然后将以上特征联合馈送到BiLSTM网络,以获取文本的全局特征,并利用注意力机制获取局部特征。最后根据文本的全局特征和局部特征使用CRF(Conditional Random Field)解码整个句子的最优标注序列。结果 通过对《中国包装网》新闻数据集的实验,获得了85.6%的F值。结论 所提方法在包装命名实体识别中优于传统方法。 相似文献
3.
钢箱梁正交异性板在桥梁建设中应用广泛,对此类结构疲劳损伤进行无损检测并发现病害特征,有利于及时的进行现场维修加固。该文使用高倍数显微相机进行疲劳微裂纹的检测,提出基于条件随机场(CRFs)的金属疲劳微裂纹检测算法,该方法使用单个像素的表观特征来进行裂纹判别,同时也考虑其他像素标注值间的影响,从而很好地抑制离散噪音点。通过多种表观特征和机器学习方式自动识别出区分性最强的特征从而加以选择使用。实验结果表明,基于CRFs模型的裂纹检测方法对于试件6~16万次的图像裂纹宽度测量与人工测量值非常接近,这为钢箱梁正交异性板疲劳损伤快速检测提供可靠的分析手段。 相似文献
4.
5.
6.
中文电子病历命名实体标注语料库构建 总被引:1,自引:0,他引:1
针对中文电子病历命名实体语料标注空白的现状,研究了中文电子病历命名实体标注语料库的构建。参考2010年美国国家集成生物与临床信息学研究中心(1282)给出的电子病历命名实体类型及修饰类型的定义,在专业医生的指导下制定了详尽的中文电子病历标注规范;通过对大量中文电子病历的分析,提出了一套完整的中文电子病历命名实体标注方案,而且采用预标注和正式标注的方法,建立了一定规模的中文电子病历命名实体标注语料库,其标注语料的一致性达到了92%以上。该工作对中文电子病历的命名实体识别及信息抽取研究提供了可靠的数据支持,对医疗知识挖掘也有重要意义。 相似文献
7.
8.
《中国新技术新产品》2021,(9)
命名实体识别NER是自然语言处理NLP领域中重要的基础任务之一。BIOE序列标注一般采用间接标注实体的方法,难以解决实体嵌套的问题;实体位置和实体类别两阶段的识别存在误差传播问题。针对该问题,根据实体在文中始末位置2个维度构建棋盘,再结合类别维度构建三维棋盘空间来标注实体,棋盘空间中的一个标注点即代表一个实体,是一种在高维空间直接标注实体的方法。该文在预训练模型BERT/NEZHA的基础上设计了一种NER模型,在CLUENER2020数据集上进行试验,棋盘空间标注的NER的F1指标分别为80.43和80.71,相比于BERT-CRF等模型略有提升,表明该标注方法和模型具备可行性和先进性。 相似文献
9.
中文名实体识别:基于词触发对的条件随机域方法 总被引:1,自引:0,他引:1
首次把条件随机域(CRF)模型应用到了中文名实体识别中,且根据中文的特点,定义了多种特征模板.同时,为了解决长距离约束问题,将词语触发对融合到了CRF模型中.提出了基于词语方差(word variance)的选词方法,在词语相关性计算上,采用了平均互信息(AMI)方法和χ2统计量方法.通过在半年人民日报上的测试,结果表明在采用相同特征集合的条件下,条件随机域模型较其他概率模型有更好的性能表现;融合长距离触发对的条件随机域模型可以使系统的F量度提高约1.38%. 相似文献
10.
现有中文命名实体识别(NER)模型在公开数据集上的表现相对成熟,但有研究指出,模型过度依赖实体文本的字面特征,而上下文对实体识别的影响却未得到重视。现有的模型在简单的泛化测试中表现较差,因此本文提出显式地为上下文独立建模,令模型对上下文和实体的字面信息进行区分。为此,也提出了相应的数据增强方法用于训练模型中的上下文模块、实体字面模块和综合模块。实验结果表明,本文提出的方法在不损失测试集识别效果的情况下,明显改善了模型在不变性测试中的表现,较基准模型其失败率降低了2.3%。 相似文献
11.
12.
中文分词是自然语言处理的基础。根据各种分词模型的特性,提出一种双层分词模型。在底层用隐马尔可夫模型(HMM)进行粗分,在高层利用条件随机场(CRF)对文本进行重新标注。从实验结果证明,该模型是有效的。 相似文献
13.
14.
步态识别作为一种新的生物特征识别技术,是通过人走路的姿势实现对个人身份的识别和认证。对隐马尔可夫模型进行研究并对算法实现中遇到的问题加以分析,在此基础上实现了利用隐马尔可夫模型的步态特征提取与身份识别方法。 相似文献
15.
本文通过齐次树指标任意随机场与马氏链场相比较,研究齐次树上任意随机场用不等式给出的一类Shannon-McMillan极限定理,即随机偏差定理,为进一步研究树图随机场的信息编码提供了理论基础. 相似文献
16.
以2000年1月-12月《人民日报》大约80万汉字语料为基础,利用基于隐马尔可夫模型并结合统计来评价在真实文本中构成中文姓名的能力.实现中文姓名的自动识别。实验测试表明:准确率达91.5%,召回率为89.5%。 相似文献
17.
针对裂缝形态多样性和分布随机性使得传统裂缝图像分割算法的泛化能力弱的问题,提出一种基于几何结构测度的路面裂缝图像分割算法。首先,采用瑞利分布和高斯分布对裂缝图像背景和目标进行建模,并用期望最大化算法求解裂缝灰度混合模型参数;然后,通过高斯核函数与图像的卷积计算裂缝的边界映射,用梯度矢量流场构造裂缝图像Hessian矩阵,由Hessian矩阵描述裂缝测度函数并获取裂缝多尺度特征向量;最后,将裂缝多尺度特征向量和灰度混合模型融合到马尔可夫随机场,基于最小能量准则,利用条件迭代算法求解裂缝最大标号场来实现裂缝图像分割。实验表明,与仅依靠灰度特征的传统裂缝图像分割算法相比,所提算法综合指标达88.02%、重叠率达54.92%,优于其他算法,具有良好的噪声抑制能力和泛化能力。 相似文献
18.
基于标准正交随机变量的波数谱表示,通过定义标准正交随机变量集的随机函数形式,建立了连续时空随机场模拟的波数谱-随机函数方法。同时,引入快速傅里叶变换(FFT)的算法,极大地提高了波数谱-随机函数方法的模拟效率。在波数谱-随机函数模拟方法中,仅需两个基本随机变量即可在概率密度层次上描述时空随机场的概率特性,并利用数论方法选取基本随机变量的代表性点集,实现对连续时空随机场模拟的降维表达。数值算例表明,当模拟相同数量的样本时,综合考虑模拟的效率和精度两方面,该文方法与传统的波数谱表示方法不分伯仲,但该文方法所需的基本随机变量最少,生成的代表性样本数量少且构成一个完备的概率集,从而可结合概率密度演化理论实现结构随机动力反应及动力可靠度的精细化分析。最后,结合Kaimal风速谱及Davenport空间相干函数模型,模拟了水平向脉动风速连续随机场,验证了该文方法的有效性和优越性。 相似文献
19.
20.