期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

条件随机域与上下文线索结合的生物实体识别 总被引：1，自引：0，他引：1

杨志豪林鸿飞李彦鹏《计算机工程》2008,34(7):203-204

介绍一个用于在生物医学文献中识别基因、蛋白质等生物实体的识别方法。该方法基于条件随机域方法,选取适当特征进行实体识别,利用上下文线索进一步提高识别性能。实验结果表明上下文线索的引入使识别性能在条件随机域方法基础上提高了近3%,从而获得了较好的最终识别效果。相似文献

2.

音乐命名实体识别方法

佘俊张学清《计算机应用》2010,30(11):2928-2931

为了能快速、准确地将分散在Web网页中的音乐实体抽取出来,在全方位了解音乐领域中命名实体的特征的基础上,提出了一种规则与统计相结合的中文音乐实体识别方法,并实现了音乐命名实体识别系统。通过测试发现,该系统具有较高的准确率和召回率。相似文献

3.

面向电力规章制度的命名实体识别

陈鹏蔡冰何晓勇金兆轩金志刚侯瑞《计算机系统应用》2022,31(6):210-216

在电力生产的过程中, 往往会产生大量电力相关的文本数据, 但这些数据大多是非结构化数据且体量庞大繁杂, 实现对电力相关数据有效的组织管理可以促进电力企业实现数字资产商品化, 以此为电力企业发掘新的利润增长点. 本文针对将电力行业中的相关规章制度文本进行结构化处理这一问题, 提出了基于字符和二元词组特征的命名实体识别的模型. 在该模型中, 通过使用融合多特征的BERT预训练语言模型得到词嵌入表示, 并使用引入相对位置编码的Transformer模型和条件随机场作为编码层和解码层, 本文提出的模型在实体类型识别的准确率为92.64%, 取得了有效的识别效果. 相似文献

4.

基于HMM的京剧机构命名实体识别算法

乐娟赵玺《计算机工程》2013,39(6)

针对机构命名实体识别效率低的问题,提出一种基于隐马尔科夫模型(HMM)的京剧机构命名实体识别算法.利用HMM模型标注文本切分结果的词性消除歧义,通过Viterbi算法计算某种分词结果所对应的可能性最大的词性序列.根据定制的名称识别规则,借助机构前缀词库、后缀词库获得机构名称左右边界,通过自动机算法识别语料中的机构命名实体,并将新词加载到分词词典中.针对京剧领域语料进行开放测试验证,结果表明,该算法的识别正确率可达到99％. 相似文献

5.

基于条件随机域的上下文人类动作识别

下载免费PDF全文

朱文球刘强《计算机工程与应用》2008,44(28):180-183

提出一种新的基于条件随机域和隐马尔可夫模型（HMM）的人类动作识别方法——HMCRF。目前已有的动作识别方法均使用隐马尔可夫模型及其变型,这些模型一个最突出的不足就是要求观察值相互独立。条件模型很容易表示上下文相关性,且可使用动态规划做到有效且精确的推论,它的参数可以通过凸函数优化训练得到。把条件图形模型应用于动作识别之上,并通过大量的实验表明,所提出的方法在识别正确率方面明显优于一般线性结构的CRF和HMM。相似文献

6.

基于多层条件随机场的中文命名实体识别 总被引：2，自引：0，他引：2

下载免费PDF全文

胡文博都云程吕学强施水才《计算机工程与应用》2009,45(1):163-165

命名实体识别属于自然语言处理的基础研究领域,是信息抽取、信息检索、机器翻译、组块分析、问答系统等多种自然语言处理技术的重要基础。主要研究中文命名实体中对复杂地名和复杂机构名的识别,提出一种基于多层条件随机场的命名实体识别的方法。对大规模真实语料进行开放测试,两项识别的召回率、准确率和F值分别达到91.95%、89.99%、90.50%和90.07%、88.72%、89.39%。相似文献

7.

几种基于机器学习的生物命名实体识别模型比较

邱莎《数字社区&智能家居》2007,(3):1385-1387

已有的大量生物医学文本为人们提供了充足的资料，但却没有足够好的工具来帮助人们从中获取信息和知识。而命名实体识别则在信息检索、信息抽取及知识发现等这样的应用中起着很重要的作用。本文基于JNLPBA生物命名实体识别任务，简要介绍了目前几种在生物医学文本中常用的基于机器学习的命名实体识别模型，并进行比较及常规讨论，同时也提供了一些相关的背景信息。相似文献

8.

基于条件随机场的农业命名实体识别

张剑吴青羊昕旖王彬聪吴宣为徐向英吕强《计算机与现代化》2018,(1):123

为满足农业命名实体领域中多样而精确的需求,本文采用基于条件随机场的命名实体识别,将农业命名实体分为病虫害、作物、化肥及农药4种命名实体,并用自定义标注集对其进行标注,以ICTCLAS分词系统来对收集到的语料进行分词,通过添加多种不同的特征以提高识别率。最终训练得到的模型对各命名实体识别的准确率达到了93%以上,召回率达到了84%以上,证明对农业命名实体细致划分为多个实体是可行的。相似文献

9.

命名实体识别中适应性特征的跨领域与跨风格特性研究

黎航宇《软件》2014,(10):100-106

本文在采用基于字的条件随机场进行中文命名实体识别的基础上,进一步探究模型对于中文异质语料的适应性,并将传统的英文中单纯领域适应性问题进一步拓展,将中文语料细分为不同领域与不同语言风格两种情况,并引入无监督隐马尔科夫模型的标注作为新特征,然后比较这些特征的引入对模型在领域适应性以及语言风格适应性上的不同影响。实验表明,隐马尔科夫模型的标注特征,只可以在不同领域但相同风格的中文语料间提升模型的适应性,而该特征在不同风格的中文语料间适应性上则较差。相似文献

10.

基于自学习的汉语开放域命名实体边界识别

付瑞吉秦兵刘挺《电脑学习》2014,(4)

命名实体识别是自然语言处理领域的一个重要任务,为许多上层应用提供支持。本文主要研究汉语开放域命名实体边界的识别。由于目前该任务尚缺乏训练语料,而人工标注语料的代价又太大,本文首先基于双语平行语料和英语句法分析器自动标注了一个汉语专有名词语料,另外基于汉语依存树库生成了一个名词复合短语语料,然后使用自学习方法将这两部分语料融合形成命名实体边界识别语料,同时训练边界识别模型。实验结果表明自学习的方法可以提高边界识别的准确率和召回率。相似文献

11.

基于BSTTC模型的中文命名实体识别

申晖张英俊谢斌红赵红燕《计算机系统应用》2021,30(6):262-270

大多数中文命名实体识别模型中, 语言预处理只关注单个词和字符的向量表示, 忽略了它们之间的语义关系, 无法解决一词多义问题; Transformer特征抽取模型的并行计算和长距离建模优势提升了许多自然语言理解任务的效果, 但全连接结构使得计算复杂度为输入长度的平方, 导致其在中文命名实体识别的效果不佳. 针对这些问题,... 相似文献

12.

采用Transformer-CRF的中文电子病历命名实体识别

下载免费PDF全文

李博康晓东张华丽王亚鸽陈亚媛白放《计算机工程与应用》2020,56(5):153-159

命名实体识别是自然语言处理的基本任务之一。针对中文电子病历命名实体识别传统模型识别效果不佳的问题,提出一种完全基于注意力机制的神经网络模型。实验采用自建真实中文电子病历数据集并对数据集进行人工标注、分词等预处理;对Transformer模型进行训练优化,以提取文本特征;利用条件随机场对提取到的文本特征进行分类识别。为验证所提方法的有效性,将构建的Transformer-CRF神经网络模型与其他7种传统模型进行比较研究,实验采用精确率、召回率和[F1]值三个指标评估模型的识别性能。实验结果显示,在同一语料集下,Transformer-CRF模型对身体部位类的命名实体识别效果较好,[F1]值高达95.02%;且与其他7种传统模型相比,Transformer-CRF模型的精确率、召回率和[F1]值均较高,在一定程度上验证了所构建模型具有较好的识别性能。相似文献

13.

基于条件随机场的英文产品命名实体识别

下载免费PDF全文

张朝胜郭剑毅线岩团余正涛雷春雅王海雄《计算机工程与科学》2010,32(6):115-117

英文产品命名实体识别目前国内外研究得较少,本文针对TREC 2009英文产品命名实体(EPNE)识别的任务,首次提出了一种基于条件随机场模型(CRF)的英文产品命名实体识别方法。在条件随机场中,该方法以词作为切分粒度,充分利用上下文和英文产品名特有的指示信息作为分类特征,结合手工构建的品牌词表进行建模。实验表明,该方法获得了较好的结果,英文产品实体识别准确率达到93.6%,召回率达到92.4%。相似文献

14.

基于混合统计模型的汉语命名实体识别方法 总被引：4，自引：0，他引：4

下载免费PDF全文

张晓艳王挺陈火旺《计算机工程与科学》2006,28(6):135-139

本文针对三种重要的命名实体,即人名、地名、组织名,提出了一种隐马尔可夫模型（HMM）和最大熵模型（ME）相结合的汉语命名实体识别的方法.该方法的特点在于：使命名实体识别和词性标注两个任务一体化;融合两种统计模型进行命名实体识别,其中HMM从整体上（句子范围内）对命名实体识别进行约束,ME则在局部范围内（当前词的上下文范
范围）估计一个词串被标记为某种命名实体的概率.实验表明,这种方法能较好地识别上述三种命名实体. 相似文献

15.

基于条件随机域模型的中文实体关系抽取

下载免费PDF全文

周晶《计算机工程》2010,36(24):192-194

针对信息抽取领域中存在的抽取结果难以满足需要的问题,给出基于条件随机域模型的方法,以解决组块标注和实体关系抽取问题。通过定义中文组块和实体关系的标注方式,选择比较通用的《人民日报》语料,训练出效率较高的二阶模板来抽取文本中的实体关系。实验结果表明,该方法可以获得更好的抽取效果。相似文献

16.

命名实体识别研究 总被引：5，自引：4，他引：5

张晓艳王挺陈火旺《计算机科学》2005,32(4):44-48

命名实体识别是文本信息处理的重要基础,已经逐步成为自然语言处理的一项关键技术。其基于规则、统计、机器学习的研究方法及成果,都推动了自然语言处理研究的发展,促进了自然语言研究与应用的紧密结合。本文回顾了命名实体识别技术的发展过程,分析了主要的方法和技术,并展望了未来的发展趋势。相似文献

17.

基于含边界词性特征的中文命名实体识别

下载免费PDF全文

邱莎王付艳申浩如段玻阿圆丁海燕《计算机工程》2012,38(13):128-130

根据词性在任务中可能出现的特征表达,在字粒度一级,基于条件随机场模型,对词性特征在中文命名实体识别任务中的应用进行研究,提出一种将词性和词边界合成为一个特征项的方法。在相同实验环境下针对多种词性特征的应用情况,采用序列标注的方式在公共语料上进行多次中文命名实体识别实验。通过对多次实验结果的比较分析得出,二级词性与词边界合成的特征在系统执行性能和识别效果等方面均为最优。相似文献

18.

基于深层条件随机场的生物医学命名实体识别^*

孙晓孙重远任福继《模式识别与人工智能》2016,29(11):997-1008

生物医学命名实体识别是从生物医学文献中获取关键知识的基础与关键任务.文中提出基于深层条件随机场的生物医学命名实体识别方法,构建多层结构的深层条件随机场模型,在不同层次的特征上结合增量式学习策略,选择最优特征集.最后通过基于〈全名,缩写〉对和基于领域信息的错误纠正算法,进一步修正识别结果.在生物医学命名实体评测语料JNLPBA上的实验验证文中方法的有效性. 相似文献