首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
匹配树和决策树方法识别英语句子中的BaseNP   总被引:2,自引:1,他引:1  
提出了语料库和机器学习相结合的方法识别英语句子中的简单的、非递归的名词短语(BaseNP),在含有词性标注和BaseNP边界标注的训练语料中,抽取所有不同类型BaseNP短语对应的词性序列(BaseNP规则),通过规则排序和语方学知识,对其中正确率低且明显不符合语法的规则进行剔除,在识别时,采取规则匹配树的方法进行最大长度匹配,通过归纳机器学习C4.5自满引入上下文信息,由C4.5算法学习出有效(  相似文献   

2.
对自由文本形式的中医古籍文献(医古文)进行标注,是对其进行深入分析的前提,语义标注技术是实现该目的的方法之一。该文将中医古籍文献中包含的术语分为名称性术语以及叙述性术语。在分析叙述性术语特点的基础上,将对其语义标注转化为基于有监督学习的短句序列标注或分类问题,并提出了名词性术语规约操作以及基于知网的替换操作两种预处理方法。最后该文通过实验对比了三种学习模型及四种特征选择算法,并证明了问题转化的可行性以及两种预处理方法的有效性。  相似文献   

3.
手工注释图像是一项费时费力的工作,论文利用SVM,实现了半自动图像注释。首先将图像库分为两部分,手工标注训练图像库中的图像,剩余的图像作为测试图像;然后用SVM对图像进行分类,并将输出结果概率化;最后应用K—NN决策规则,为待注释图像获取关键词。实验结果显示,该方法是有效的。  相似文献   

4.
针对电网调度领域实体识别准确率较低的问题,提出一种融合多头注意力机制和双向长短时记忆网络的电网调度领域中文命名实体识别方法。利用词向量表示电网调度语音识别后语句,并将生成的词向量序列输入双向长短时记忆网络(BiLSTM)挖掘其上下文语义特征,引入多头注意力机制重点关注文本中的实体词,挖掘其隐藏特征,同时通过条件随机场(CRF)计算序列标签的联合概率标注出实体识别结果。根据电网调度语音识别后文本特点自建标注数据集,并将电网调度语音识别文本中的命名实体细粒度划分为参数、设备、操作、系统、组织5个类别进行实验。其结果表明,该方法对电网调度领域实体识别具有更高的准确率和召回率,且F1值可达到93.63%,切实解决了电网调度领域实体识别任务中标注数据稀少和精度较低的问题,有助于电网调度领域知识图谱的构建。  相似文献   

5.
变电站安全操作监控系统   总被引:1,自引:0,他引:1  
介绍一种变电站安全操作监控系统,该系统可有效防止多种错误操作,减少供电事故的发生。由静态操作规则库和动态操作规则库产生正确的操作票和操作控制序列,为安全操作监控系统监视和控制变电站例闸操作提供依据。主控计算机通过485总线、PLC和电磁锁实现对变电站供电操作的集中监视和控制。引入动态操作规划库增大了安全操作监控系统的灵活性。能够适应各种变电站的复杂操作。  相似文献   

6.
缩略词拓展解释识别任务中标注样本较少,无法从中总结出全面的规则或采用有监督的学习方法来学习.为此,提出一种基于半监督条件随机场(CRF)的缩略词扩展解释识别模型,利用广泛的未标注样本和较少的标注样本寻找序列文本中恰当的语句,以解释给定的缩略词.使用较少的标注序列样本训练一个全监督CRF模型,针对未标注序列样本,采用最小序列熵学习样本之间的联系,结合标注样本和未标注样本,利用半监督自学习方法学习两者的关系.实验结果表明,该模型的序列F1值达到84.73%,高于支持向量机和全监督CRF基准算法.  相似文献   

7.
针对主网调度操作票数据利用率低、校验延时、校验成本过高等问题,引用加权队列设计主网调度操作票安全校验系统。设计了管理模块和时钟芯片,增加了用户管理、图形管理和操作管理单元,并引用DS1302时钟芯片,完成主网调度操作票数据记录,同步记录数据和时间,应用加权队列进行数据缓冲,计算数据包的平均长度,随机转发多个数据包,在服务器内部分析数据包调度随机数。通过数据加权确定阈值,利用跳数描述结果进行数据调度,分析主网调度网络的即时状态,进行加权计算、比较阈值,实现主网调度操作票安全校验。实验结果表明,该系统具有较强的校验能力,减少了延时,降低了工作成本。  相似文献   

8.
汉语语料的切分标注加工系统   总被引:3,自引:1,他引:3  
徐菁  张辉  陆汝占 《计算机工程》2003,29(9):66-68,165
介绍了一个对汉语语料进行切分标注粗加工的系统WegPos。该系统采用前缀码分词算法,用二元语法模型进行词性标注,并利用概率统计、规则、歧义数据库、部分句法分析等多种方法的结合排除分词和标注中产生的歧义。  相似文献   

9.
哈萨克语词性自动标注研究初探   总被引:1,自引:0,他引:1       下载免费PDF全文
词性标注在很多信息处理环节中都扮演着关键角色。哈萨克语作为新疆地区通用的少数民族语言之一,自然语言处理中的一些基础性的课题同样成为迫切需要解决的问题。分析了哈萨克语的构形语素特征,基于词典的一级标注基础上,采用统计方法,训练得到二元语法的HMM模型参数,运用Viterbi算法完成了基于统计方法的词性标注,最后运用哈语规则库对词性标注进行了修正。对单纯使用统计方法和以统计为主辅以规则修正的方法进行了比对测试,结果表明后者排岐正确率有所提高。  相似文献   

10.
孙伟 《微计算机信息》2006,22(18):172-174
本文详尽地介绍了通过采用对电力调度命令票的科学分类的方法,有效解决县级调度命令票自动或辅助生成的计算机软件开发问题。  相似文献   

11.
随着我国信息技术的不断发展,如何采用电子数据进行调度图形可视化审票的研究与应用,成为了当前电网发展中需要面对的热点问题。本文探讨了传统的配网调度审核检修申请方式,从而针对环网图标注技术的调度图形可视化审票方法进行了研究,为今后的环网图标注技术在调度图形可视化审票工作中的应用提供理论基础。  相似文献   

12.
王俊  胡燕 《微机发展》2007,17(5):89-91
针对现有调度操作票自动生成系统大多为离线的单一智能体系统,在智能化、安全性校核、流程化审核执行等方面需要提高的现状,提出建立操作规则模板及用户可维护机制解决操作规则描述、学习及推理的通用化问题,开发和实现了与SCADA系统共享实时数据,与管理信息系统集成的集自动开票、手工开票、模拟预演、流程化审核、执行与管理等多种实用功能于一体以及用户可维护的新型智能化电网调度操作票系统。  相似文献   

13.
电力操作票在线自动生成系统的设计与实现   总被引:1,自引:0,他引:1  
针对现有调度操作票自动生成系统大多为离线的单一智能体系统,在智能化、安全性校核、流程化审核执行等方面需要提高的现状,提出建立操作规则模板及用户可维护机制解决操作规则描述、学习及推理的通用化问题,开发和实现了与SCADA系统共享实时数据,与管理信息系统集成的集自动开票、手工开票、模拟预演、流程化审核、执行与管理等多种实用功能于一体以及用户可维护的新型智能化电网调度操作票系统。  相似文献   

14.
为支持基于句式结构的大规模树库建设与研究,该文设计了人机结合的可视化语法图解标注系统,通过句式结构的框架约束和词汇知识库的底层支持有效规范了标注结果的结构层次和词性标记,在一定程度上保证了树库标注的一致性和高效率。该文从实践角度介绍了基于句式结构的语法图解标注系统在辅助构建大规模汉语树库中的操作模式和功能。  相似文献   

15.
由于传统车间调度方法实时响应能力有限,难以在复杂调度环境中取得良好效果,提出一种基于深度Q网络的深度强化学习算法。该方法结合了深度神经网络的学习能力与强化学习的决策能力,将车间调度问题视作序列决策问题,用深度神经网络拟合价值函数,将调度状态表示为矩阵形式进行输入,使用多个调度规则作为动作空间,并设置基于机器利用率的奖励函数,不断与环境交互,获得每个决策点的最佳调度规则。通过与智能优化算法、调度规则在标准问题集上的测试对比证明了算法有效性。  相似文献   

16.
针对隐马尔可夫模型无法融合分类结果权值的问题,文中提出加权观测隐马尔可夫模型(WOHMM),并给出模型中概率计算、参数学习、序列标注三个基本问题的解决算法.使用公开数据集对参数学习和序列标注问题进行仿真实验,结果表明,WOHMM的参数学习算法能得到更接近真实值的模型参数,序列标注算法的效果较优.  相似文献   

17.
词性标注中生词处理算法研究   总被引:6,自引:0,他引:6  
词性兼类是自然语言理解必须解决的一类非常重要的歧义现象,尤其是对生词的词性歧义处理有很大的难度。文章基于隐马尔科夫模型(HMM),通过将生词的词性标注问题转化为求词汇发射概率,在词性标注中提出了一种生词处理的新方法。该方法除了用到一个标注好的单语语料库外,没使用任何其他资源(比如语法词典、语法规则等),封闭测试正确率达97%左右,开放测试正确率也达95%左右,基本上达到了实用的程度。同时还给出了与其他同样基于HMM的词性标注方法的测试比较结果,结果表明本文方法的标注正确率有较大的提高。  相似文献   

18.
针对当前恶意代码检测方法严重依赖人工提取特征和无法提取恶意代码深层特征的问题,提出一种基于双向长短时记忆(Bidirectional Long Short Term Memory,Bi-LSTM)模型和自注意力的恶意代码检测方法。采用Bi-LSTM自动学习恶意代码样本字节流序列,输出各时间步的隐状态;利用自注意力机制计算各时间步隐状态的线性加权和作为序列的深层特征;通过全连接神经网络层和Softmax层输出深层特征的预测概率。实验结果表明该方法切实可行,相较于次优结果,准确率提高了12.32%,误报率降低了66.42%。  相似文献   

19.
文章探讨了如何让在手语新闻播报中的卡通人按照自然手语的语法规则而非正常人的语法规则来打手语。首先整理了现代汉语自然手语的规则并将其形式化,并建立了正常汉语到汉语自然手语转换的形式规则库;从而实现了现代汉语文本到相应的自然手语的手语动作序列的自动生成。最后将其嵌入到通过手语合成技术和卡通动画的手语新闻播报系统中,使其在线输出的是符合聋人习惯的自然手语。  相似文献   

20.
定义抽取是从非结构化文本中自动识别定义句的任务,定义抽取问题可建模为句子中术语及相应定义的序列标注问题,并利用标注结果完成抽取任务。针对传统的定义抽取方法在抽取定义特征过程中费时且容易造成错误传播的不足,提出一个基于双向长短时记忆(BiLSTM)的序列标注神经网络模型,对输入文本进行自动化定义抽取。通过将原始数据输入到BiLSTM神经网络中,完成输入句的特征表示,并采用基于LSTM的解码器进行解码得到标注结果。在Wikipedia英文数据集上的实验结果表明,该方法的精确率、召回率和F1值分别为94.21%、90.10%和92.11%,有效提升了基准模型效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号