首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
文章介绍了一种规则与统计相结合的混合语言模型来实现盲文到汉语的机器翻译,该技术把基于统计的Markov模型与规则量化模型相结合,用Viterbi算法寻找最佳汉语句子,取得了良好的翻译效果。  相似文献   

2.
针对机构命名实体识别效率低的问题,提出一种基于隐马尔科夫模型(HMM)的京剧机构命名实体识别算法.利用HMM模型标注文本切分结果的词性消除歧义,通过Viterbi算法计算某种分词结果所对应的可能性最大的词性序列.根据定制的名称识别规则,借助机构前缀词库、后缀词库获得机构名称左右边界,通过自动机算法识别语料中的机构命名实体,并将新词加载到分词词典中.针对京剧领域语料进行开放测试验证,结果表明,该算法的识别正确率可达到99%.  相似文献   

3.
格式在HNC理论中是指广义作用句各主语块位置的不同排列组合方式。由于主语块的排列方式在汉英两种语言中表达的差异,汉语句子翻译到英语时常常发生格式转换。格式转换是HNC机器翻译理论的一个重要内容,是机器翻译理论实践的基础和前提。以HNC机器翻译理论为指导,以真实文本的专利文献汉英句对为分析对象,研究专利机器翻译中汉英两种语言之间广义作用句的格式转换规律,制定了排除规则、识别规则和转换规则,对部分规则进行了人工评测,结果表明准确率能达到85%左右。  相似文献   

4.
基于隐马尔科夫模型的基因识别系统设计与实现   总被引:2,自引:0,他引:2  
随着基因组研究的发展,利用机器学习方法进行基因识别被广泛使用,这些方法包括神经网络算法、基于规则的方法、决策树、概率推理等。文章描述了一种基于隐马尔科夫模型的基因识别系统,介绍了EM训练算法和Viterbi序列分析算法,该系统运用Burset&Guigo的公共数据集进行测试,核苷识别的Sn和Sp两个参数分别可以达到68%和88%,外显子识别的Sn和Sp参数达到60%和63%。  相似文献   

5.
缪建明  张全 《计算机科学》2006,33(5):173-177
为了适应语言中惯常出现的SVO表达语序,HNC理论对原有语句格式代码表(98版)进行了大幅度的调整,重点是重新界定基本格式的范围,扩充基本格式代码,使所有SVO语序的表达都可以用基本格式表示。同时,为了便于计算机处理和人类专家使用,新格式代码对代码中的每一数字都做了更加细致的约定,可以直接从代码得到具体的格式信息,而不用查阅格式代码表。本文详细说明了新版格式代码的设计思路及其带来的新变化,指出了新版格式代码与98版格式代码表的不同。  相似文献   

6.
程序自动修复技术是保证软件质量、提高开发效率的有效手段. 目前, 大多数自动修复工具使用测试用例作为补丁正确性验证的最终方法, 有限的测试用例难以对程序进行充分的测试, 因此自动修复工具生成的补丁集合包含大量的不正确补丁. 为了识别不正确补丁, 我们采用对比缺陷修复前后成功测试的执行路径以及生成测试用例的方法来识别修复补丁的有效性, 以解决自动修复工具精度低的问题. 我们的方法评估了来自6个经典的自动修复工具生成的132个补丁, 并成功地排除了80个不正确的补丁并且没有排除正确的补丁, 这表明我们的方法可以有效地排除不正确补丁, 并且提高自动修复工具的精度.  相似文献   

7.
8.
中关村 《网络与信息》2009,23(10):65-65
已经安装了Windows 7的用户,在使用系统自带的媒体中心时,一定会发现,媒体中心的媒体库里根本不识别Real格式的视频文件.Real格式作为目前最流行的视频文件格式之一,相信大家平时所看的电影不少都是Real格式的.  相似文献   

9.
微博观点句识别的话题影响研究   总被引:2,自引:0,他引:2  
为了从海量的网络信息中迅速准确地获取评价信息,观点句识别已经成了自然语言处理的一个研究热点。现在观点句识别系统大都是基于机器学习的方法,一般使用机器学习的方法来进行分类会受到领域差异性影响。针对这个问题,该文对微博观点句识别系统是否会受到微博话题影响做了经验性研究,同时为了弥补训练数据的不足,该文通过规则方法自动标注网络数据进行了训练集的扩充。实验结果表明,微博话题间存在差异,进行分话题模型训练可以提升微博观点句识别系统的性能。  相似文献   

10.
本文介绍了隐与尔科夫模型、面像识别技术,提出了基于HMM的面像识别方法,评估了基于HMM的面像识别软件,并指出了HMM在面像识别中的实用性。  相似文献   

11.
使用垂直数据格式挖掘频繁项集   总被引:4,自引:0,他引:4  
陈伟 《微型机与应用》2011,30(18):6-7,13
关联规则是数据挖掘的主要技术之一,它是描述数据库中一组数据项之间的某种潜在关系的规则。关联规则挖掘算法——Apriori算法,主要过程是对频繁项集的挖掘,而在对频繁项集的挖掘中首先要生成候选频繁项集,然后再从候选集中确定出满足最小支持度计数的频繁项集,这会耗费大量的CPU开销。使用垂直数据格式挖掘频繁项集可避免候选项目集的求解。  相似文献   

12.
结合HMM较强的处理时间序列的能力以及ANN的学习能力强、识别速度快等特点提出了一种ANN/HMM混合模型,该模型具有较强的处理时问序列的能力。本文主要介绍了该模型的结构以及模型的训练算法。在此基础上将其应用于语音识别的建模,并通过相应实验验证了该模型的可行性。  相似文献   

13.
李爽 《计算机时代》2014,(11):37-39
针对数码相机用户面对多种图像格式如RAW、JPEG、TIFF等,以及不同扩展名如.dng、.nef、.xmp等图像文件产生的困惑,探讨了这些文件的性质、特点以及它们之间的区别和联系,并探讨了在实际应用中RAW图像格式向其他图像格式的转换等问题。  相似文献   

14.
对未知网络协议进行协议格式推断在网络安全领域具有重要意义。现有的协议格式推断方法存在时间复杂度高、精确度较低等问题。提出了一种基于扩展前缀树协议格式推断方法。该方法首先通过N-gram分词获取候选协议关键词,使用互信息进行合并得到不同长度的协议关键词。在此基础上,依据与报文相对应的关键词序列构建扩展前缀树,实现对报文样本的初步聚类。而后,在扩展前缀树的基础上采用分段的多序列比对方法获取精确的协议格式。实验结果表明,该协议格式推断方法对于文本协议和二进制协议都能够取得理想的推断效果。  相似文献   

15.
将图核概念引入到多水平方法粗化阶段,针对图的压缩存储格式提出了核排序重边匹配(CSHEM)算法。该算法借助图核的全局信息,改进了以往仅仅利用结点的度等局部信息进行匹配的粗化算法,在对原始图粗化过程中发挥结点核值导向性作用,克服以往只能选择随机匹配(RM)算法作为导向匹配算法的缺陷;提出了基于CSHEM和重边匹配(HEM)算法的组合粗化策略,在发挥结点核值的导向性作用的同时,又不至于被过分强调而使粗化图违背结点核值大小均匀分布的原则。基于ISPD98电路测试基准的实验和分析表明,相比无向图剖分软件MeTiS采用的RM和HEM算法的组合粗化策略,提出的策略取得了一定性能的改进。  相似文献   

16.
文章介绍了一种通用的报文与结构之间相互转换的实现方法。  相似文献   

17.
一种改进的步态识别方法   总被引:2,自引:2,他引:0       下载免费PDF全文
步态识别通过人体走路的姿势来识别人的身份。近年来,步态作为一种生物特征识别技术备受计算机视觉研究者的关注。对某个人的一个步态序列利用动态Viterbi算法得到一个样本姿态序列,对其多个步态样本姿态序列的对应姿态取平均得到这个人的特征姿态序列,对特征姿态采用主成分分析法和线性判别分析法处理特征空间,并用最近邻法进行识别。利用CASIA数据库对本文方法进行验证,取得了较高的识别率,并对体形变化具有较强的鲁棒性。  相似文献   

18.
基于角色标注的中国人名自动识别研究   总被引:38,自引:0,他引:38  
该文提出了一种基于角色标注的中国人名自动识别方法。其基本思想是:根据在人名识别中的作用,采取Viterbi算法对切词结果进行角色标注,在角色序列的基础上,进行模式最大匹配,最终实现中国人名的识别。识别过程中只需要将某个词作为特定角色的概率以及角色之间的转移概率。该方法的实用性还在于:这些角色信息完全可以从真实语料库中自动抽取得到。通过对16M字节真实语料库的封闭与开放测试,该方法取得了接近98%的召回率。文中介绍了计算所汉语词法分析系统ICTCLAS,集成人名识别算法之后,词法分析的准确率提高了1.41%,同时人名识别的综合指标F-1值达到了95.40%。不同实验从各个角度表明:基于角色标注的人名识别算法行之有效。  相似文献   

19.
Based on the analysis of the morphogenesis process of real biological organisms, the basic principles are formulated for the simulation of genomic control of the morphogenesis of a virtual agent in a physically correct environment. A model of the genome of a compound agent’s body composed of different functional subsystems is developed. A timing algorithm for genetically conditioned processes of regeneration and division of agent’s microcells is developed. The problem of forming agents with a morphology that is locally optimal for a given environment is formulated as a multi-generation optimization problem in a genetic algorithm. The fitness function is defined as the life duration of agents. Constraints are connected with the physical correctness of an environment and an energy deficit in the environment. Agent genomes are considered as chromosomes in the genetic algorithm. __________ Translated from Kibernetika i Sistemnyi Analiz, No. 2, pp. 42–54, March–April 2008.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号