首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 133 毫秒
1.
采用统计方法来识别中文姓名。该方法将中文姓名的识别过程分为姓名候选和姓名确认两个阶段。采用隐马尔可夫模型(HMM)分类器从未经切分的汉字串中候选姓名。利用人名与上下文词汇的互信息对候选人名进行最后的确认。该方法是完全数据驱动的,不需要姓名识别模板和规则。试验结果表明,该方法的召回率为82.7%,准确率为89.6%。  相似文献   

2.
针对多任务学习的特征提取和任务区分难题,提出基于混合共享机制的多任务深度学习方法。给出硬参数共享网络混合训练方法和依据灵敏性分析的任务相似度分组策略;对组内、组间任务分别应用硬、软参数共享,给出混合共享网络及其相应训练方法;通过MNIST数据集上的实例研究与分析验证该方法的有效性。该方法充分发挥了硬、软参数共享机制的优点,较好刻画了任务的共享与私有特征,提升了多任务学习的性能。  相似文献   

3.
一种基于字词结合的汉字识别上下文处理新方法   总被引:6,自引:0,他引:6  
根据字、词信息之间的互补性,提出一种字、词结合的上下文处理方法.在单字识别的基础上,首先利用前向一后向搜索算法在较大的候选集上进行基于字bigram模型的上下文处理,在提高文本识别率的同时可提高候选集的效率;然后在较小的候选集上进行基于词bigram模型的上下文处理.该方法在兼顾处理速度的同时,可有效地提高文本识别率.脱机手写体汉字文本(约6.6万字)识别中的实验表明:经字bigram模型处理,文本识别率由处理前的81.58%提高至94.50%,文本前10选累计正确率由94.33%提高到98.25%;再经词bigram模型处理,文本识别率进一步提高至95.75%。  相似文献   

4.
利用贝叶斯网络融合空间上下文的高分辨遥感图像分类   总被引:1,自引:0,他引:1  
针对高分辨遥感图像,本文提出了一种基于贝叶斯网络的上下文模型,以及基于该模型的面向对象的遥感图像分类方法.首先,利用支持向量机(SVM)实现分割区域的初始分类,获得各个类别的候选区域.然后,利用提出的上下文模型融合候选区域及其周围区域的上下文信息,通过贝叶斯网络推理,将候选区域分类到各类地物类型中.基于贝叶斯网络的上下...  相似文献   

5.
区分性模型组合中基于决策树的声学上下文建模方法   总被引:1,自引:1,他引:0  
上下文相关的区分性模型组合的局限在于引入大的模型权重参数集, 在数据有限时容易导致区分性权重训练过拟合. 针对该问题,本文提出利用决策树进行上下文建模, 采用最小音子错误准则构建决策树以获得最优上下文相关权重参数集. 决策树构造过程中通过评估目标函数的一阶近似增量来加速最优问题集的选择, 并利用精细问题集来获得更好的声学区分能力. 基于多模型组合的语音识别实验表明,该方法能够增强权重训练对过拟合的鲁棒性, 在大幅减小参数数量的情况下降低误识率,并优于在特征空间进行组合的方法.  相似文献   

6.
为有效标注室内场景的布局关系,提出一种由粗至精的空间布局估计方法.首先,采用局部不连续自适应阈值检测场景的长直线段,根据直线段的方向将其分为竖直和水平直线段;基于投票机制和正交准则估计垂直与水平消失点,由这两个消失点等角度间隔地引出成对射线生成场景候选布局.其次,采用VGG-16全卷积神经网络估计相应场景的几何上下文和信息化边界,采用softmax分类器决策其fc7层特征以获取布局类别,融合信息化边界和布局类别生成全局特征以粗选取场景候选布局.接着,基于VGG空间多尺度卷积神经网络估计相应场景的法向图和深度图以提取法向特征和深度特征.然后,利用消失点射线夹角参数化3D盒式布局模型,利用几何积分图聚集候选布局中的直线段成员、几何上下文、法向量和深度等区域级特征,采用割平面法学习结构化模型参数.最后,对候选布局的结构化预测得分进行排序,将得分最高者选取为最终空间布局.Hedau和LSUN数据集实验表明,该方法能获得空间布局的精准区域面划分个数和精确边界位置.  相似文献   

7.
在马尔科夫逻辑网(MLN)的实体解析算法中任意闭原子采用硬约束,导致推理及权重学习过程较难收敛到最优解,降低解析精度及执行效率。为此,提出一种将概率软逻辑(PSL)模型应用到实体解析中的方法,该模型中闭原子采用软约束,易于进行知识推理与权重学习。阐述PSL模型基本理论,通过实体关系、实体属性、本体约束构造PSL模型的逻辑规则,描述实体解析的匹配过程,根据PSL模型的推理机制实现实体解析的决策过程。实验结果表明,与基于MLN的实体解析算法相比,该方法可大幅提高实体解析的准确率、F1值及执行效率。  相似文献   

8.
Web服务组合上下文模型   总被引:1,自引:0,他引:1  
基于上下文感知计算,提出一种新颖的Web服务组合上下文模型.一方面,服务组合中的信息被定义为服务和用户上下文,前者又被区分为概要、会话和填充上下文;另一方面,采用多策略机制管理上下文.为此,定义了一种基于ECA规则的语言-服务扩展策略描述语言(PDL-S).采用以上语言描述上下文管理策略和组合服务.该模型不但充分利用了上下文感知计算,而且具有良好的协作性、扩展性和灵活性.  相似文献   

9.
车飞虎    张大伟  邵朋朋    杨国花  刘通  陶建华     《智能系统学报》2023,18(1):138-143
脚本事件预测需要考虑两类信息来源:事件间的关联与事件内的交互。针对于事件间的关联,采用门控图神经网络对其进行建模。而对于事件内的交互,采用四元数对事件进行表征,接着通过四元数的哈密顿乘积来捕捉事件4个组成部分之间的交互。提出结合四元数和门控图神经网络来学习事件表示,它既考虑了外部事件图的交互作用,又考虑了事件内部的依赖关系。得到事件表示后,利用注意机制学习上下文事件表示和每个候选上下文表示的相对权值。然后通过权重计算上下文事件表示的和,再计算其与候选事件表示的欧氏距离。最后选择距离最小的候选事件作为正确的候选事件。在纽约时报语库上进行了实验,结果表明,通过多项选择叙事完形填空评价,本文的模型优于现有的基线模型  相似文献   

10.
针对冷凝器的周期性结垢过程以及工况参数的动态变化,提出了一种冷凝器污垢预测的新方法。该方法将 污垢分解为软垢和硬垢两部分,并采用两个T2S 模糊模型分别描述软垢和硬垢的变化趋势,进而通过二者的结合获 得较为精确的污垢预测。根据此方法,进行了现场试验, 试验结果表明:与渐近污垢模型及改进的渐近污垢模型相 比,该方法能够有效地处理冷凝器的周期性结垢现象,并在冷凝器工况参数变化时仍然取得较满意的预测精度。 该方法的成功应用为冷凝器最优清洗机制的建立奠定了基础。  相似文献   

11.
周昌乐  游维  丁晓君 《软件学报》2010,21(3):427-437
主要针对宋词这种特殊的汉语诗歌体裁,开展了有关自动生成算法及其实现方法的探索性研究.研究工作主要根据宋词特点,设计了基于平仄的编码方式、基于句法和语义加权值的适应度函数、基于精英主义和轮盘赌算法的选择策略,采用部分映射和启发式交叉算子和启发式变异算子,从而构建了一种基于遗传算法的宋词生成计算模型并进行了系统实现.实验结果表明,所建立的计算模型及其软件系统,初步实现了机器自动生成宋词的目标,对于给定的主题词和词牌,基本上能够自动生成有一定欣赏价值的宋词.论文的工作也填补了我国在汉语诗歌自动生成研究方面的不足  相似文献   

12.
词表的质量直接影响汉语语言模型的性能, 而当前汉语词典编撰工作同语言建模工作相脱离, 一方面使得现有的汉语语言模型受词表规模所限, 性能不能发挥到最优, 另一方面因为缺乏专业领域的词表, 难以建立面向特定领域的语言模型. 本文旨在通过建立优化词表的方式来提高现有汉语语言模型的性能, 并使其自动适应训练语料的领域. 本文首先将词表自动生成工作同汉语语言建模工作相结合, 构建一体化迭代算法框架, 在自动生成优化词表的同时能够获得高性能的汉语语言模型. 在该框架下, 本文提出汉字构词强度的概念来描述汉语的词法信息, 并将其作为词法特征与统计特征相结合, 构造一种基于多特征的汉语词表自动生成算法. 最后, 本文提出两种启发式方法, 自动根据训练语料的特点调整系统中的各项参数, 使系统能够自动适应训练语料的领域. 实验表明, 本文的方法能够在生成高质量词表的同时获得高性能的语言模型, 并且能够有效自动适应训练语料的领域.  相似文献   

13.
文章详细叙述了语义分析在汉语生成中的应用,重点构造了语义结构文法,并以此为基础提出了基于XML的汉语生成方法,该方法以XML树传递内部信息,使用XSL构造汉语句子生成格和实现XML树之间的转换。开发了一个基于XML的汉语生成模型。此模型具有一定的通用性,依托不同领域的知识库仅要对其作少量修改便能在该领域工作。  相似文献   

14.
《信息处理用GB13000.1字符集汉字部件规范》对于规范汉字形码输入法具有非常重要的意义。然而,在实际运用上却存在着部件数量太大,部件定义难以操作,部件拆分组合不易掌握等难处。造成困难的原因主要有: (1) 基础部件主要靠列表来确定, (2) 部件强调按理切分和成字组合, (3) 过多依赖“组字能力”的判别, (4) 过分注重部件数量的限制。要走出“难”的困境,应该在现有规范的基础上根据汉字的形态特征制定出简便可靠的部件识别规则和切分规则。实验证明,这种方法是行之有效的。  相似文献   

15.
陈静  穆志纯  方新  杜大鹏 《计算机工程》2007,33(11):170-172
汉字识别是汉语、汉字认知研究的一个重要研究领域。该文提出了一个基于多层自组织神经网络的模型,从汉字字形聚类及汉字部件拆分的角度,对基于汉字认知的汉字识别过程进行了初步的探索。模拟研究结果表明,模型通过学习能够识别出汉字的结构类型和部件,发现汉字识别中的规律,在一定程度上模拟了汉字的识别。  相似文献   

16.
字符串近似匹配在网络安全中有广泛的应用。本文从中文字符串相似度角度出发,提出了通过单个汉字的细分来提高字符相似度的想法,并从汉字"成簇性"方面进行分析,引出了汉字的Key表示方法,将汉字与Key的映射关系归结为规则,讨论了规则的获取方法。设计了基于规则的中文字符串近似匹配的框架,提出了新的相似度计算模型,并通过实验对整个流程加以验证,证明基于规则的中文字符串近似匹配的优越性。  相似文献   

17.
中文组织机构名称与简称的识别   总被引:2,自引:0,他引:2  
本文提出了一种基于规则识别中文组织机构全称和简称的方法。全称的识别首先借助机构后缀词库获得其右边界,然后通过规则匹配并借助贝叶斯概率模型加以决策获得其左边界。简称的识别是在全称的基础上应用其对应的简称规则实现的。在开放性测试中,该方法的总体查全率为85.19%,查准率为83.03%,F Measure为84.10%;简称的查全率为67.18%,查准率为74.14%。目前该方法已应用于中文关系的抽取系统。  相似文献   

18.
一种多知识源汉语语言模型的研究与实现   总被引:7,自引:0,他引:7  
针对汉语语言模型中知识获取不足的问题,提出了一种统计与多种形式规则信息结合的机制,将规则的表示量化,提出语法语义规则的概念,通过扩充词网络,对其于最大可能性的n元概率值合理调整,将短语构成规则,二元语法语义规则,最少分词原则等融入统计模型框架,构成多知识源语言模型,模型应用于智能拼音汉字转换系统,明显提高了音字转换正确率,并适于处理长距离和递归语言现象。  相似文献   

19.
根据中国古代建筑具有完整的营造规则约束的特点,提出了一种语义规则驱动的快速建模方法.根据中国古代建筑的建造规范,从中提取出若干造型规则,并且参数化表示主要的建筑结构特征,利用它们来控制模型的生成.定义了模型的构造模块——组件,通过迭代解释造型规则来控制组件的变换和组合,从而构造出一系列的中国古代建筑模型.通过扩充纹理库,可以得到不同效果的建筑模型.  相似文献   

20.
对汉字的认知研究不仅是认知科学,也是计算机科学特别是人工智能领域中的一个研究热点。但是,目前汉字认知的计算机模拟研究还相对滞后。该文采用自组织特征映射网络(Self-organizing Feature Map, SOFM)和自适应谐振理论(Adaptive Resonance Theory, ART)相结合的方法,构建汉字认知过程的发展模型,对汉字字形认知的发展过程(学习发展历程)进行了计算机模拟,以便研究汉字字形学习过程中的某些认知发展规律。模型通过训练,显示出了汉字认知发展过程中的某些规律。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号