首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
张量方法为高维数据提供了有效的分析方法。提出了一种基于图正则化和Lp平滑约束的非负Tucker分解方法,结合各向同性(L2范数)和各向异性(L1范数)扩散平滑的优点,并产生优化问题的平滑和更精确的解,通过实验验证了该模型的有效性。  相似文献   

2.
本文提出了一种基于统计的中文人名识别方法,此方法使用最大概率分词模型对源句子进行粗切分,将粗切分信息融入到条件随机场模型中进行模型的训练。运用此方法分别对来自同一源语料的测试集和非同源语料的测试集进行了测试,F-值分别达到了91.3%和90.6%,证明了此方法的有效性。  相似文献   

3.
专利信息是集技术、经济、法律信息于一体的重要情报分析数据来源,也是支持技术创新管理的重要决策依据。由于专利使用的术语比论文更为抽象,基于统计的信息标注效果并不理想。本文利用亚洲语言信息检索测评会议提供的英文专利文摘数据,采用条件随机场模型,有针对性地标注技术及其功效信息,为专利技术功效矩阵分析奠定了基础。  相似文献   

4.
条件随机场(CRFs)是一种十分优秀的统计学习模型,文中尝试将其引入到文本分类之中,提出了一种基于CRFs的文本分类模型.首先通过特征选择将待分类文档和文档类别分别表示成为CRFs的观察序列和状态序列,然后使用文本分类相关领域知识定义特征函数来提取序列之间的关联特征,再采用前向或后向算法评估出给定观察序列条件下各状态序列的概率,据此实现待分类文档的分类.分析表明,这种新模型语义清晰,计算直观,易于融合各种文本分类领域知识,分类效率较高.  相似文献   

5.
中文人名的识别至今还是自然语言研究领域一个比较困难的课题.因此提出一种基于条件随机场模型的文中人名识别方法。条件随机场模型是一种无向图模型.有效避免有向图在标记的过程中出现偏执的问题,并且通过二次识别.有效解决人名在上下文环境中的识别问题。通过实验分析,基于条件随机场模型的人名识别能比较准确地识别出中文的人名。  相似文献   

6.
自然语言处理技术已用于非结构化中文电子病历信息抽取,并且新的算法或模型不断出现,但其应用效果的证据较少。共收集北京某大型三甲综合医院呼吸专科住院电子病历38 218份,通过对数据预处理,抽象文本特征与定义语法规则,产生训练数据集和测试集,构建层叠条件随机场模型,并评估该模型的识别效果。结果表明,针对入院记录、出院记录、辅助检查报告3大类共39种非结构化文本,该模型可准确、快速地处理病历文本信息,应用效果较为理想。  相似文献   

7.
针对传统的马尔科夫随机场不能利用观察图像中的上下文信息、条件随机场虽然能够同时利用两种上下文信息,但基于像素的条件随机场模型抗噪能力差、计算量大和效率低的问题,该文结合条件随机场和基于对象的图像分析方法,提出一种新的对象级条件随机场,并用于遥感图像道路的提取。该方法利用各个对象构建的邻接关系,建立基于对象的条件随机场模型;将道路提取问题归结为一个二类分类问题,并采用三类共29维特征进行模型训练和推断。实验结果表明:相比基于像素的条件随机场模型,本文方法提取精度更高,训练和推断的时间明显减少。  相似文献   

8.
为了实现通过自然语言指导机器人导航的目的,提出了一种利用描述路径的自然语言直接绘出机器人运行路径的方法.为了提高机器人对路径自然语言的理解,采用了基于组块的分析方法.首先深入地研究了收集到的路径描述的自然语言语料库,总结出了语义和句法的对应关系.在此基础上,构造了层叠条件随机场,通过采用组块分析方法,先进行名词短语组块的提取,然后提取语义组块.为了解决名词短语的解析问题,引入了名词实体关系推理方法. 并且在提取出的语义组块的基础上逐个建立路径单元,组成完整的路径信息.最后,给出了自然语言处理各个环节的实验结果,并结合具体语句展示了从文字到机器人导航地图的映射过程,对开展人机交互式和谐导航具有重要意义.  相似文献   

9.
张量补全算法及其在人脸识别中的应用   总被引:4,自引:0,他引:4  
数据丢失问题通常可以归结为矩阵补全问题,而矩阵补全是继压缩感知理论之后的又一种重要的信号获取方法。在实际应用中,数据样例往往具有多线性性,即数据集可以表示成高阶张量。本文研究了张量补全问题及其在人脸识别中的应用。基于张量的低维Tucker分解,提出张量补全的迭代算法,并且证明在算法的迭代过程中,估计张量与其Tucker逼近张量的距离是单调递减的。实验结果表明张量补全算法在补全张量和人脸识别上的可行性与有效性。  相似文献   

10.
马萌  唐卓  李仁发  熊燎特 《计算机科学》2015,42(8):138-144, 151
针对大多访问控制模型缺乏对系统安全状态和风险的动态感知能力这一问题,通过将基于条件随机场的机器学习方法引入BLP模型的规则优化中,提出一种动态BLP模型——CRFs-BLP。该模型首先通过对历史访问日志进行预处理与标注,来提取特征值。然后用CRF++工具包对其学习和训练,使模型规则能够根据当前系统的安全状态及安全事件进行动态调整,还可以动态地限制敏感客体的读写范围。最后,通过实验表明了模型在实际环境中的有效性和准确性。  相似文献   

11.
提出了一种基于层叠条件随机场进行救灾机器人自然语言导航命令理解的方法。该方法由三层条件随机场(CRFs)构成:第一层用于导航词性标注,选取词、词性以及上下文作为特征模板生成导航词性标签;第二层用于导航过程提取,选择词、导航词性标签以及上下文构建特征模板生成导航过程标签;第三层用于起点终点识别,选取词、导航词性标签、导航过程标签以及上下文构建特征模板判断出地名词为起点还是终点。根据导航词性与导航要素的对应关系便可从命令中提取出导航信息。该方法能够处理完全不受限的自然语言导航命令,总体正确率达到78.6%,无需依赖特定的指令与地图,对完成救灾机器人导航的人机交互任务具有重要意义。  相似文献   

12.
自然语言处理技术在药物专利检索中的应用研究   总被引:2,自引:2,他引:0  
本文研究了自然语言处理技术在药物专利检索中的应用,开发出一套翻译软件,能够将药物专利中对族性变量的文本描述半自动化地转化为符合规则的GSCCT格式,为准确、高效地建立药物专利检索数据库打下了基础。  相似文献   

13.
自然语言处理(NLP)可以将建设领域非结构化文档转化为结构化信息,方便相关从 业人员对建设项目进行高效的日常管理。近年来,NLP 相关算法得到了广泛的发展,但NLP 技术在建设领域中的研究还处于初级阶段。通过调研近十年关于NLP 在建筑工程的相关文献, 对国内外技术与应用层面的研究进行了梳理。介绍了NLP 的技术发展、常用方法及相关开源工 具实现的功能;并重点从统计分析工具、应用系统和其他3 方面对NLP 在建筑领域各阶段的应 用进行总结。此外,对建设领域NLP 应用存在的问题进行了讨论,总结原因并从技术、建筑业 和政府3 个方面提出了未来展望。  相似文献   

14.
The sign language is composed of two categories of signals: manual signals such as signs and fingerspellings and non-manual ones such as body gestures and facial expressions. This paper proposes a new method for recognizing manual signals and facial expressions as non-manual signals. The proposed method involves the following three steps: First, a hierarchical conditional random field is used to detect candidate segments of manual signals. Second, the BoostMap embedding method is used to verify hand shapes of segmented signs and to recognize fingerspellings. Finally, the support vector machine is used to recognize facial expressions as non-manual signals. This final step is taken when there is some ambiguity in the previous two steps. The experimental results indicate that the proposed method can accurately recognize the sign language at an 84% rate based on utterance data.  相似文献   

15.
A new change-detection method for remote sensing images based on a conditional random field (CRF) model is proposed in this paper. The method artfully uses memberships of Fuzzy C-means as unary potentials in the fully connected CRF (FCCRF) model without training parameters, and pairwise potentials of the CRF model are defined by a linear combination of Gaussian kernels, with which a highly efficient approximate inference algorithm can be used. The proposed FCCRF model is expressed on the complete set of pixels in both the observed multitemporal images, which can incorporate long range contextual information of remote-sensing images and enable greatly refined change-detection results. Experimental results demonstrate that the proposed approach leads to more accurate pixel-level change-detection performance and is more robust against noise than traditional algorithms.  相似文献   

16.
隐马尔可夫模型是序列数据处理和统计学习的一种重要概率模型,最近几年已经被成功应用到许多关于自然语言处理的任务中.简要介绍了隐马尔可夫模型,对其在词性标注应用中的难点、模型的建立,Viterbi算法等问题进行了详细论述,给出了基于隐马尔可夫模型的中文科研论文头部信息抽取过程以及模型结构的学习和参数的训练等关键问题的解决办法.  相似文献   

17.
随着互联网技术的飞速发展,大量的网络案情信息存在于互联网上,这既给办案人员提供了一定的线索,同时又带来了很大的挑战。设计并实现了一种网络案情分析系统,利用自然语言处理技术识别出海量网络案情文件中网名和网址等信息,并构建它们之间的关系网络。针对不同类型的文件,分别采取结构化分析和以“规则和统计”相结合为主、用户辅助知识库为辅的网名识别技术。实验证明,将该方法应用于网络犯罪案情分析系统中,有助于办案人员快速侦破案情。  相似文献   

18.
项炜 《计算机应用》2013,33(5):1446-1449
通用信息模型(CIM) 是工业界的一种公开标准,并已实现于很多产品中,大量的bug被发现和修复。为了减少了人工查找错误根源所需的时间和精力,提出一种基于自然语言处理的方法对CIM 的bug进行自动调试。首先使用最大熵模型对已解决bug的文档描述进行分词,然后基于构建的词典使用simHash找出那些重复性很大的已修复的bug,最后使用文档处理的方法分析客户提供的trace找出问题所在和解决方法。实验结果取得了87.5%准确率, 表明了该方法的有效性。  相似文献   

19.
This article describes the natural language processing techniques used in two computer-assisted language instruction programs: VERBCON and PARSER. VERBCON is a template-type program which teaches students how to use English verb forms in written texts. In the exercises verbs have been put into the infinitive, and students are required to supply appropriate verb forms. PARSER is intended to help students learn English sentence structure. Using a lexicon and production rules, it generates sentences and asks students to identify their grammatical parts. The article contends that only by incorporating natural language processing techniques can these programs offer a substantial number of exercises and at the same time provide students with informative feedback. Alan Bailin is director of the Effective Writing Program at the University of Western Ontario, London, Ontario, Canada. Philip Thomson is a programmer in the Faculty of Medecine, University of Western Ontario.  相似文献   

20.
傅沈文 《计算机应用》2012,32(6):1581-1584
针对目前采用的车辆检测方法的优缺点,提出了一种新的车辆区域检测方法,能够消除阴影干扰。该算法首先运用选择性背景更新法进行背景相减,获取感兴趣区域,然后提出基于图的区域分割算法,对感兴趣区域进行再分割。该方法充分考虑了视频图像全局和局部的空间信息,根据分割区域的大小自动自适应地调节对图像局部细节的忽略程度,从而获取局部区域像素信息较为一致的分割块。最后基于分割过程中所具有的马尔科夫属性,运用条件随机域的方法建立分割后验概率分布,求取最大后验概率确定标号,并对具有相同标号的相邻分割进行合并。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号