首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
目前,自然语言处理已经从句法、语法层面走向轻语义层面。对于汉语陈述句的处理,传统的方法是采用Lambek演算来进行处理。但是传统的Lambek演算无法处理汉语中的灵活语序问题,而现有的方法,如加入模态词、新连接词等,又因为其进一步使得本已是NP-hard的Lambek演算时间复杂度变大,并不适合当前的计算机处理。基于此,该文提出了λ-Lambek演算,即采用Lambek演算来对汉语陈述句进行句法演算,并通过Curry-Howard对应理论与λ-演算来对汉语陈述句进行轻语义模型的构建。λ-Lambek演算不仅能够对汉语陈述句进行轻语义演算,而且还能对汉语陈述句灵活语序进行处理。  相似文献   

2.
时态逻辑不可递归公理化的性质,造成它的公理化系统和证明论方法不适于时态查询语言的建模.这使得时态逻辑无法利用公理化系统的良好性质及相关证明论方法对时态数据库的推理和查询做更为严谨和细致地刻画.因此寻找时态逻辑的替代者,以公理化的方式对时态查询语言做句法和语义的分析是必要的.考虑的2个主要工具是作为句法分析工具的以Lambek演算为核心的范畴语法系统,和作为语义分析工具的类型演算λ-演算.这主要是基于类型论的演算特点、SQL语句与陈述句的相似性、Lambek演算和λ-演算的公理化与证明论方法,及它们作为句法和语义分析工具之间的密切联系与对应性决定的.据此从Lambek演算出发,结合时态的处理,构建了并发的Lambek演算(LCTQ)及相应的范畴语法,对以公理化系统为基础的时态查询语言的句法分析做相关研究,并从证明论性质上保障了计算性资源,使得系统更为严谨和完善.  相似文献   

3.
序演算可以保留很多语言学的信息,可以更自然的刻画日常交流中的推理,因此序演算成为很多自然逻辑推理系统的核心方法.在Zamansky等学者工作的基础上,以序演算为核心,结合Lambek演算,增加了性质类序关系,考虑了模糊量词的语义特征,构造了基于序演算的自然逻辑推理系统OCRS.该系统所描述的推理范围较之以前的自然逻辑系统进一步扩大.另外,也给出了OCRS系统中序演算的判定算法,证明了其判定算法的对应定理.  相似文献   

4.
针对Web页中存在不少不真实信息的问题,提出了一个两步的方法来鉴别一个中文陈述句是否是事实。第一步根据陈述句中的不确定单元对陈述句进行分类扩展,找到一些和待验证陈述句主题匹配的候选陈述句。第二步把候选陈述句代入现有搜索引擎,确定出最有可能的候选。这两步过程都需要从主流的搜索引擎的搜索结果中抽取各种特性。实验结果表明,准确率可以达到85%以上。经过改进,该技术可以用来评测网页的可信度。  相似文献   

5.
词是语言中最小的能够独立活动的有意义的语言成分,是信息处理的基本单位。词频统计、语音识别、字符识别、自动分类、机器翻译、信息检索、信息抽取等方面的研究, 也必须首先分词。在这些应用和研究领域,没有准确高效的分词策略,汉语的进一步分析必将受到严重影响。本文研究用Delphi设计中文分词。  相似文献   

6.
串匹配问题是计算机科学研究中比较广泛的问题之一,目前字符串匹配算法主要是针对英文等字符的匹配居多,而针对中文等字符的匹配比较少,本文将针对中文字符匹配的算法进行浅析,提出一种适合中文字符模式近似匹配算法的设计,通过实验证明了该算法的有效性。  相似文献   

7.
基于规则演算的不良信息文本过滤模型   总被引:2,自引:0,他引:2  
本文在定义元符号及演算规则的基础上,基于字符串匹配,给出了一个不良信息文本过滤模型。由于规则是通过元符号或其它规则演算生成,因而本模型具有较强的过滤能力。  相似文献   

8.
给出了一个基于情境演算的多Agent系统(MAS)建模的框架,可以帮助更好地理解和分析MAS的静态结构和动态行为,尤其是意向驱动将MAS中相互独立的元素包括实体、活动等关联起来形成MAS系统,能够随着环境的变化驱动MAS进化.  相似文献   

9.
访问控制模型定义了安全系统访问控制的整体框架。现有的访问控制模型大多是静态授权模型,尽管可以通过扩展来实现局部动态性(比如可以通过定义条件来实现角色的临时激活等),但在应用时受到了扩展元素的限制,并且已有的大部分模型无法描述授权的动态变化过程。针对以上问题,提出了一种基于情景演算的动态访问控制模型(SCDAC)。SCDAC用逻辑事实和规则来描述访问控制属性和策略,把授权在某一时刻的状态(逻辑事实和规则集合)看作一个情景,通过动作来实现情景的变化,同时刻画了动作执行的前提条件和后续状态的变化情况。最后通过一个实例说明了用SCDAC来描述授权状态的动态变化是可行的。  相似文献   

10.
杨鹏玉  邱锦伦 《计算机工程》2009,35(23):274-277
针对业务流程建模标记(BPMN)无法依靠自身对编排进行形式化分析的问题,提出用Pi演算描述BPMN编排模式,实现对BPMN编排的描述。BPMN编排模式是服务交互模式的BPMN表达。实验结果表明,该方法能够找到并排除BPMN编排中的死锁。  相似文献   

11.
一种基于条件Pi演算的组合服务柔性演化模型   总被引:1,自引:0,他引:1  
组合服务应当具有适应所处环境和商业规则不断变化的能力。现有的服务组合语言和执行机制缺乏应对动态变化所需的可变性和适应性。尽管已有很多扩展,但是组合服务的动态适应正确性还缺乏保障。提出了一种基于条件Pi演算的组合服务柔性演化机制。通过增加归属操作符和条件控制符对经典Pi演算进行扩展,使之与事件-条件-动作模式更好地结合起来,从而提出了一种描述组合服务流程的方法。从分析组合服务各种变化的场景出发,提出了11种基本的变化场景及其不同的柔性演化模式,对每种模式进行了形式化描述和分析。该方法能够保证组合服务的可变性和适应正确性。  相似文献   

12.
手机POI搜索已经成为手机搜索的主要应用之一。该文结合手机搜索的特点以及POI数据的结构性特征采用简拼进行POI搜索。由于词序相似度是影响简拼搜索排序结果的主要因素,该文提出了基于向量距离计算词序相似度的算法。该算法采用空间向量模型作为简拼的表示方法,将提取的公共简拼映射为位置向量,进而利用位置向量间的距离计算词序相似度。通过理论分析,该算法相比基于逆序数的词序相似度算法,将时间复杂度由O(nlogn)降为O(n),空间复杂度由O(n)降为O(1)。实验结果表明,基于向量距离的词序相似度算法有效地保证了准确性,可以满足手机POI简拼搜索的应用需求,并在性能上将词序相似度的计算效率提高16.88%。  相似文献   

13.
基于汉语二字应成词的歧义字段切分方法   总被引:5,自引:0,他引:5  
文章提出了利用汉语中的二字应成词,计算汉语句内相邻字之间的互信息1及t-信息差这两个统计信息量的新方法,进而应用这两个统计量,解决汉语自动分词中的歧义字段的自动切分问题。实验结果表明,采用该文所述的方法,对歧义字段的切分正确率将达到90%,与其他分词方法相比较,进一步提高了系统的分词精度,尤其与文献1所述方法比较,对于有大量汉语信息的语料,将降低系统的时间复杂度。  相似文献   

14.
基于词频统计的中文分词的研究   总被引:21,自引:1,他引:20  
论文介绍了一个基于词频统计的中文分词系统的设计和实现。通过这个系统,可以将输入的连续汉字串进行分词处理,输出分割后的汉语词串,一般是二字词串,并得到一个词典。词典中不重复地存储了每次处理中得到的词语,以及这些词语出现的频率。这个系统选用了三种统计原理分别进行统计:互信息,N元统计模型和t-测试。文中还对这三种原理的处理结果进行了比较,以分析各种统计原理的统计特点,以及各自所适合的应用场合。  相似文献   

15.
一种基于语境的中文分词方法研究   总被引:4,自引:0,他引:4  
汉语不同于英语,词之间没有间隔标记.而汉语分词是文本分析的第一步,且存在歧义切分,因此分词问题成为汉语分析的首要难题,通过中文切分过程的本质分析,推导并提出基于马尔可夫链的语境中文切分理论.进而提出一种语境中文分词方法.该方法建立在词法和句法基础上,从语境角度分析歧义字段,提高分词准确率.  相似文献   

16.
该文研究和探讨一种新的分词方法 基于词边界分类的方法。该方法直接对字符与字符之间的边界进行分类,判断其是否为两个词之间的边界,从而达到分词的目的。相对于目前主流的基于字标注的分词方法,该方法的实现和训练更加快速、简单和直接,但却能获得比较接近的分词效果。更显著的是我们可以很容易地从词边界分类方法获得在线分词学习方法,该方法能够使我们的分词系统非常迅速地学习新的标注样本。  相似文献   

17.
分词是中文自然语言处理中的一个关键基础技术。通过基于字的统计机器学习方法学习判断词边界是当前中文分词的主流做法。然而,传统机器学习方法严重依赖人工设计的特征,而验证特征的有效性需要不断的尝试和修改,是一项费时费力的工作。随着基于神经网络的表示学习方法的兴起,使得自动学习特征成为可能。该文探索了一种基于表示学习的中文分词方法。首先从大规模语料中无监督地学习中文字的语义向量,然后将字的语义向量应用于基于神经网络的有监督中文分词。实验表明,表示学习算法是一种有效的中文分词方法,但是我们仍然发现,由于语料规模等的限制,表示学习方法尚不能完全取代传统基于人工设计特征的有监督机器学习方法。  相似文献   

18.
基于Hash结构的机械统计分词系统研究   总被引:3,自引:1,他引:3  
在综合比较了常用的机械分词方法和统计分词方法基础上,论文设计并实现了一种基于Hash结构的机械统计分词系统。系统突破了传统的机械分词方法和统计分词方法,结合了两者的优势,并对其做了一系列的改进。从对测试结果的分析可以看出,系统的分词速度达到了每秒一万两千个汉字以上,且具有较强的未登陆词识别能力。  相似文献   

19.
分词识别和歧义消除是影响信息检索系统准确度的重要因素,该文提出了一种基于语法和语义的使用约束矩阵的中文分词算法。该算法建立在语法和句法的基础上,从语境角度分析歧义字段,提高分词准确率。系统可以将输入的连续汉字串进行分词处理,输出分割后的汉语词串,并得到一个词典。再用《现代汉语语法信息词典》进行处理,实验结果显示分词准确率能提高10%左右。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号