首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
为解决由于长复句以及搭配关系所导致的复句层次自动识别准确率下降问题,论文分析了复句中的标点使用规律,提出了基于SVM的分句界定方法;并基于复句关系词搭配规则,建立了复句的上下文无关文法形式化模型;依据该模型,提出一种改进的移进-归约算法;以期提高复句层次关系识别的准确率。  相似文献   

2.
杨进才  胡巧玲  胡泉 《计算机科学》2021,48(z2):124-129
汉语复句的语义表达复杂,复句关系分类问题作为汉语篇章研究与应用的重要内容,一直是自然语言处理领域关注的热点.文中总结与挖掘出复句类别自动识别的十几类字面、句法特征,将特征形式化为规则,用关系词触发规则的机制,对有标复句进行十二类关系类别的识别.实验结果表明该方法取得了较高的准确率,优于现有的方法.  相似文献   

3.
汉语多重关系复句的关系层次分析   总被引:8,自引:0,他引:8  
鲁松  白硕  李素建  刘群 《软件学报》2001,12(7):987-995
汉语多重关系复句的句法分析问题主要由复句中的关系分析和层次分析两部分组成.将多重关系复句中的层次分析作为研究对象.它是针对多种逻辑或并列关系,按照一定层次组成复杂主从关系复句而进行的关系层次分析过程.为了有效地形式化地表示多重关系复句的层次结构,提出了关系层次树的概念,并以此为基础构造文法,采用部分数据驱动的确定性移进-归约算法实现多重关系复句的关系层次分析.通过开放测试对计算机实现的多重关系复句句法分析器进行考察,93.56%的正确率使所提出的分析方法的有效性和正确性得到了充分的验证.  相似文献   

4.
本文引入一种挖掘关联规则的方法,通过挖掘明式或暗示的代表数据仓库特征的语义层次来进行基于语义层次的关联规则挖掘.该方法能有效的从数据仓库中抽取潜在的有用的知识.  相似文献   

5.
语义相关度计算作为中文信息处理领域中的一项关键技术,在信息检索、语义消岐、文本分类中起着重要的作用。利用汉语复句的句法理论和关系标记搭配理论,以汉语复句语料库以及搜索引擎获取的复句为语料,提出了一种基于汉语复句的语义相关度计算方法——SRCCS。本方法不仅能够计算词语的相关度,而且能够表明相关的性质与类别。与通过短文计算相关度的方法相比,本方法选取的计算对象范围更小,因而结果更准确,计算复杂度更低。在同一测试集上与搜索引擎方法的对比分析证明了基于汉语复句的语义相关度计算方法的有效性与优越性。  相似文献   

6.
基于VML的复句关系层次树的可视化研究*   总被引:1,自引:0,他引:1  
在现代汉语复句教学和研究中,为了分析复句的逻辑语义关系,经常需要绘制复句关系层次结构图。传统的做法是利用手工方式绘制,以图片的形式存储,但这种方式具有存储容量大、绘制工作量大的缺点。采用VML技术,在标注复句的基础上,研究了复句关系层次树的自动生成方法以及复句关系层次树在网页中的可视化。通过对不同类型复句进行试验,结果表明各种类型的复句均能准确显示。这就表明该可视化方法能够有效地应用到复句信息工程的研究中。  相似文献   

7.
基于规则的复句中的关系词标注探讨   总被引:2,自引:0,他引:2  
汉语中关系词的自动标注问题是自然语言理解领域的基础性研究课题。由于它的研究结果直接影响到以后的层次关系的标注、机器翻译等诸多领域的研究,加上这一问题本身具有的难度,使其很难从根本上解决。因此,也一直收到人们的普遍关注。关系词的自动标注就是通过采用适当的方法对关系词进行标注。  相似文献   

8.
关系词在现代汉语复句领域起着重要的作用,是汉语语法、语义研究中的重要内容,复句关系词的计算机自动识别是一个非常困难的研究课题。在汉语复句关系词自动识别中规则的约束条件研究的基础上,重点研究现代汉语复句关系词自动识别系统中规则的表示方法,为进一步研究、建设复句关系词自动识别中的规则库,深入研究规则与统计相结合自动识别复句和复句关系词的方法,为实现汉语句子和篇章的自动识别奠定基础。  相似文献   

9.
基于层次关联规则的日志本体事件领域关系学习*   总被引:3,自引:1,他引:2  
孙明  陈波  周明天 《计算机应用研究》2009,26(10):3683-3686
为发现Web 使用记录中潜在的用户访问行为,提出了一种基于层次关联规则的日志本体事件领域关系学习方法。该方法利用日志本体中复合事件与原子事件之间的整分关系确定事务粒度,将关联规则挖掘算法扩展到事件层次结构上以发现候选频繁用户使用规则,在此基础上修剪冗余和无效的规则后抽取出事件间潜在的领域关系,达到丰富日志本体的目的。最后进行仿真实验,实验结果表明了该方法的可行性和有效性。  相似文献   

10.
为提高语义图像分类器性能,提出一种基于公理化模糊集的语义图像层次关联规则分类器。首先,为提高算法精度,在对图像数据集进行特征提取基础上,采用公理化理论(AFS)构建图像集模糊概念的AFS属性表达,提高图像集属性辨识度;其次,为提高算法计算效率,考虑采用层次结构关联规则,构建语义图像分类器,利用概念之间的本体信息,提高并行分类能力;最后,通过对算法参数及横向对比实验,显示所提算法具有较高的计算精度和计算效率。  相似文献   

11.
基于层次语义的图像分类方法   总被引:1,自引:0,他引:1  
孔英会  苏亮 《计算机应用》2011,31(11):3045-3047
为了更好地实现基于语义的图像检索,结合了颜色、纹理和形状的综合特征来表示图像,将它们作为支持向量机(SVM)的输入向量,对图像类进行学习,建立图像底层特征和高层语义的关联。采用综合特征表示图像,提高了分类正确率。同时按照分语义层次的方式组织图像库,实现图像的语义分层表示,用各层次的关键词来联合表示图像的语义信息。结果表明,可以在具有较好分类正确率的情况下,使图像具有更全面的语义表示。  相似文献   

12.
目前多数基于内容的图像检索研究是在如何理解图像的内容,挖掘图像内容的特征,并组织这些特征用于图像检索上。检索得到的结果往往丢弃不顾,不能用于未来相似语义图像的检索。提出了一种新颖的基于语义保存的图像检索方案:将检索得到的多个相似图像组成相似图像网络,并运用复杂性网络的子网络分割方法,划分出语义子网络,找出语义概念并保存;检索未来相似内容的图像只需匹配保存的图像语义概念。实验表明,检索后得到的图像网络具有小世界网络的特征;保存的图像语义能准确地匹配相似语义内容图像,并能极大地加快检索相似语义图像。  相似文献   

13.
为避免广义混合模糊系统因输入变量个数的增加而引起规则爆炸现象,应用二叉树型分层方法给出混合推理规则,进而对广义混合模糊系统的输入实施二叉树型分层,从理论上获得了该系统分层后的输入输出表达式和推理规则总数的计算公式.此外,通过实例对该系统分层和不分层的规则总数进行了比较和分析,结果表明分层后广义混合模糊系统可大幅度缩减推理规则总数,并可有效地避免规则爆炸.  相似文献   

14.
传统的句子压缩方法多基于难以获得的“原句-压缩句”对齐语料库,因此提出了不依赖于对齐语料库的中文句子压缩算法。通过研究人工压缩结果并结合语言学知识,提出了词语层面和分句层面的两组压缩规则。算法在原句句法分析树和词语间依赖关系的基础上,使用两组规则进行压缩,同时为了保证压缩算法具有更强的适应性和准确性,引入词语的热度加强了压缩算法,最后通过句子整理和语法修复得到最终的压缩句。对比了人工压缩、只使用规则压缩和引入词语热度压缩三种压缩方法。实验结果表明,基于热度的启发式中文句子压缩算法可以在压缩比、语法性、信息量都损失较少的情况下,提高压缩句的热度。  相似文献   

15.
We present declarative and procedural semantics for a deductive object-oriented language, Gulog. The declarative semantics is based on preferred minimal models. We describe both bottom-up and top-down query evaluation procedures and show that they are sound with respect to the declarative semantics. The results contribute to our understanding of the interaction of inheritance, overriding and deduction in the presence of both functional and set-valued methods, and multiple inheritance.  相似文献   

16.
张璞  刘畅  李逍 《计算机应用》2019,39(3):639-643
建议挖掘作为一项新兴研究任务,具有重要的应用价值。针对传统建议语句分类方法所存在的规则复杂、标注工作量大、特征维度高、数据稀疏等问题,提出一种基于PU学习的建议语句分类方法。首先,使用简单规则从无标注评论集合中选择建议语句的正例集合;然后,为了降低特征维度,缓解数据稀疏性,在自编码神经网络(Autoencoder)特征空间中使用Spy技术划分可靠反例集合;最后,利用正例集合和可靠反例集合来训练多层感知机(MLP)对剩余的无标注样例进行分类。该方法在中文数据集上的F1值和准确率值分别达到81.98%和82.67%,实验结果表明,该方法能够有效地对建议语句进行分类,且不需要对数据进行人工标注。  相似文献   

17.
通过对藏语存在句的分析和研究,实现藏语存在句的识别。借助产生式的正向推理作为藏语存在句识别的知识表示方式,并用产生式规则搜索和匹配。从人工角度构建的一种基于产生式规则的藏语存在句的识别系统,以利藏语存在句的识别。该研究为实现藏语存在句的识别提供了基础。  相似文献   

18.
基于概念分层的个性化推荐算法   总被引:8,自引:0,他引:8  
熊馨  王卫平  叶跃祥 《计算机应用》2005,25(5):1006-1008,1015
协同过滤算法(couaborative filtering)目前较为成功地应用于个性化推荐系统中,但随着系统规模的扩大,面临很严重的稀疏性问题,制约了推荐效果。文中提出概念分层的方法对用户-项矩阵进行改进,同时使用交易数据和点击流数据,将相似用户选择项与多层次关联规则推荐项相结合,在稀疏数据集上表现出较好的性能。  相似文献   

19.
在文本的情感倾向性研究中缺乏对多种情感共现的转折句式的有效分析,为此提出一种专门对转折句式进行有效情感倾向性分析的方法。充分分析汉语中转折句式的结构特点,通过已有资源构建中文情感词典、转折词表、否定词表,依据转折句式中转折词、否定词、情感词的组合规律提出用于进行情感分析的启发式规则。在公开语料库的实验中,该方法能更好地对转折句式进行情感倾向性分析,将此规则融入到传统的朴素贝叶斯情感分类模型后,能获得更高的情感分析精度。  相似文献   

20.
统计与规则相结合的维吾尔语句子边界识别   总被引:1,自引:0,他引:1       下载免费PDF全文
句子边界识别是词性标注和句法分析等自然语言处理系统的基础问题。提出了一种统计与规则相结合的维吾尔语句子边界识别方法,首先利用歧义段落分类算法分类段落,第二步对无歧义段落进行基于规则的句子边界识别,最后使用最大熵模型对有歧义段落进行句子边界识别。该方法有效利用规则弥补最大熵模型因数据稀疏而误判不存在任何歧义情况的不足,使用最大熵模型有效地消除歧义,提高算法的鲁棒性,召回率达到了98.77%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号