首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
为了解决中文组块分析精度不高和未利用词的语义信息的问题,提出了一种基于条件随机域模型和语义类的中文组块分析方法.该方法通过研究中文组块分析任务及其序列化特性,采用条件随机域模型融合不同类型特征,克服标记偏置问题,将语义词典中抽取的语义类特征应用到中文组块分析中,提高分析精度.实验表明,该方法取得了F值为92.77%的中...  相似文献   

2.
A fast method for phrase structure grammar analysis is proposed based on conditional random fields (CRF). The method trains several CRF classifiers for recognizing the phrase nodes at different levels, and uses the bottom-up to connect the recognized phrase nodes to construct the syntactic tree. On the basis of Beijing forest studio Chinese tagged corpus, two experiments are designed to select the training parameters and verify the validity of the method. The result shows that the method costs 78.98.ms and 4.63.ms to train and test a Chinese sentence of 17.9 words. The method is a new way to parse the phrase structure grammar for Chinese, and has good generalization ability and fast speed.  相似文献   

3.
探讨汉英句级对齐软件设计中两项主要技术,即哈希算法与词典语义映射在对齐中的运用。哈希算法能帮助软件从词典大量的英汉词条语义信息中快速提取所需的对应义,结合语义映射,将需要对齐的句子关键词信息进行语义识别,从而有效提高汉英句子对齐效果。  相似文献   

4.
语义场分析矩阵   总被引:2,自引:0,他引:2  
语言是音义结合的符号系统,一种语言词汇中的词在语义上是相互关联的,在考察时应当作一个完整的系统来加以探讨.在语言学科研究中,语义场(semantic field)是一系列的词汇相互定义、相互比较而形成的.如:表示某种颜色的词只有在色谱中与其他词汇相互比较、相互定义,才能得到准确的语义.语义场理论的矩阵分析助于人们更好地理解英语词汇的意义.本文就语义场的性质、结构、特征以及在英汉两种语言中运用空间进行尝试性的探讨.  相似文献   

5.
级联中文组块识别   总被引:1,自引:0,他引:1  
基于统计方法的中文组块研究大多借鉴CoNLL2000英文组块的思想,建立了组块表示的BIO模型,并将组块识别任务作为一种为词序列标注的多分类问题.为降低分类复杂度,采取了一种分解识别法,即先识别组块的边界,再进行组块类别判定.基于条件随机场(CRF)构建了级联组块识别器,实验数据集采用宾州大学中文树库(CTB5.1).在特征选择上,借鉴了中文分词特征选择的方法.5倍交叉验证的实验结果为:组块边界识别的F1值为95.05%;类型识别的准确率为99.43%;整体F1值为93.58%.该方法提高了系统性能,缩短了学习器的训练时间.  相似文献   

6.
基于实体词语义相似度的中文实体关系抽取   总被引:1,自引:1,他引:0  
为了探索语义相似度在中文实体关系抽取上的作用,提出由实体词在《同义词词林》中的5层编码构建成的《同义词词林》编码树和由关系实例中的实体词,各个类别中所有实体词计算相似度后求得的平均值构建成的实体词语义相似度树2种新特征,并连同已有的《同义词词林》编码、实体类型信息共4种特征探究其对抽取性能的影响。单一特征的试验中,实体类型特征效果最好,F值达到了小类84.9、大类83.2;组合特征的试验中,实体类型和《同义词词林》编码树的组合特征效果最好,大类小类的F值都比实体类型特征提高了2.5,3种组合特征性能不升反降。试验结果表明《同义词词林》编码树是对实体类型的有效补充,但过多的特征会造成信息冗余,使抽取性能下降。  相似文献   

7.
近年来基于字的词位标注方法极大地提高了汉语分词的性能,该方法将汉语分词转化为字的词位标注问题,借助于优秀的序列标注模型,基于字的词位标注汉语分词方法逐渐成为汉语分词的主要技术路线。该方法中特征模板选择至关重要,采用四词位标注集,使用条件随机场模型进一步研究基于字的词位标注汉语分词技术,在第三届和第四届国际汉语分词评测Bakeoff语料上进行封闭测试,并对比了不同特征模板集对分词性能的影响。实验表明采用的特征模板集:TMPT-10′较传统的特征模板集分词性能更好。  相似文献   

8.
为提高中文语音合成的自然度,对文本的韵律结构体系进行研究,并提出一种基于条件随机场(CRF)的韵律结构预测方法. 从一个大规模人工标注的语料库中,选取由机器生成的分词标注特征和分级的韵律边界信息,利用CRF算法进行机器学习产生韵律词和韵律短语的CRF模型,并用于韵律结构的预测中. 实验结果表明,韵律词和韵律短语的F-score分别达到90.67%和80.05%,相比于基于最大熵(ME)模型的韵律结构预测方法分别提高了3.62%和5.65%,同时准确率和召回率也有较大提高.  相似文献   

9.
汉语分词作为中文信息处理的首要环节,其精确度对后续步骤的准确度和处理速度成逐级放大性影响.如何提高分词的准确度和处理速度成为近年研究的重点.采用条件随机场模型进行汉语分词,通过定量分析CRF工具包训练参数f,研究减少特征对分词准确度以及模型大小的影响程度,实验分别在国际汉语分词评测Bakeoff2005提供的北京大学和微软亚洲研究院两个语料上进行封闭测试,并对比采用不同模板时增加f参数值对分词性能的影响,最终得出实验结果:随着f参数值的增加,分词的准确度和生成的模型大小成正比,且F值减小的程度相对训练生成模型大小的减小程度要小得多.  相似文献   

10.
Based on the powerful function of the hidden conditional random fields (HCRF) model in the expression and identification of semantic events and combining the webcast text information, a new framework for wonderful events automatic detection is put forward. Firstly, by analyzing and processing the webcast text, keyword combinations corresponding to each exciting event are obtained. Secondly, by classifying the webcast text to be detected, the happening time labels of each wonderful event are obtained. Thirdly, an HCRF model for semantic shot annotation is built to realize the semantic annotation of multiple types of semantic shots simultaneously, and the semantic shot sequence of the video clip is obtained. Finally, combining the multi-modal semantic clues, an HCRF model for the wonderful events detection and localization is effectively built in the case of small-scale training samples. Based on the mapping relationship among video low-level features, the multi-modal semantic clues and the wonderful semantic events, the inherent patterns of the wonderful events are excavated deeply in the multiple dimensions of the semantic structure, and then the wonderful events automatic detection, localization and segmentation are precisely achieved. Experiments show the effectiveness of this model.  相似文献   

11.
中文文本时间信息获取及语义计算   总被引:2,自引:0,他引:2  
为了解决中文文本中时间信息的形式表达、抽取及时间语义计算等一系列问题,提出了一种可以适用于多种自然语言处理任务的时间信息处理系统,通过对汉语句子时间要素的分析以及时间词语构成形式的研究,采用一种时间表达式的概念,将承载时间信息的短语按照功能的不同分解成若干容易识别,语义单一的“小”的成分,并在此基础上给出基于规则的时间信息抽取、理解及时间语义的计算方法.  相似文献   

12.
上市公司治理结构、企业绩效与总经理更换   总被引:1,自引:0,他引:1  
为了研究导致我国上市公司总经理更换的影响因素,对总经理更换、公司治理结构以及企业绩效之间的关系进行了实证分析.基于我国上市公司1995~2003年的面板数据,首次利用随机效应Probit模型,按照总经理更换的不同类型进行了实证分析.研究发现,总经理被迫更换概率与企业绩效显著相关,但常规更换则不受此影响.另外,公司治理结构、企业绩效与总经理被迫更换概率有交互效应.企业的法人股东有积极性对经理人员实施监督和约束,在企业绩效下滑时更换总经理,但总经理兼任董事长的情况下,这种影响大为减弱.  相似文献   

13.
为了使出版机构能够及时从大量网页中发现所需文献,需要设计能够从超文本标记语言页面中自动提取文献信息的算法.为此,设计了基于条件随机场的文献记录分析算法:首先,设计了文档对象树的分割算法,通过分割标记将页面数据分成独立的部分,这些数据块由标签和文本序列构成;随后,将该序列作为条件随机场模型的特征向量,建立文献信息标记模型;最后,设计启发式算法,从标记模型中提取文献信息数据,并通过实验验证了其有效性.  相似文献   

14.
汉语修辞研究渐入低谷,定位语言学的修辞研究逐渐被边缘化。深入开展语义修辞的研究,构建汉语语义修辞学新分支,积极确立其核心修辞学的地位,是继承与发展隶属语言学的现代汉语修辞学的可行路径。在研究中,于理论层面要着意构拟其特色的修辞范畴系统,于实践操作层面要创建起同其相匹配的修辞研究范式。  相似文献   

15.
提出一种基于Markov随机场图像分割方法。在K-Means图像分割的基础上,建立标记场和特征场,构造Markov随机场模型,再利用条件迭代模型(ICM)算法逐点更新图像标记,实现图像的最大后验概率(MAP)估计,从而实现图像的有效分割。实验结果表明,该方法比直接采用Markov方法有着更好的分割效果。  相似文献   

16.
目前基于How Net的词语语义相似度计算多是根据上下位关系计算语义距离的方法,其结果与人的主观认识存在差异。提出了一种词语语义相似度计算的改进方法,在原有方法基础上,同时考虑影响词语相似度的多种因素,如How Net中义原的深度和密度等,进而挖掘义原间关系,改进原有计算方法。实验结果表明,利用所提出的改进方法计算的词语语义相似度更加贴合人的主观认识。  相似文献   

17.
针对分割神经网络需要大量的高质量标签但较难获取的问题,提出基于3D scSE-UNet的半监督学习分割方法. 该方法使用自训练的半监督学习框架,将包含改进的并行空间/特征通道压缩和激励模块(scSE-block+)的3D scSE-UNet作为分割网络. scSE-block+可以从图像空间和特征通道2个方面自动学习图像的有效特征,抑制无用冗余特征,更好地保留图像边缘信息. 在自训练过程中加入全连接条件随机场,对分割网络产生的伪标签进行边缘细化,提升伪标签的精确度. 在LiTS17 Challenge和SLIVER07数据集上验证所提出方法的有效性. 当有标签图像占训练集总图像的30%时,所提方法的Dice相似系数(dice score)为0.941. 结果表明,所提出的半监督学习分割方法可以在仅使用少量标注数据的情况下,取得与全监督分割方法相当的分割效果,有效减轻肝脏CT图像分割对专家标注数据的依赖.  相似文献   

18.
针对统一建模语言序列图,提出了一种利用Z语言对其进行语义分析的方法.该方法在序列图Z规范的基础上,用属性集表示对象状态,并将序列图的上下文表示为Z形式约束,通过捡查上下文约束与对象状态间的一致性对序列图进行语义分析.通过一个应用实例说明了该方法的有效性.  相似文献   

19.
目前关系数据库关键词查询技术主要利用关键词的语法匹配,而没有利用数据之间的语义关系进行匹配,导致查询效果往往都不太令人满意。为了改善查询效果,结合本体概念,提出了基于本体的关系数据库关键词查询的语义查询扩展方法,把用户提交的查询关键词扩展为基于本体的语义关键词。实例分析表明,扩展后的语义关键词尽可能符合用户的真实意愿。  相似文献   

20.
用16×16点阵字库对一、二级汉字字符集的汉字的笔划总长度、汉字X向和Y向的一次矩和点阵卷积X向和Y向的一次矩等统计特性进行了研究,获得了一些有意义的结果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号