共查询到17条相似文献,搜索用时 93 毫秒
1.
提出了一种基于语义网络结构的词义消歧方法。将文本片段中出现词的所有词义都看作节点,将两个词的任意两个词义之间的语义关系看作弧,将语义关系的紧密程度看作弧的权重,从而构成一个无向赋权网络;将Google的网页分级(PageRank)算法应用到无向赋权图中,评价网络中节点的重要性,并结合共指词义和词义的常用程度,对文本中出现的名词进行消歧。实验证明了该方法对文本进行词义消歧是有效的。 相似文献
2.
提出了一种基于语义网络结构的词义消歧方法。将文本片段中出现词的所有词义都看作节点,将两个词的任意两个词义之间的语义关系看作弧,将语义关系的紧密程度看作弧的权重,从而构成一个无向赋权网络;将Google的网页分级(PageRank)算法应用到无向赋权图中,评价网络中节点的重要性,并结合共指词义和词义的常用程度,对文本中出现的名词进行消歧。实验证明了该方法对文本进行词义消歧是有效的。 相似文献
3.
许红花 《长春理工大学学报(自然科学版)》2009,(11):96-97
本文通过分析《MHK大纲》中兼类词的分类,认为从少数民族汉语教学角度出发,不应把虚词纳入兼类词范围,不应把意义上有联系的词义义项与词素义义项当作兼类,也不应把意义有联系的词与词缀处理成兼类词。 相似文献
4.
5.
针对当前FrameNet框架下的词义消歧准确率较低的问题,采用卷积神经网络应用于FrameNet框架进行框架消歧研究.该模型依托依存句法分析树排序选出待消歧词的6个邻接单词节点,并选择单词词义、父节点词义、单词词性、单词依存分析类型作为消歧特征,使用Softmax函数作为全连接层分类器,通过输出待消歧词可激活的各框架概率选出概率值最高的作为激活框架,从而判定待消歧词词义.实验结果表明,该模型在FrameNet框架的消歧准确率较高于条件随机场等其他普遍算法,各目标词的准确率较为稳定,通过该模型切实提升了FrameNet框架消歧的准确率. 相似文献
6.
《信息工程大学学报》2016,17(5)
职业是人物实体的代表性特征,能够有效地区分人物实体。传统人名消歧算法仅把职业当作一个普通的特征,忽视了它的重要性。针对以上问题,提出了基于职业特征的人名消歧算法。首先通过互联网手动构建基础职业词典;其次以维基百科的所有中文页面为训练语料,通过词激活力模型扩展基础职业词典得到职业特征词典;然后从文本中提取职业特征,并抽取人名和作品名作为其补充特征,弥补文本中职业特征缺失和同一人物具有多个职业的问题;最后采用凝聚层次聚类实现人名消歧。在CLP2010的人名消歧训练语料上进行实验,结果表明文章算法能够有效地实现人名消歧。 相似文献
7.
词义消歧一直是信息检索领域的关键问题和难点之一。统计学方法以其良好的词义消歧效果逐渐占据主流地位。文章结合义类词典HowNet,分别采用隐马尔可夫模型,贝叶斯模型,基于依存关系改进贝叶斯模型对大规模真实文本进行了词义消歧研究,其中基于依存关系改进贝叶斯模型的词义消歧效果最好。 相似文献
8.
框架排歧目的在于根据句子中目标词的上下文环境,从现有的框架库中为该目标词自动标注一个合适的框架.将框架排歧任务看作分类问题,首次将词的低维分布表征信息作为模型特征引入到汉语框架排歧研究中,来探讨仅从词特征出发,不同的特征表示对框架排歧模型的影响.实验选取了88个词元中2 077条例句为数据集,并将目标词周围的词分布表征信息加入到最大熵算法中进行建模.实验结果表明,使用词分布表征信息的框架排歧模型可以达到58.11%的精度,该结果与传统的仅使用词特征时(47.47%)的结果相比有大幅度提高.这说明词分布表征对汉语框架排歧任务是有重要作用的. 相似文献
9.
张丽萍 《杭州电子科技大学学报》2008,(3)
运用语料库研究方法,以英语中两个常用词TOTAL和PLEASE为例,分析了中国学生在写作中使用多词性词时的一些特征。分析表明,中国学生在使用该类词时具有一些特点,最显著的就是对其中某(几)项词性往往过多使用,而对其他词性使用过少或者完全不使用。针对上述情况,本文尝试性地分析了这些现象背后的原因并进一步提出了该研究对英语教学的几点启示。 相似文献
10.
词性标注规则的获取和优化 总被引:6,自引:0,他引:6
本文提出一种词性标注规则自动学习算法。通过对规则进行评价、优化,有效提高标注正确率和标注效率。系统对PFR标注语料库进行标注,相对于NA假设的词性兼类消歧模型标注结果,封闭测试正确率提高了5.53%,开放测试提高了4.57%。 相似文献
11.
研究人脑在不同运动状态下的脑电信息,不仅能够揭示出各种运动状态对于大脑活动的影响,也是工程技术人员设计脑-机接口与神经修复系统的关键技术之一。文章根据脑电信号的μ节律变化,首次将表征时间序列摆动特性的高阶过零分析(Higher Order Crossing,HOC)方法运用于运动状态下的脑电信号的特征提取并结合支持向量机(Support Vector Machine,SVM)对输入的高阶过零特征量进行了有效的分类。将该方法提取的特征量与基于统计学的特征量分别用SVM进行分类,结果表明本方的识别率明显高于基于统计学特征量的方法。说明基于HOC-SVM方法在脑电信号的特征提取与分类中有较强的可行性和实用性。 相似文献
12.
通过对投影非负矩阵分解(PNMF)增加近邻保留假设,提出了一种新的高光谱图像线性特征提取方法———近邻保留投影非负矩阵分解(NPPNMF)。NPPNMF保留了高光谱数据在低维特征空间中的局部几何结构,克服了PNMF基于Euclidean的缺点。根据在构造k近邻图时是否使用训练样本的类标签信息决定了NPPNMF既可以是无监督的特征提取方法,也可以是有监督的特征提取方法,从而提高了PNMF算法的鉴别力。理论证明和高光谱图像数据的分类结果表明了该方法的有效性及应用潜力。 相似文献
13.
2002-2003年中国经济学界有六大研究热点:劳动价值论,现行农村土地制度,居民收入差距,民营经济,弱势群体和国有资产管理.学术研究呈现出以下特点:研究范围扩展和细化;研究学科进一步融合;各种理论与观点竞相涌现;学术研究体现出高尚的人文精神;学术研究成果具有较强的实用价值;以往的研究缺点在短期内仍然无法克服. 相似文献
14.
15.
韩美 《中国科学E辑(英文版)》2001,(Z1)
The palaeochannels in the studied region are divided into four stages by such methods as 14C dating. Marine (saltwater) transgression in the palaeochannels has been studied as a focal point. Palaeochannels are the main passageway through which the seawater (saltwater) transgresses. The seawater (saltwater) transgresses at a high speed, by many means and in a changeable dynamic state. 相似文献
16.
在重新定义CO2介稳分压概念的基础上,研究了各种情况下芒硝氨盐水溶液碳酸化过程的CO2介稳分压,得出了搅拌速度、温度、反应物浓度、碳化度等对CO2介稳分压的影响规律和CO2介稳分压数据,为芒硝氨盐水溶液碳酸化过程的工程设计、发展和理论研究提供了基础。 相似文献
17.
研究了对羟基苯甲酸 - Br O3 -- Fe( phen) 3 2 + - H2 SO4 体系在间歇釜中的振荡现象。考察了反应物浓度、反应温度及 Cl-、Br-、Ag+、H2 O2 、丙烯腈、乙醇等添加物对振荡反应的影响。该振荡反应的诱导期与反应温度之间的关系符合 Arrhenius方程。实验测得其表观活化能为 75.0 8k J·mol-1。 相似文献