共查询到20条相似文献,搜索用时 250 毫秒
1.
现有的命名实体识别算法多半采用统计与规则相结合的办法,但是这些方法有的没有考虑全局信息,有的没有解决好统计模型的时间复杂性问题.提出一个简约语法规则和最大熵模型相结合的混合命名实体识别方法,该方法采用简约语法规则与最大熵模型级联,首先使用简约语法规则模型进行识别,降低了使用复杂语法规则的时间复杂度,并把它的输出进行部分匹配,很好的弥补了由于简约语法规则带来的召回率偏低的问题,然后将得到的中间结果作为输入传递给最大熵模型,再由最大熵模型进行识别,得到最终的识别结果.实验结果表明,在MUC-7的命名实体识别评测中,系统的准确率、召回率和F值分别达到了94%,91%和92.48%,与已有的系统相比在性能上有很大的提升. 相似文献
2.
语言模型中一种改进的最大熵方法及其应用 总被引:13,自引:0,他引:13
最大熵方法是建立统计语言模型的一种有效的方法,具有较强的知识表达能力.但是,在用现有的最大熵方法建立统计模型时存在计算量大的问题.针对这一问题,提出了一种改进的最大熵方法.该方法使用互信息的概念,通过Z-测试进行特征选择.将该方法应用于汉语的义项排歧中,实验表明,该算法具有较高的计算效率和正确率. 相似文献
3.
中文姓名识别是中文信息处理的一项重要技术,识别的召回率对其它需要以姓名识别为基础的中文信息处理技术有至关重要的影响。提出了一种统计模型和处理规则相结合的中文姓名识别方法:首先以最大熵模型识别潜在姓氏,而后再通过判定规则作进一步处理。真实语料的开放测试表明,该方法在召回率方面有明显的优势,可以达到94%以上的召回率,同时能保证较高的准确率。 相似文献
4.
5.
6.
本文针对人名的特点,建立了特征模板,并在此基础上提取了特征集,利用特征选择算法提取了有效特征,并建立了一个基于最大熵的人名识别模型。基于最大熵模型,探索性地构建了一个人名识别的系统,取得了较好的效果。该系统将潜在人名发现和使用最大熵模型进行标注两个阶段的工作有机地结合到一起。较好地解决了人名竞争问题;并对重点模块的算法进行了详细描述。 相似文献
7.
8.
9.
句子边界识别是词性标注和句法分析等自然语言处理系统的基础问题。提出了一种统计与规则相结合的维吾尔语句子边界识别方法,首先利用歧义段落分类算法分类段落,第二步对无歧义段落进行基于规则的句子边界识别,最后使用最大熵模型对有歧义段落进行句子边界识别。该方法有效利用规则弥补最大熵模型因数据稀疏而误判不存在任何歧义情况的不足,使用最大熵模型有效地消除歧义,提高算法的鲁棒性,召回率达到了98.77%。 相似文献
10.
11.
使用最大熵模型进行中文文本分类 总被引:51,自引:1,他引:51
随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.由于最大熵模型可以综合观察到各种相关或不相关的概率知识,对许多问题的处理都可以达到较好的结果.但是,将最大熵模型应用在文本分类中的研究却非常少,而使用最大熵模型进行中文文本分类的研究尚未见到.使用最大熵模型进行了中文文本分类.通过实验比较和分析了不同的中文文本特征生成方法、不同的特征数目,以及在使用平滑技术的情况下,基于最大熵模型的分类器的分类性能.并且将其和Baves,KNN,SVM三种典型的文本分类器进行了比较,结果显示它的分类性能胜于Bayes方法,与KNN和SVM方法相当,表明这是一种非常有前途的文本分类方法. 相似文献
12.
在小世界网络中,节点或边的改变使网络结构发生了演变,这意味着网络的熵也发生变化,因此可用网络的熵描述网络形成过程。经模拟实验发现:网络熵的变化是U型的;重连概率p决定熵的单调程度,而网络节点度k影响熵由降到增转变的时间。实验结果有助于以后更有效地对网络进行控制以及设计更加有效的网络形成模型。 相似文献
13.
14.
基于最大熵的汉语人名地名识别方法研究 总被引:7,自引:0,他引:7
构建了一个基于最大熵原理的汉语人名地名自动识别混合模型.该模型分为训练和识别两个模块.先从训练语料中抽取特征,利用最大熵方法对特征进行训练.然后使用经过训练的特征,并结合动态词表和少量规则,对测试文本中的汉语人名地名进行识别.达到了比较满意的识别效果.最后对实验结果进行了分析. 相似文献
15.
16.
从目标和背景的类间差异性出发,提出了一种基于最大类间交叉熵准则的阈值化分割新算法,算法阈设目标的背景象素的条件分布服从正态分布,利用贝叶期公式估计象素属于目标和背景两类区域的后验概率,再搜索这两为区域后验概率之间的最大交叉熵。比较了新算法一基于最小交叉熵以及基于传统香农熵的阈值化算法的分割性能。 相似文献
17.
18.
基于期望值-混合熵的区间概率模糊随机多准则决策方法 总被引:1,自引:1,他引:0
定义了区间概率模糊随机变量及其期望值和混合熵.针对准则权重确知并且准则值为区间概率模糊随机变量的多准则决策问题,提出一种基于期望值-混合熵的决策方法.该方法首先给出了区间概率模糊随机变量的期望值-混合熵度量;然后基于此度量建立优化模型,通过计算得到各方案的期望值-混合熵区间;再采用可能度的方法得到方案集的排序.最后通过实例说明了该方法的有效性和可行性. 相似文献
19.
在最大熵分布估计算法中,根据Jaynes原理来建立分布估计算法中的概率密度。基于SVM的概率密度估计则是根据概率密度的定义,由核函数构造一个包含未知参数的概率密度函数。它根据样本点建立这个概率密度的数学规划模型,并用不敏感损失函数的支持向量机方法来求解这个模型。对得到的概率密度进行仿真测试,最后将得到的密度应用到分布估计算法中。 相似文献
20.
The negation of probability distribution becomes an important topic since some problems are burdensome to deal with directly. Inspired by Yager's negation of probability distribution, an extension model to measure the negation of a probability distribution is proposed using the idea of a nonextensive statistic based on Tsallis entropy. Proofs show that the proposed extension of negation of probability distribution converges to the maximum Tsallis entropy. The proposed model may extend Yager's method to consider the influences of the correlations in a system, which gives the different convergent routes. Some numerical simulation results are used to illustrate the effectiveness of the proposed methodology. 相似文献