共查询到20条相似文献,搜索用时 15 毫秒
1.
文章首次提出一种统计模型,即马氏族模型,该模型假定一个词出现概率既与当前词的词性标记有关,也与它前面的词有关,但其前面的词和该词词性标记关于该词条件独立.将马氏族模型适当加以简化,能成功地用于词性标记,实验结果证明:在相同的测试条件下,这种基于马氏族模型的词性标注方法标记成功率大大高于传统的基于隐马尔可夫模型的词性标注方法.马氏族模型在其它一些自然语言处理领域如分词、句法分析、语音识别、机器翻译也有广泛的应用前景. 相似文献
2.
《电子学报:英文版》2017,(6):1221-1226
Category-based statistic language model is an important method to solve the problem of sparse data in statistical language models. But there are two bottlenecks about this model: 1) The problem of word clustering, it is hard to find a suitable clustering method that has good performance and has not large amount of computation; 2) Class-based method always loses some prediction ability to adapt the text of different domain. In order to solve above problems, a novel definition of word similarity by utilizing mutual information was presented. Based on word similarity, the definition of word set similarity was given and a bottom-up hierarchical clustering algorithm was proposed. Experimental results show that the word clustering algorithm based on word similarity is better than conventional greedy clustering method in speed and performance, the perplexity is reduced from 283 to 207.8. 相似文献
3.
基于相似度的词聚类算法 总被引:1,自引:1,他引:0
基于类的统计语言模型是解决统计模型数据稀疏问题的重要方法.传统的统计方法基于贪婪原则,常以语料的似然函数或困惑度(perplexity)作为评价标准.传统的聚类方法的主要缺点是聚类速度慢,初值对结果影响大,易陷入局部最优.本文提出了词相似度定义、词集合相似度定义,一种自下而上的分层聚类算法.这种方法不但能改善聚类效果,而且可根据不同的模型选择不同的相似度定义,从而提高聚类的使用效果. 相似文献
4.
该文以处理大规模真实文本为目标,把句法分析分解为分词/词性标注、短语识别两个部分。首先提出了一个一体化的分词/词性标注方法,该方法在隐马尔科夫模型(HMM)的基础上引入词汇信息,既保留了HMM简单快速的特点,又有效提高了标注精度;然后应用中心驱动模型进行短语识别,这是一个词汇化的英文句法分析模型,该文将其同分词/词性标注模型结合进行汉语句法分析。在公共的测试集上对句法分析器的性能进行了评价,精确率和召回率分别为77.57%和74.96%,这一结果要明显好于目前唯一可比的工作。 相似文献
5.
6.
文章根据分布式拒绝服务攻击(DDoS)的本质特点,提出了一种基于隐马尔可夫模型(HMM)的DDoS攻击检测方法。该方法通过IP地址信息库.保存当前常用服务的源IP地址,然后对新到数据包的IP地址用HMM建模。通过离线训练,更新IP地址信息库,优化HMM参数。在线检测时,IP地址信息库在线学习更新,HMM实时检测.并根据检测结果通过边界路由器进行积极响应。实验结果显示,该方法具有很好的检测效果,并能及时响应,保持常用服务的延续性。 相似文献
7.
8.
该文提出了基于Web的无指导译文消歧的词模型及N-gram模型方法,并在尽可能相同的条件下进行了比较。两种方法均利用搜索引擎统计不同搜索片段在Web上的Page Count作为主要消歧信息。词模型定义了汉语词汇与英语词汇之间的双语词汇Web相关度,根据汉语上下文词汇与英语译文之间的相关度进行消歧;N-gram模型首先假设不同语义下的多义词N-gram序列行为模式不同,从而可对多义词不同语义类下词汇在实例中的N-gram序列进行统计与分析以进行消歧。两个模型的性能均超过了在国际语义评测SemEval2007的task#5上可比较的最好无指导系统。对这两个模型进行试验对比可发现N-gram模型性能优于词模型,也表明组合两类模型的结果有进一步提升消歧性能的潜力。 相似文献
9.
Web结构优化技术在降低访问延迟、提高访问效率上具有重要作用。由此提出根据用户访问路径建立Web层次模型(WHM),利用页面相似度合并同层相似页面,从而构建Web概念化模型(WCM)。实验及分析表明, WCM模型能够在适度聚类的情况下清晰地展现Web结构。此外,将WCM模型应用于预取系统,该模型所采用的聚类算法在预取效率方面明显优于传统方法,具有可行性和高效性。 相似文献
10.
针对传统基地台识别码(Cell-ID)定位方法精确度不高的问题,提出一种新的Cell-ID定位跟踪算法。该算法利用移动台当前的服务基站信息和相邻基站信息,分别加权计算出似然向量,通过隐马尔可夫模型来获得移动台的运动状态,最后利用最大后验概率准则求出移动台的位置。实验结果表明,该算法复杂度低,在服务基站稳定的区域内定位性能良好,达到通信委员会(FCC)的定位精确度要求。 相似文献
11.
12.
13.
目前主流的词汇化句法分析方法仅仅考虑词语之间的语义依存关系,而没有引入语义搭配和语义类等语义信息.“配价”是词语的一个比较本质的特点,一旦一个词语的配价结构确定下来,它应该和怎样的词进行搭配也就比较清楚了,从而也可以比较直接地导出句子的结构.本文结合中心词驱动句法分析模型,提出了基于配价结构和语义依存关系的句法分析模型.模型在规则的分解及概率计算中引入丰富的语义信息,既包括语义依存信息,也包括配价结构等语义搭配信息.用改进的句法分析模型进行句法分析实验,实验结果表明,精确率和召回率分别为88.76%和87.43%,综合指标F值比Collins的中心词驱动句法分析模型提高了6.65个百分点. 相似文献
14.
15.
在探地雷达测量目的中,层位追踪是正确进行地质解释的基础。该文提出一种基于隐Markov模型和Bresenham算法的层位追踪法,该方法通过对探地雷达回波时延的跟踪,初步实现层位边缘检测,在此前提下进一步实现边缘连接,最终完成层位追踪。对实测数据的处理结果表明:该文提出的层位追踪法在追踪精确度上远远优于单纯利用隐Markov模型的层位追踪法。 相似文献
16.
首先介绍P2P流量的现状,说明现在对于P2P流量要采取疏堵结合的原则。接着介绍P12P流量的管理策略和控制P2P流量的技术,并在对隐马尔可夫模型做了简单介绍之后提出一种基于隐马尔可夫模型的P2P流量控制管理系统。该系统表现出了良好的灵活性和可扩展性。 相似文献
17.
通过对Gnutella网络拓扑实测数据的分析,得到了Gnutella网络的累积节点度分布、聚类系数、平均路径长度和rich-club系数等拓扑特征。在拓扑特征分析的基础上,通过引入适应度、邻居数限制和节点聚类等机制,提出了面向非结构化P2P网络拓扑的FCL(Fitness model with tunable Clustering and neighbours Limitation)模型,并给出了建模算法。通过实验分析,证明了该模型的有效性。 相似文献
18.
19.
To deeply understand neuromorphic elec-tronic systems, a basic chemical synapse model is given by logistic Euler inverse mapping and transformation in tandem, 3T-MOS triod-trigger-topology (3T3) is designed in sub-threshold region at 100mV supply for compact synaptic circuit, and the power consumption of synapse in brain-circuitry (ion-bump-city) is compared with its five mimic blocks of HfOx/AlOx typed memristor, modified 2T-MOS-K+-bump circuit, 3T3 synaptic circuit and 4T-Schmitt-oscillator based synaptic circuit, and Chua's cir-cuit on Power-delay-products' (PDP) levels. Above works will match searching for novel feature operators during pushing forward brain health microelectronics. 相似文献
20.
本文提出一种基于自适应窗口固定及传播的多尺度纹理图像分割方法,在小波域隐马尔科夫树模型(WHMT)的初始分割基础上,根据分割粗尺度上的区域一致性好,细尺度上的边缘准确的特点,利用上下尺度像素之间以及本层邻域像素的马尔科夫性,标记出图像的一致性区域和边缘区域,将一致性区域固定,类标直接下传到下一尺度,边缘区域则利用邻域信息确定出上文权值背景传播到下一尺度,与下尺度一起共同指导图像分割,从而很好的保持了区域均匀性和边缘准确性.同时根据纹理图像区域聚集性的特性,利用基于多项式展开和置信区间交叉(LPA-ICI)方法找出各类区域聚集的物理位置中心,融入上下文权值背景中,使得指导分割策略能够更好的进行.实验表明,对于合成纹理图像来说,本文提出的多尺度融合算法在均匀区域内部及区域边界都大为改善,而且无须进行参数的训练,使算法快速的完成. 相似文献