共查询到17条相似文献,搜索用时 125 毫秒
1.
2.
采用主动学习策略的组织机构名识别 总被引:6,自引:0,他引:6
组织机构名等命名实体的识别是信息抽取、机器翻译等任务的重要基础.为了克服识别器训练过程中对标注数据的依赖。本文提出了一种基于主动学习的训练策略。改进了基本的最大熵模型的解码算法和训练过程,实验表明采用主动学习策略的最大熵模型训练算法能够有效减少标注数据的使用。 相似文献
3.
4.
5.
6.
在基于令牌传递算法的关键词检出技术中,为改进实时性,本文首先从限制模型规模的角度,提出了限制上下文相关的词内相关音素模型.针对误识率高的问题,提出了基于声学置信度的关键词确认方法,并实现了多次解码机制,提高了识别性能.其次,从改进解码算法的角度,研究了剪枝和控制最大激活模型数两种策略对识别性能的影响,并结合确认机制进行关键词检出,获得了满意的结果. 相似文献
7.
最大熵模型已成为自然语言处理领域中的研究热点,但由于熟语料库规模的限制,模型参数会出现稀疏现象,影响了模型的精确度.另外最大熵模型参数众多、计算量大,一个好的参数估计算法将会有效地提高模型的效率.实验证明,采用BLMVM算法的基于Gaussian prior平滑技术的最大熵模型具有出色的表现.基于以上认识,结合汉语自身的特点,设计了一个基于词和字特征的汉语词性自动标注系统,取得了较好的标注效果. 相似文献
8.
语义匹配与发现是语义Web的核心内容之一。提出一种新的基于语义熵的服务发现与匹配算法。该算法通过引入语义熵的概念,把最大熵原理运用到语义识别与匹配领域,并对传统的熵最大模型进行了经验修正。通过实验对比分析,可以看出修正后的最大熵模型在服务发现计算方面具有较好的性能,该模型在一个真实的中文语义Web的语义识别项目中得到了应用,也体现出较好的精确度和性能。 相似文献
9.
RICE算法在无损压缩系统有着广泛的应用。由于RICE算法采用了变长的自适应熵编码,因此在解码时需要对压缩流进行逐位判断和解析,这给高速解压缩的实现带来了困难。现有的RICE解码实现在解码速度和通用性上都不理想。针对RICE算法中自适应熵编码的特点,设计了一种基于有限状态机和查找表的并行RICE解码结构,可在FPGA上完成8比特宽度的并行解码,解码速度最高可达176 MB/s;同时,该解码结构适用于编码参数k变化的情况,具有很强的通用性。 相似文献
10.
H.264中指数哥伦布算法的优化实现研究 总被引:1,自引:0,他引:1
指数哥伦布算法是H.264视频压缩标准中熵解码的重要组成部分.深入研究了指数哥伦布解码算法,提出了一种优化实现.该实现利用指数哥伦布码字的特性,给出了一种使用计算代替逐个比特读取的解码方式.根据实验数据,使用这种方法可以比JM(H.264参考实现)中的指数哥伦布解码方法提高20%左右的效率. 相似文献
11.
Barbieri R Frank LM Nguyen DP Quirk MC Solo V Wilson MA Brown EN 《Neural computation》2004,16(2):277-307
Neural spike train decoding algorithms and techniques to compute Shannon mutual information are important methods for analyzing how neural systems represent biological signals. Decoding algorithms are also one of several strategies being used to design controls for brain-machine interfaces. Developing optimal strategies to design decoding algorithms and compute mutual information are therefore important problems in computational neuroscience. We present a general recursive filter decoding algorithm based on a point process model of individual neuron spiking activity and a linear stochastic state-space model of the biological signal. We derive from the algorithm new instantaneous estimates of the entropy, entropy rate, and the mutual information between the signal and the ensemble spiking activity. We assess the accuracy of the algorithm by computing, along with the decoding error, the true coverage probability of the approximate 0.95 confidence regions for the individual signal estimates. We illustrate the new algorithm by reanalyzing the position and ensemble neural spiking activity of CA1 hippocampal neurons from two rats foraging in an open circular environment. We compare the performance of this algorithm with a linear filter constructed by the widely used reverse correlation method. The median decoding error for Animal 1 (2) during 10 minutes of open foraging was 5.9 (5.5) cm, the median entropy was 6.9 (7.0) bits, the median information was 9.4 (9.4) bits, and the true coverage probability for 0.95 confidence regions was 0.67 (0.75) using 34 (32) neurons. These findings improve significantly on our previous results and suggest an integrated approach to dynamically reading neural codes, measuring their properties, and quantifying the accuracy with which encoded information is extracted. 相似文献
12.
13.
KERİM DEMİRBAŞ 《International journal of systems science》2013,44(3):537-545
A stack sequential decoding algorithm is used estimate states of dynamic models with an Nth-order memory.The state at the future and observation at the present are linear or non-linear functions of the disturbance noise, the observation noise, and either the present or N - 1 past discrete values of the state. States are estimated by approximating the state model by a finite state machine and then using a stack sequential decoding algorithm of Information Theory. The proposed suboptimum scheme is faster and more practical than the estimation schemes using the Viterbi decoding algorithm. 相似文献
14.
兼顾加密JPEG图像的隐藏容量和安全性,提出一种JPEG比特流加密域可逆数据隐藏新方法。该算法设计了一种块间置乱与块内加密相结合的JPEG比特流加密方法,不仅实现对图像块的伪随机置乱,还实现了熵编码块的霍夫曼编码和扩展位的全加密,降低信息泄露可能性的同时,提高了算法抵抗唯密文攻击的能力。同时,该算法生成的加密JPEG比特流与JPEG解码标准兼容,解码得到的加密图像类似随机噪声且与原始图像大小相同,所有图像块熵编码都可以用来隐藏附加信息,有效解决了隐藏容量与安全性之间的矛盾。对比分析了算法的安全性、文件大小和隐藏容量等性能。实验仿真结果表明本文算法能有效抵抗唯密文攻击,隐藏容量是现有最新同类算法的4倍以上。 相似文献
15.
16.
Kam A.C. Kopec G.E. 《IEEE transactions on pattern analysis and machine intelligence》1996,18(9):945-950
This correspondence describes an approach to reducing the computational cost of document image decoding by viewing it as a heuristic search problem. The kernel of the approach is a modified dynamic programming (DP) algorithm, called the iterated complete path (ICP) algorithm, that is intended for use with separable source models. A set of heuristic functions are presented for decoding formatted text with ICP. Speedups of 3-25 over DP have been observed when decoding text columns and telephone yellow pages using ICP and the proposed heuristics 相似文献
17.
网格拓扑压缩方法是计算机图形学的基础算法。该文方法是单分辨率,主要针对非三角网格模型的拓扑信息作无损压缩。算法首先遍历网格的所有多边形得到操作系列;然后对操作系列作霍夫曼编码;再对霍夫曼编码结果作基于上下文长度可变的算术编码得到最后的压缩结果。相比于对非三角网格拓扑信息作压缩的压缩比很高的算法,该算法得到的压缩结果更好。此算法的另一个突出优点是在解码时间和空间上有了改进——新算法可以在接收一个多边形的编码后立即完成解码并抛弃这个编码,从而使得该算法特别适用于在线传输和解码的实时与交互应用场合。此外,该算法还可以处理有空洞和柄(handle)的模型。 相似文献