首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
歧义字段的归类及切分算法   总被引:1,自引:0,他引:1  
王彩荣  王凯丽  黄玉基 《微处理机》2005,26(3):33-35,39
在汉语自动分词系统中,歧义字段的切分直接影响着分词的精度。本文深入地分析了歧义字段产生的根源,据此给出了歧义字段的详细分类和消除每一类歧义字段的有效方法。并在对歧义字段进行统计分析的基础上提出了切分精度的级别划分。  相似文献   

2.
一种改进的上下文相关的歧义字段切分算法   总被引:2,自引:0,他引:2       下载免费PDF全文
无论在自然语言处理还是在机器翻译中,中文自动分词都是一个重要的环节。歧义字段切分是中文自动分词研究中的一个“拦路虎”。JAAS在网上阅卷系统中的应用研究。在分析基于规则和基于上下文的歧义字段切分策略基础上,提出了一种改进的上下文相关歧义字段切分算法,并根据汉语中特殊的语法现象,给出了切分算法的辅助策略来对待切分字符串进行预处理,不仅提高了分词的精度,还加快了分词的速度。  相似文献   

3.
基于支持向量机的汉语歧义切分算法   总被引:1,自引:0,他引:1  
李蓉 《计算机仿真》2009,26(7):354-357
针对于解决交集型伪歧义字段的切分,提出了一种应用支持向量机的汉语歧义切分方法.歧义切分问题可看为一个模式分类问题,为提高字段处理能力,应用支持向量机方法建立分类模型.先对歧义字段进行特征提取,采用互信息来表示歧义字段.求解过程是一个有教师学习过程,从歧义字段中挑选出一些高频伪歧义字段,人工将其正确切分作为训练样本并代入SVM训练得到一个分类模型.在分类阶段将SVM和KNN相结合构造一个新的分类器,对于待识别歧义字段代入分类器即可得到切分结果.实验证明不仅具有一定的识别准确率,而且可以提高歧义切分速度.  相似文献   

4.
一种面向网络答疑的汉语切分歧义消除算法   总被引:3,自引:0,他引:3  
针对网络答疑的特点,该文提出了一种汉语歧义消除算法,采用回溯机制及歧义消除评优算法相结合的方法消除汉语切分歧义。首先利用回溯机制发现句子的切分歧义字段,产生含有多种可能切分结果的候选集;然后针对网络答疑特点提出了评优算法,利用该算法计算候选结果的评价值,对其进行排序,选取分词最佳结果,从而消除歧义,提高分词的准确率。该算法已经在基于Web的自然语言答疑系统WebAnswerSystem中实现并得到了实际应用。实验结果表明,算法具有较高的准确率和召回率,对自然语言网络答疑中进行切分歧义消除是行之有效的。  相似文献   

5.
关于歧义字段切分的思考与实验   总被引:6,自引:2,他引:6       下载免费PDF全文
通常认为:如果一个字段存在不同的切分形式,则称该字段为歧义字段。假设A ,B ,C 分别代表一个或多个字组成的字串,在字段ABC 中如果A ,AB ,BC ,C 都是词,则称ABC 为 交集型歧义字段。在字段AB 中,如果A ,B ,AB 都是词,则称AB 为组合型歧义字段。交集型歧义字段占字段总数的85 % - 90 %。  相似文献   

6.
汉语文本中交集型切分歧义的分类处理   总被引:2,自引:0,他引:2  
自动分词是中文信息处理的基本问题,交集型歧义字段的切分又是中文分词的难点.本文把交集型歧义字段按其宏结构分类,再依据本文提出的4条切分原则,使用歧义字段的结构信息和语法规则对不同类型的交集字段分别处理,提高了分词的准确性.该分词方法已作为中文网页索引和检索工具被用于网络搜索引擎中.实验效果表明,这一分词系统能够处理某些其它分词系统不能正确划分的实例.  相似文献   

7.
歧义词的切分是中文分词要面对的数个难题之一,解决好了这个问题就能够有力提升中文分词的正确率.对此,本文简要介绍了汉语分词的概况,并具体分析了当前中文分词技术存在的障碍和介绍了中文分词中的歧义词切分问题,最后在此基础上提出了一种基于多元关系模型的能够有效解决歧义切分的中文分词系统模型并简要分析了这种模型未来的优化方向.  相似文献   

8.
无论在自然语言处理还是在机器翻译中,中文自动分词都是一个重要的环节。其中歧义字段切分是中文自动分词研究中的一个“拦路虎”,是影响分词系统切分精度的主要因素。能够正确切分某一类歧义字段的知识称为分词知识,所有分词知识的集合称为知识库或规则库。本文通过建立交集型歧义字段切分知识库,并采用知识学习的方法来丰富系统的知识,充分利用了知识库中积累的词的二元语法关系、语素构词、句法关系以及上下文等信息,提高了交集型歧义字段的切分精度。  相似文献   

9.
在分析目前分词方法的基础上提出了一种通过建立多元信息库、采用改进型的粗分算法以拔出所有可能存在歧义的句子、借助于人工干预建立错误切分歧异词库等,实现汉语歧异切分的方法,通过修改、插入多元信息库中的信息量,进一步设计了一个具有自适应能力的歧义切分方法,并通过实验证明该方法能够有效改进汉语分词中错误歧义切分的结果.  相似文献   

10.
现代汉语通用分词系统中歧义切分的实用技术   总被引:8,自引:0,他引:8       下载免费PDF全文
歧义切分技术是中文自动分词系统的关键技术之一.特别是在现代汉语通用分词系统(GPWS)中,允许用户动态创建词库、允许多个用户词库同时参与切分,这给歧义切分技术提出了更高的实用性要求.从大规模的真实语料库中,考察了歧义(特别是交集型歧义)的分布情况和特征;提出了一种改进的正向最大匹配歧义字段发现算法;并根据GPWS的需求,提出了一种“规则+例外”的实用消歧策略.对1亿字《人民日报》语料(约234MB)中的交集型歧义字段进行了穷尽式的抽取,并随机的对上述策略进行了开放性测试,正确率达99%.  相似文献   

11.
    
In this paper, an improved empirical behavioral model for radio‐frequency power amplifiers (RF‐PAs) is presented. The model was implemented in a commercial nonlinear microwave simulator. It belongs to the category of bandpass PA models, which exhibits memory effects due to the low frequency dependence of bias and temperature. Additionally, it facilitates accurate and efficient system level simulations of RF‐PA large‐signal behaviors such as self‐bias, AM‐AM, AM‐PM, gain expansion effects, and intermodulation distortion (IMD) sweet‐spots. The model was validated using measurement data obtained from a commercial CDMA PA at 1.88 GHz. © 2007 Wiley Periodicals, Inc. Int J RF and Microwave CAE, 2007.  相似文献   

12.
    
Accurate detection of pipeline leakage is essential to maintain the safety of pipeline transportation. Recently, deep learning (DL) has emerged as a promising tool for pipeline leakage detection (PLD). However, most existing DL methods have difficulty in achieving good performance in identifying leakage types due to the complex time dynamics of pipeline data. On the other hand, the initial parameter selection in the detection model is generally random, which may lead to unstable recognition performance. For this reason, a hybrid DL framework referred to as parameter-optimized recurrent attention network (PRAN) is presented in this paper to improve the accuracy of PLD. First, a parameter-optimized long short-term memory (LSTM) network is introduced to extract effective and robust features, which exploits a particle swarm optimization (PSO) algorithm with cross-entropy fitness function to search for globally optimal parameters. With this framework, the learning representation capability of the model is improved and the convergence rate is accelerated. Moreover, an anomaly-attention mechanism (AM) is proposed to discover class discriminative information by weighting the hidden states, which contributes to amplifying the normal-abnormal distinguishable discrepancy, further improving the accuracy of PLD. After that, the proposed PRAN not only implements the adaptive optimization of network parameters, but also enlarges the contribution of normal-abnormal discrepancy, thereby overcoming the drawbacks of instability and poor generalization. Finally, the experimental results demonstrate the effectiveness and superiority of the proposed PRAN for PLD.   相似文献   

13.
为提高数据链路的可靠性,根据3GPP最新发布的标准,研究了AM传输模式的运行原理与实现机制,通过SDL和TYCN的协仿真进行协议一致性测试.测试结果表明该方案能较好地执行AM的相关功能,具有一定的实用价值.  相似文献   

14.
史立 《微机发展》1997,7(5):12-14
为了避免在C 多态性设计中出现二义性问题,本文通过具体的程序实例,说明出现二义性的原因以及解决的办法。  相似文献   

15.
基于矩阵模式的人脸表情识别   总被引:1,自引:0,他引:1  
提出了一种基于矩阵模式的人脸表情识别方法。该算法直接将人脸表情图像矩阵作为矩阵模式,并结合传统PCA和FLDA进行表情特征提取,称之为MatPCA和MatFLDA。与2DPCA等不同,该算法既利用图像矩阵中的行向量间的信息,也充分利用列向量间的信息,尽可能地保留了原始的表情信息。基于JAFFE和CED-WYU(1.0)两个表情数据库的识别结果表明,基于矩阵模式的特征提取方法能有效地提高识别率并节省计算时间。  相似文献   

16.
    
One popular approach to assess the geometric differences between a part produced by additive manufacturing (AM) and its intended design is the use of a 3D scanner to produce a point cloud. This digital scan is then aligned against the part’s intended design, allowing for quantification of print accuracy. One of the most common methods for achieving this alignment is the Iterative Closest Point (ICP) algorithm. This paper evaluates several potential pitfalls that can be encountered when applying ICP for assessment of dimensional accuracy of AM parts. These challenges are then illustrated using simulated data, allowing for quantification of their impact on the accuracy of deviation measurements. Each of these registration errors was shown to be significant enough to noticeably affect the measured deviations. An efficient and practical method to address several of these errors based on engineering informed assumptions is then presented. Both the proposed method and traditional unconstrained ICP are used to produce alignments of real and simulated measurement data. A real designed experiment was conducted to compare the results obtained by the two registration methods using a linear mixed effects modeling approach. The proposed method is shown to produce alignments that were less sensitive to variation sources, and to generate deviation measurements that will not underestimate the true shape deviations as the unconstrained ICP algorithm commonly does.  相似文献   

17.
张磊  冯晓森  项学智 《计算机工程》2009,35(13):26-27,5
提出基于非负矩阵分解(NMF)的中文文本主题分类方法,应用NMF算法分解词.文本矩阵获取词之间的相关性,有效地解决同义词、多义词的影响。实验结果表明,与基于奇异值分解的潜在语义索引方法相比,该方法计算速度快、占用存储空间较少。在潜在语义数据降低较大的情况下,NMF方法具有更好的分类精度。  相似文献   

18.
NSCT和非负矩阵分解的图像融合方法   总被引:2,自引:0,他引:2  
非采样Contourlet变换(Nonsubsampled Contourlet transform,NSCT)是一种新的多尺度变换,它同时具有方向性、各向异性和平移不变性,能有效地表示图像的边沿与轮廓。非负矩阵分解(Non-negative Matrix Factorization,NMF)是在矩阵中所有元素均为非负数的条件下的一种矩阵分解方法。在非负矩阵分解过程中,适当地选取特征空间的维数能够获得原始数据的局部特征。提出了一种基于NSCT和NMF的图像融合方法。首先用NSCT对已配准的源图像进行分解,得到低通子带系数和各带通子带系数;其次将低通子带系数作为原始数据,选取特征空间的维数为1,利用非负矩阵分解得到包含特征基的低通子带系数;对各带通子带系数采取绝对值最大的原则进行系数选择,得到融合图像的各带通子带系数;最后经过NSCT逆变换得到融合图像。实验结果表明,融合结果优于Laplacian方法、小波方法和NMF方法。  相似文献   

19.
提出了一种基于V-BLAST系统的跨层设计方案,综合考虑物理层的自适应调制和链路层的截短ARQ技术,推导了平坦衰落信道下的频谱效率和中断率。数据仿真结果表明,这种联合设计可以降低V-BLAST系统的中断率,并且获得可观的频谱效率增益。  相似文献   

20.
In this study, we propose an analysis system for single-trial classification of electroencephalogram (EEG) data. Combined with automatic EOG artifact removal and wavelet-based amplitude modulation (AM) features, the support vector machine (SVM) classifier is applied to the classification of left finger lifting and resting. Automatic EOG artifact removal is proposed to eliminate the EOG artifacts automatically by means of independent component analysis (ICA) and correlation coefficient. The features are then extracted from the discrete wavelet transform (DWT) data by the AM method. Finally, the SVM is used for the discriminant of wavelet-based AM features. Compared with EEG data without EOG artifact removal, band power features and LDA classifier, the proposed system achieves promising results in classification accuracy.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号