期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

郑永军张连海陈斌《模式识别与人工智能》2015,(2)

在基于动态匹配词格检索( DMLS)的关键词检测系统中,应用最小编辑距离作为关键词检出的置信度,在提高检出率的同时也增加虚警率。针对此问题,文中提出融合后验概率置信度的动态匹配词格检索方法。该方法首先将基于Lattice的后验概率引入到DMLS的索引建立中,其次应用数据驱动的音素替换、插入和删除代价,实现更灵活的近似匹配,最后通过联合最小编辑距离和后验概率置信度得分进行关键词检测。实验表明,最小编辑距离和后验概率置信度具有一定的互补性,系统的等错误率相对降低。相似文献

2.

形态学与测地距离函数应用于CT断层图像插值

下载免费PDF全文

贾超李亚张小敏段亮亮《计算机工程与应用》2011,47(26):203-206

现有的插值方法在进行断层图像插值时,要么不能兼顾灰度和形状的变化,要么计算量太大。为解决这一问题,提出一种基于数学形态学、测地距离函数与向量积点匹配相结合的插值算法。通过对已知两幅断层图像进行分割,得到目标与背景的区域后,利用数学形态学与测地距离函数相结合的方法确定出插值图像目标与背景区域的轮廓,然后在每个轮廓内运用向量积点匹配插值方法得到插值点的值,从而得到整个插值图像。实验结果表明,该算法插值出的图像不仅视觉效果好而且使计算量极大减少。相似文献

3.

基于词级DPPM的连续语音关键词检测

王勇张连海《计算机工程》2014,(5):247-251

提出一种基于词级区分性点过程模型的连续语音关键词检测方法。利用时间模式结构和多层感知器计算每个音素帧级后验概率,使用区分性点过程模型将一段时间内多个音素事件形成的点过程作为整体,把关键词检测看作二元分类问题,经分段和拼接构成超矢量,输入支持向量机分类器,判断该段语音是否为待检测关键词。该方法充分考虑语音信号上下文相关性,直接以词作为基本单元建模,提高了系统检测的准确性和鲁棒性。实验结果表明,对采样的语音,其关键词平均召回率和准确率分别可达71.5%和84.6%以上,并且结合相关语言模型知识,系统性能将会进一步提高。相似文献

4.

一种改进的模板匹配眼睛定位方法 总被引：3，自引：1，他引：3

史慧荣张学帅梁彦张洪才程咏梅《计算机工程与应用》2004,40(33):44-45,214

针对眼睛定位问题,文章提出了一种改进的模板匹配方法。在使用一种合成的眼睛模板对图像进行匹配得到多个相似眼睛点的基础上,利用人脸库部分图像中两眼相对位置关系的统计值来构造一个分段距离函数,并计算相似眼睛点的两两距离,根据此距离信息来同时定位双眼。实验结果表明,与传统模板匹配方法相比,该文方法能够同时定位双眼,并显著提高了定位准确率和定位速度。相似文献

5.

普通话发音训练多级音素模板综合评价方法

下载免费PDF全文

徐明黄中伟杨磊《计算机工程与应用》2007,43(28):237-239

提出了一种应用于普通话声韵母发音评价的多级音素模板综合评分法,该方法在单模板匹配的基础上,通过寻找汉语音素发音过程中的浊化、摩擦、爆破等特征,形成多个子模式,进行多模式匹配,最后给出加权评分。实验结果表明多级音素模板综合评分法有效地改善了汉语发音中几组相似音之间的区分度。也介绍了MFCC等语音特征提取、DTW模板匹配算法、基于聚类的模板训练以及综合加权评价机制的实现方法。相似文献

6.

电视剧语音识别中的半监督自动语音分割算法

龙艳花茅红伟叶宏《数据采集与处理》2019,34(2):281-287

针对具有大段连续文本标注、但无时间标签的电视剧语音提出了一种半监督自动语音分割算法。首先采用原始的标注文本构建一个有偏的语言模型,然后将该语言模型以一种半监督的方式用于电视剧语音识别中,最后利用自动语音识别的解码结果对传统的基于距离度量、模型分类以及基于音素识别的语音分割算法进行改进。在英国科幻电视剧“神秘博士”数据集合上的实验结果表明,提出的半监督自动语音分割算法能够取得明显优于传统语音分割算法的性能,不仅有效解决了电视剧语音识别中大段连续音频的自动分割问题,还能对相应的大段连续文本标注进行分段,保证分割后各语音段时间标签及其对应文本的准确性。相似文献

7.

机器视觉技术在荔枝识别与定位研究中的应用 总被引：1，自引：0，他引：1

郭艾侠彭明明邢仲璟《计算机工程与应用》2017,53(17):218-223

为解决串型荔枝图像识别和定位问题,提出以Harris与SIFT算法融合的采摘点计算与匹配为基础,进行平行双目立体视觉模型下采摘点定位的研究方案。首先对荔枝YCbCr色彩空间的Cr灰度图进行二次阈值分割,分类识别出荔枝串、荔枝果与结果母枝。其次,提取识别果实区域的最小外接矩形、质心等特征信息,结合在结果母枝上检测的Harris特征点计算出采摘点的二维图像坐标,并对计算采摘点进行基于SIFT向量搜索的立体匹配。最后,对计算采摘点进行视觉定位及其深度误差分析实验,实验数据表明：在354~590?mm距离范围内,插值补偿后的采摘点的定位深度误差小于10?mm,能够较好满足荔枝采摘机器人的现有技术要求。相似文献

8.

基于图像的人体特征点提取与尺寸测量

许明星李重《计算机系统应用》2018,27(6):87-94

人体特征点提取和尺寸测量一直是虚拟服装试衣的关键内容.本文在人体图像基础上,通过对ASM算法进行改进实现人体特征点提取以及特征点尺寸测量.首先,算法计算待测图片中人脸和身体两个中心点欧式距离与对应模板进行匹配,改变传统ASM算法单一模板局部模板匹配模式,提高了初次模型匹配的准确率和效率;接着,以特征点为中心选择较少有效邻域点在其灰度训练模型中目标搜索,解决传统ASM方法匹配时间长且特征点易匹配失败问题;另外,针对人体胯部以下区域易出现仅单侧拟合效果较好问题,利用马氏距离公式选择特定矩阵大小邻域范围内点的灰度与灰度模型比较,并且结合人体体型分布及对称性特点进行拟合处理.实验结果表明了该方法能适应复杂背景下人体图像的特征点提取与尺寸测量,提高人体特征点提取和尺寸测量精度. 相似文献

9.

基于音素混淆网络的蒙古语语音关键词检测方法的研究

飞龙高光来鲍玉来《中文信息学报》2015,29(1):178-182

蒙古语语音识别系统的词表很难覆盖所有的蒙古文单词,并且随着社会的发展,蒙古文的新词和外来词也越来越多。为了解决蒙古语语音关键词检测系统中的集外词检测问题,该文提出了基于音素混淆网络的蒙古语语音关键词检测方法,并采用音素混淆矩阵改进了关键词的置信度计算方法。实验结果表明,基于音素混淆网络的蒙古语语音关键词检测方法可以较好地解决集外词的检测问题。蒙古语语音关键词检测系统采用改进的置信度计算方法后精确率提高了6%,召回率提高了2.69%,性能得到明显的提升。相似文献

10.

基于深度神经网络的关键词识别系统

孙彦楠夏秀渝《计算机系统应用》2018,27(5):41-48

针对当前关键词识别少资源或零资源场景下的要求, 提出一种基于音频自动分割技术和深度神经网络的关键词识别算法. 首先采用一种基于度量距离的改进型语音分割算法, 将连续语音流分割成孤立音节, 再将音节细分成和音素状态联系的短时音频片段, 分割后的音频片段具有段间特征差异大, 段内特征方差小的特点. 接着利用一种改进的矢量量化方法对音频片段的状态特征进行编码, 实现了关键词集内词的高精度量化编码和集外词的低精度量化编码. 最后以音节为识别单位, 采用压缩的状态转移矩阵作为音节的整体特征, 送入深度神经网络进行语音识别. 仿真结果表明, 该算法能从自然语音流中较为准确地识别出多个特定关键词, 算法易于理解、训练简便, 且具有较好的鲁棒性. 相似文献

11.

A segmentation-free word spotting method for historical printed documents

Thomas Konidaris Anastasios L. Kesidis Basilis Gatos 《Pattern Analysis & Applications》2016,19(4):963-976

In this paper, a two-step segmentation-free word spotting method for historical printed documents is presented. The first step involves a minimum distance matching between a query keyword image and a document page image using keypoint correspondences. In the second step of the method, the matched keypoints on the document image serve as indicators for creating candidate image areas. The query keyword image is matched against the candidate image areas in order to properly estimate the bounding boxes of the detected word instances. The method is evaluated using two datasets of different languages and is compared against segmentation-free state-of-the-art methods. The experimental results show that the proposed method outperforms significantly the competitive approaches. 相似文献

12.

基于语言模型词嵌入和注意力机制的敏感信息检测方法

黄诚赵倩锐《计算机应用》2022,42(7):2009-2014

针对基于关键词字符匹配和短语级情感分析等传统敏感信息检测方法准确率低和泛化性差的问题,提出了一种基于语言模型词嵌入和注意力机制（A-ELMo）的敏感信息检测方法。首先,进行字典树快速匹配,以最大限度地减少无用字符的比较,从而极大地提高查询效率;其次,构建了一个语言模型词嵌入模型（ELMo）进行语境分析,并通过动态词向量充分表征语境特征,从而实现较高的可扩展性;最后,结合注意力机制加强模型对敏感特征的识别度,从而进一步提升对敏感信息的检测率。在由多个网络数据源构成的真实数据集上进行实验,结果表明,所提敏感信息检测方法与基于短语级情感分析的方法相比,准确率提升了13.3个百分点;与基于关键字匹配的方法相比,准确率提升了43.5个百分点,充分验证了所提方法在加强敏感特征识别度、提高敏感信息检测率方面的优越性。相似文献

13.

基于LDA模型的主题分析 总被引：9，自引：0，他引：9

石晶范猛李万龙《自动化学报》2009,35(12):1586-1592

在文本分割的基础上, 确定片段主题, 进而总结全文的中心主题, 使文本的主题脉络呈现出来, 主题以词串的形式表示. 为了分析准确, 利用LDA (Latent dirichlet allocation)为语料库及文本建模, 以Clarity度量块间相似性, 并通过局部最小值识别片段边界. 依据词汇的香农信息提取片段主题词, 采取背景词汇聚类及主题词联想的方式将主题词扩充到待分析文本之外, 尝试挖掘隐藏于字词表面之下的文本内涵. 实验表明, 文本分析的结果明显好于其他方法, 可以为下一步文本推理的工作提供有价值的预处理. 相似文献

14.

结合距离变换与边缘梯度的分水岭血细胞分割 总被引：2，自引：2，他引：2

下载免费PDF全文

缪慧司梁光明刘任任丁建文《中国图象图形学报》2016,21(2):192-198

目的针对医学图像中细胞提取和粘连细胞分割问题,提出一种结合距离变换利用边缘梯度的分水岭血细胞显微图像分割方法。方法首先,通过距离变换由细胞二值图生成距离地形图,取其局部极值点或点集作为前景标记,进行第1次距离分水岭变换;接着将第一步骤所得的分水岭脊线作为背景区域的标记,前景标记不变,视梯度幅度图为地形图,再一次进行梯度分水岭变换,得到细胞分割结果。两次分水岭变换前,均采用强制极小值的方法修改地形图,来控制地形图只在选取的标记处存在局部极小值。结果该方法由距离图提取前景标记,将距离分水岭变换所得的脊线作为梯度分水岭变换的背景标记,能有效地分离粘连目标。相比于基于距离图分水岭变换,本文方法不过多依赖二值图像信息,保留了基于梯度图像的分水岭变换边缘定位准确的优点,又解决了其无法分割粘连目标和过分割的问题。结论经多幅临床细胞图像分割实验验证,该方法可以实现图像中细胞的提取以及粘连细胞的自动分割,满足医学图像分割的要求。相似文献

15.

Keyword spotting using an evolutionary-based classifier and discriminative features

Shima Tabibian Ahmad Akbari Babak Nasersharif 《Engineering Applications of Artificial Intelligence》2013,26(7):1660-1670

Keyword spotting refers to detection of all occurrences of any given keyword in input speech utterances. In this paper, we define a keyword spotter as a binary classifier that separates a class of sentences containing a target keyword from a class of sentences which do not include the target keyword. In order to discriminate the mentioned classes, an efficient classification method and a suitable feature set are to be studied. For the classification method, we propose an evolutionary algorithm to train the separating hyper-plane between the two classes. As our discriminative feature set, we propose two confidence measure functions. The first confidence measure function computes the possibility of phonemes presence in the speech frames, and the second one determines the duration of each phoneme. We define these functions based on the acoustic, spectral and statistical features of speech. The results on TIMIT indicate that the proposed evolutionary-based discriminative keyword spotter has lower computational complexity and higher speed in both test and train phases, in comparison to the SVM-based discriminative keyword spotter. Additionally, the proposed system is robust in noisy conditions. 相似文献

16.

A novel word spotting method based on recurrent neural networks

Frinken V Fischer A Manmatha R Bunke H 《IEEE transactions on pattern analysis and machine intelligence》2012,34(2):211-224

相似文献

17.

斑马鱼视网膜细胞图像的分割研究

杜培明汪宁宁史晓丽《微型机与应用》2012,31(4):34-36

针对斑马鱼视网膜细胞图像分割时细胞粘连比较严重的情况,采用了边界距离变换和模拟浸水原理的分水岭变换相结合的方法。首先采用距离变换的方法提取细胞区域的局部极小值作为种子点,合并距离过小的错误种子点,然后使用分水岭算法进行分割。实验结果表明,该方法能够有效地分割斑马鱼视网膜细胞图像,成功地解决了分水岭变换中粘连细胞的过分割问题,且计算速度快。相似文献

18.

结合关键词混淆网络的关键词检出系统

张磊陈晶项学智贾梅梅《智能系统学报》2010,5(5):432-435

为了高效地从大词汇量连续语音识别（LVCSR）的多候选中得到关键词结果,保证最小词错误率,提出了将混淆网络的思想应用到关键词检出系统中.在传统混淆网络生成方法基础上,提出一种改进的更加适合于关键词检出的关键词混淆网络作为关键词检出的中间结构,该方法只对所有关键词竞争候选生成带有得分标记的关键词混淆网络,突出候选之间竞争关系,并根据得分标记确定关键词.与传统的N best作为中间结构的关键词检出系统比较,基于混淆网络的关键词检出系统的召回率为87.11％,提高了21.65%.实验表明,在提高召回率的同时,所提方法具有关键词直接定位的特点,因此具有较低的时间开销. 相似文献

19.

基于误差控制的自适应3次B样条曲线插值 总被引：1，自引：0，他引：1

叶铁丽李学艺曾庆良《计算机工程与应用》2013,49(1):199-201,216

针对现有曲线插值算法不能有效压缩型值点的缺陷,研究了一种自适应三次B样条曲线插值算法。从型值点序列中选用最少的点插值一条初始曲线,基于提出的点到曲线的最小距离计算方法,分别计算各非插值点对应的插值误差,并从中提取最大插值误差。若最大误差大于给定的误差阈值,则将其对应的型值点加入插值型值点序列,重新插值曲线,直到最大插值误差满足误差要求。与现有曲线插值算法相比,该算法可以在保证插值精度的前提下有效压缩数据量。相似文献