共查询到19条相似文献,搜索用时 78 毫秒
1.
针对脱机手写维吾尔文本行图像中单词切分问题,提出了FCM融合K-means的聚类算法。通过该算法得到单词内距离和单词间距离两种分类。以聚类结果为依据,对文字区域进行合并,得到切分点,再对切分点内的文字进行连通域标注,进行着色处理。以50幅不同的人书写的维吾尔脱机手写文本图像为实验对象,共有536行和4?002个单词,正确切分率达到80.68%。实验结果表明,该方法解决了手写维吾尔文在切分过程中,单词间距离不规律带来的切分困难的问题和一些单词间重叠的问题。同时实现了大篇幅手写文本图像的整体处理。 相似文献
2.
从维吾尔文的特征和书写规则出发对维吾尔文联机手写单词识别技术进行了探索性研究,并提出一种新的思路:不是直接把单词切分成字母,而是先把单词分割成连体段,然后再分割成字母。这样,可以提高字母切分和字母识别的准确率。按照该思路,提出一种连体段分割算法:根据通过研究维吾尔文的特征和书写规则找出来的一些规则把一个个的笔画,组合成连体段。实验证明了该连体段分割思路和算法的可行性。 相似文献
3.
4.
5.
为提高维吾尔文档图像的检索效率,提出一种基于字符空间关系的关键词检索方法.通过对文档图像进行单词切分,提取切分后单词图像的字符空间位置特征,将提取的特征根据单词的连体段数目存储为多个特征文件,根据输入关键词图像的特征寻找对应的特征文件进行查询.从115张印刷体维吾尔文档图像切分后的24460张单词集中选取10张有丰富含... 相似文献
6.
在许多文字识别系统中, 字符切分是预处理阶段的一部分, 其目的是从文本图象中分离出字母图象。而后才能针对切分后的每个字母进行识别。在具有连体特征的文字中, 字符切分就显得特别重要, 因为字符切分的准确与否直接影响字符的识别。维吾尔文就具有这种明显的连体特点, 本文主要讨论了采用抽取投影特征的方法, 实现了多字体维吾尔文的行切分、字切分和字符切分。 相似文献
7.
在遥感领域,获取用于训练的标记数据耗费巨大且困难,因此许多非监督技术逐渐被发展和应用于标记样本有限的遥感图像。将[k]均值和蜂群算法相结合,提出一种新的非监督聚类算法。使用灰度共生矩阵和小波变换提取遥感图像特征,对特征数据集进行蜂群[k]-means聚类。整个聚类过程首先使用最大最小距离积邻域均值法产生初始聚类中心,将蜂群算法和[k]-means算法交替执行,实现遥感图像的聚类。通过UCI数据集和凉水国家级自然保护区的遥感数据的实验结果表明,该算法具有较高的聚类准确率,满足遥感图像聚类的应用需求。 相似文献
8.
多字体印刷维吾尔文字符识别系统的研究与开发 总被引:2,自引:0,他引:2
该文介绍了维吾尔文的特点及维吾尔文字符识别系统.针对维吾尔文的连体结构.重点讨论了解决过程中的技术难点.其中利用投影分离出连体段中的字母.采用边切分边识别的方法,对文本图像进行了切分.分类.提取外围特征,并通过样张的训练.使维吾尔文字符的识别获得了较满意的结果. 相似文献
9.
在维吾尔文文字识别中,能否有效地聚类将直接影响识别结果的好坏。为改善聚类效果,针对维吾尔文连体段聚类,提出了一种改进的K-means聚类算法。该算法首先采用等间距法多次选择类中心,然后选择最佳码本和利用有效相似比来动态调整聚类个数K,最后完成了连体段聚类。实验结果表明:与传统K-means算法相比,改进的K-means算法得到了较好聚类效果,聚类正确率达90%以上。 相似文献
10.
协同过滤算法作为一种信息筛选的重要方式,在大数据时代下受到越来越多的关注。但传统的协同过滤算法由于面临着严重的数据稀疏性以及只考虑用户间的评分相似性,导致推荐准确率较低。对此,提出了一种改进的协同过滤算法。利用[K]-means++算法对用户属性进行聚类,从而降低数据的稀疏性;考虑到用户兴趣会随时间发生动态变化,在传统的评分相似性中引入时间因素;将信任误差引入到用户间的信任关系中,从而改善用户信任度;将基于时间因素的评分相似性与改进的用户信任度进行融合,从而提高用户相似性的计算精度。在MovieLens数据集上进行仿真实验,结果表明,该算法能有效地提高推荐的预测准确性。 相似文献
11.
随着民族服装文化的碰撞与融合,对图像风格迁移技术进行了研究,阐述了当前风格迁移的研究现状,将蒙古族服饰风格与汉族风格进行融合,继承和弘扬了民族文化。针对蒙古服饰元素多样、颜色差异大、花纹不规则性等特征而引起的风格提取难度大的问题,采用[K]均值与封闭式自然抠图算法相结合的方法进行图像分割,基于神经网络提取图像的风格和内容,利用图像重建技术合成结果图,实现蒙汉服饰图像风格迁移;针对输出图像伪影严重的问题,采取一种改进的图像风格迁移算法,将输入图像到输出图像的变换约束在色彩空间的局部仿射变换中,将这个约束表示成一个完全可微的参数项,有效抑制图像扭曲,针对真实照片风格迁移过程中存在的空间不一致问题,进行平滑处理确保风格处理后空间风格一致,该方法大大加快了运算速度。 相似文献
12.
该文提出了面向维吾尔语关键词检索的两种切词算法,并给出MATLAB实现的算法代码及详细说明;在同等条件下对两种算法的切词效果和关键词识别效率进行对比分析;提出两种算法的优化方法和构想。 相似文献
13.
14.
提出了一种有效的基于颜色和位置相关信息的图像分割方法。图像以块为单位进行划分,在YUV空间,提取块的颜色特征,并对每小块进行小波变换,获得其小波能量特征。将颜色特征和能量特征作为每小块的特征向量,采用分层聚类的方法进行区域的合并。该方法在聚类过程中考虑了小块的位置关系,并能最终自动确定聚类的类别数。 相似文献
15.
有监督的学习方法用于视网膜血管分割须以专家手动标记好的视网膜血管为标准,存在训练样本获取困难且训练时间长等不足。针对这些缺点,提出一种基于特征组合的多模块无监督学习方法,提取眼底图像素的不变矩、Hessian矩阵、相位一致性、Gabor小波变换、Candy边缘共18维特征向量,采用多模块[k]-means方法进行视网膜血管分割。实验结果表明,该方法简单,具有较好的准确度,且时间开销少。 相似文献
16.
现有的可变区域拟合能量(RSF)模型基于初始轮廓内外灰度值的近似,较好地处理了图像分割中存在的图像灰度不均匀的问题。但当选择不恰当的初始轮廓时,由于RSF模型能量函数的非凸性质,极易陷入局部最小值。为了保证初始化的鲁棒性,提出了一种拟合函数优化的RSF模型。在曲线演化过程中,在演化方向相反的区域增加一个函数来交换曲线内外拟合值,使整条曲线沿物体的同侧边界演化。又将谱图理论引入该模型,使其能对大数据样本聚类且快速收敛至全局最优解。将改进模型应用于医学图像分割,实验结果表明该模型较RSF模型获得了更鲁棒的分割结果和较高的分割效率。 相似文献
17.
字典与统计相结合的中文分词方法 总被引:15,自引:0,他引:15
提出了一种字典与统计相结合的中文分词方法,该方法首先利用基于字典的分词方法进行第一步处理,然后利用统计的方法处理第一步所产生的歧义问题和未登录词问题.本算法在基于字典的处理过程中,通过改进字典的存储结构,提高了字典匹配的速度;在基于统计的处理过程中,通过统计和规则相结合的方法提高了交集型歧义切分的准确率,并且一定条件下解决了语境中高频未登录词问题,实验结果表明,由本文算法实现的分词系统DSfenci的分全率达99.52%,准确率达98.52%. 相似文献
18.
通过基于粗糙集相容关系的划分,介绍了一种新的图像聚类分割方法,首先,以不同聚类数情况下FCM的分割结果为依据构建信息表,在合并重复行后,图像被分成多个对象区域,然后,通过值约简获得各属性权值并以此为依据,计算各对象之间的差异度,进而通过差异度定义 相容关系,最后由 相容关系对对象论域进行划分,完成图像分割。该方法在人工生成图像和大脑MRI图像的分割中得到验证,实验结果表明,本文方法比FCM方法具有更好的分割准确性,对模糊边界区域的分割效果较好。 相似文献
19.
提出模糊聚类和边缘检测结合的彩色图像分割方法,以色彩图像直方图中自适应搜索到的峰值作为聚类中心,对图像进行模糊聚类。然后对模糊聚类后的图像进行边缘检测,检测出面积较大的区域的边缘,首先在区域内部进行融合,然后在区域边界和面积较小色彩相似的区域融合。实验表明,本方法不需预先确定聚类数目、聚类中心初始化,在区域融合后,可得到较好的分割效果。 相似文献