首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
朱旭巨  杨建刚 《计算机应用》2005,25(5):1039-1041
针对汉字文本分析,提出了一种新的文本特征——空白线特征(BCF)来进行文本投影轮廓生成。在对生成的投影轮廓进行分析之前,应用BCF矢量平滑算法(BVSA)对它进行预处理。处理后的投影轮廓揭示了汉字文本的一个重要现象,就是BCF矢量中间聚集现象。通过统计实验验证,这是一个稳定的现象,也就是说,不同字体、不同字号、印刷体和手写体等等文本风格的不同,都不影响汉字文本的BCF矢量中间聚集现象。应用这个现象对汉字文本进行行分离,取得了良好效果。  相似文献   

2.
本文提出了用改进的粗外围法和对汉字点阵在水平和垂直方向上投影进行WALSH变换以抽取汉字特征的方法。研究表明, 这种方法的处理速度快, 具有较强的抗干扰能力和较高的识别率。利用这种方法, 在由理光FX-120型传真机和IBM PC/XT微机组成的印刷汉字识别系统上, 对二级国标6763个二号印刷体汉字进行多次识别验证, 取得了很好的结果。  相似文献   

3.
异质网络是包含多种类型节点和边的复杂信息网络,因此异质网络的可视化通常涉及异质信息的有效处理与可视技术,传统的网络可视化技术对于异质网络可视化来说布局效果混乱、异质信息难以体现。为此提出一种基于动态投影嵌入的多维度异质网络可视化方法。该方法从异质网络的表示学习方法入手,提出动态投影嵌入模型来学习异质网络的节点表示,在此基础上,提出了多维度(空间)的可视化方法,将异质网络节点根据不同属性映射至不同关系空间中进行可视化分析,从而挖掘出潜在的语义信息。实验结果表明,提出的方法不仅使异质网络表示学习的评价指标(MRR)提升了10%,而且从多维度(空间)对异质网络进行可视化,有效地展示和挖掘了网络中的异质信息与潜在语义信息。  相似文献   

4.
周芳芳  李俊材  黄伟  王俊韡  赵颖 《软件学报》2016,27(5):1127-1139
Radviz是一种多维数据可视化技术,它通过径向投影机制将多维数据映射到低维空间,使具有相似特征的数据点投影到相近位置,从而形成可视化聚类效果.Radviz圆周上的维度排列顺序对数据投影结果影响很大,提出将原始维度划分为多个新维度来拓展Radviz圆周上的维度排序空间,从而获得比原始维度条件下更好的可视化聚类效果.该维度划分方法首先计算数据在每个原始维度的概率分布直方图,然后使用均值漂移算法对直方图进行划分,最后根据划分结果将原始维度扩展为多个新维度.提出使用Dunn指数和正确率来量化评估Radviz可视化聚类效果.进行了多组对比实验,结果表明,维度扩展有利于多维数据在Radviz投影中获得更好的可视化聚类效果.  相似文献   

5.
张洋  王辰 《计算机应用》2013,33(10):2981-2983
首先介绍了目前空间数据可视化技术的研究内容和基本方法,对基于实体和基于区域两类常用方法进行了分析和总结。在此基础上提出了一种基于聚类的空间数据可视化方法,其基本思想是利用以Delaunay三角网的自适应空间聚类算法(ASCDT)为代表的空间聚类算法进行聚类分析,并获得结果描述参数,结合基本方法和参数特征设计专门用于聚类结果表达的可视化对象,进而实现空间数据的图上投影。最后对该类方法有待进一步探讨和改进的内容进行了展望  相似文献   

6.
高茂庭  陆鹏 《计算机应用》2008,28(6):1411-1413
利用遗传算法优化投影方向,投影寻踪模型将高维的文本特征数据投影到2~3维的低维可视化空间上,并根据高维数据在这个低维空间当中的投影特征值来反映其线性和非线性结构或特征,达到数据降维目的并实现文本数据特征可视化。不仅大大约简了文本挖掘过程的计算复杂性,还有助于在K-means聚类算法中确定初始中心点数目,提高算法精度。实验验证了这种方法应用于文本特征降维的有效性。  相似文献   

7.
可视化技术已经成为大数据分析的重要研究方向。非线性支持向量机(SVM)可视化表达有利于理解分类模型内在分析机制,增强分类可信度,对支持向量机应用推广具有重要意义。将超过两维空间的非线性核SVM模型分为三维特征模型与多维特征模型两类。针对不同模型研究实现了基于移动最小二乘法拟合的三维特征模型超平面可视化策略与基于t-SNE点重构的多维特征模型超平面可视化策略。在UCI公开数据集上验证所提出的策略,实验结果表明,该可视化策略能够剖析SVM模型的分类机制,在一定程度上解决了多维空间非线性核超平面难以刻画的问题。  相似文献   

8.
传输函数设计是体数据可视化流程的重要环节,高效的传输函数设计方法是提升体数据可视化效率的关键.在传统传输函数设计的基础上,该文以提升体数据特征可视化及分析效率为目标,提出一种基于体数据空间相似性的传输函数优化设计方法.在特征空间分析过程中,结合体数据空间位置信息,定义特征空间相似性度量标准,对一维传输函数特征空间进行自适应划分;在光学参数映射过程中,定义能量方程描述感兴趣特征的可见性分布与目标可见性分布的差异,近似求解能量方程的梯度,加速光学参数向量的迭代优化,以高效地实现光学参数优化设计.相比于传统的传输函数设计方法,该方法有效耦合特征空间分析及光学参数映射过程,可以帮助用户快速地实现体数据中感兴趣特征的分析与可视化.大量的实验结果、效率对比及用户体验反馈信息进一步验证了该文算法的有效性与实用性.  相似文献   

9.
基于字符结构知识的车牌汉字快速识别技术   总被引:7,自引:2,他引:5  
车牌汉字识别效率一直是制约车牌自动识别系统推广应用的瓶颈。采用多级分类方法,充分利用车牌汉字图像的空问结构特征(像素空间分布投影,字符的笔段类型、数量及拓扑关系等)可实现车牌汉字的快速辨识。实践表明,该方法能快速从车牌汉宁图像中辨识出汉字字符,识别准确度可达98%。  相似文献   

10.
赵健  冯乔生  何娟娟 《软件》2015,(3):31-36
人主要是依靠汉字的结构特征来识别汉字,本文提出用汉字笔画端点、折角点和交叉点以及汉字笔画之间构成的"洞"的中心点在24个区域上的分布直方图作为汉字结构新特征,提出通过对Harris角点的检测、合并和去除操作的汉字笔画端点、折角点和交叉点的提取方法,通过建立手写体与印刷体汉字的特征库中相同汉字新特征的集聚性与不同汉字新特征间的离散性的计算,从实验上验证了所提出的汉字新特征的有效性,分析了所提出的新特征对汉字的大小、字体、光照等影响具有良好的鲁棒性,该新特征对手写体汉字的识别具有较好的应用价值。  相似文献   

11.
12.
李玉凤  吴塞 《微计算机信息》2007,23(33):226-227,214
本研究以手写汉字的基本笔画为对象,确定反映书写特征的相对幅度和相对斜率为时域特征,并对时域特征进行Fourier变换,抽取变换实系数形成特征空间,实现笔迹鉴定。本研究采用10位书写者,各书写70个汉字,提取5种基本笔画,进行笔迹鉴定的实验,实验取得了满意的结果。  相似文献   

13.
In many application fields, data analysts have to deal with datasets that contain many expressions per item. The effective analysis of such multivariate datasets is dependent on the user's ability to understand both the intrinsic dimensionality of the dataset as well as the distribution of the dependent values with respect to the dimensions. In this paper, we propose a visualization model that enables the joint interactive visual analysis of multivariate datasets with respect to their dimensions as well as with respect to the actual data values. We describe a dual setting of visualization and interaction in items space and in dimensions space. The visualization of items is linked to the visualization of dimensions with brushing and focus+context visualization. With this approach, the user is able to jointly study the structure of the dimensions space as well as the distribution of data items with respect to the dimensions. Even though the proposed visualization model is general, we demonstrate its application in the context of a DNA microarray data analysis.  相似文献   

14.
Projection Functions have been widely used for facial feature extraction and optical/handwritten character recognition due to their simplicity and efficiency. Because these transformations are not one-to-one, they may result in mapping distinct points into one point, and consequently losing detailed information. Here, we solve this problem by defining an N-dimensional space to represent a single image. Then, we propose a one-to-one transformation in this new image space. The proposed method, which we referred to as Linear Principal Transformation (LPT), utilizes Eigen analysis to extract the vector with the highest Eigenvalue. Afterwards, extrema in this vector were analyzed to extract the features of interest. In order to evaluate the proposed method, we performed two sets of experiments on facial feature extraction and optical character recognition in three different data sets. The results show that the proposed algorithm outperforms the observed algorithms in the paper and achieves accuracy from 1.4 % up to 14 %, while it has a comparable time complexity and efficiency.  相似文献   

15.
周阿转  俞一彪 《计算机应用》2012,32(7):2070-2073
针对语音识别性能受噪声干扰而显著降低的问题,提出一种采用特征空间随机映射(RP)的鲁棒性语音语音识别方法,并应用于汽车驾驶环境下的语音识别系统。首先,将原始语音特征参数采用随机矩阵线性映射到新的特征空间,使新的特征参数以最大概率保持原始特征之间距离的同时更加接近于高斯分布;然后训练隐马尔可夫模型(HMM),测试时结合多数投票表决方法对初始模式匹配结果进行判决并得到最终语音识别结果。采用日本情报处理学会车载环境下语音识别数据库CENSREC-2进行实验分析,结果表明,随机映射特征使得汽车驾驶环境下的语音识别性能有了很大改善。  相似文献   

16.
There is a large demand for more fashionable style Chinese characters in advertising, art designing and publishing markets. However, it becomes challenging to create a new font style for so many Chinese characters (over 10,000). To solve this problem, a comprehensive Chinese fonts generating scheme is proposed in this paper. Firstly, a decomposition database for stroke splitting and feature extraction is proposed. Secondly, stroke segmentation rules are defined based on splitting, merging and structural model, location definition and minimum feature extraction. Thirdly, a radical searching algorithm based on stroke splitting is presented. Finally, it is realized that the generated characters can be zoomed, rotated and moved. Experimental result shows that Chinese characters with a new style can be generated rapidly with the proposed scheme. The created characters fit the real ones well with a high fidelity of 96.4%. The usability tests are run and participants’ subjective report show that the performance from the generated characters is similar to the original characters in both recognizability test and style-consistency test. The fonts generating method is also reliable for the other stroke constructed block characters such as Japanese and Korean characters.  相似文献   

17.
18.
针对目前复杂环境下车牌汉字图像识别率较低,识别时间较长等问题,提出了一种基于伪Zernike矩和独立主成分分析(ICA)的改进概率神经网络(PNN)车牌汉字识别方法.该方法是将车牌汉字图像的伪Zernike矩通过独立主成分分析降维,再将降维后的特征输入所提出的一种基于代表点的改进概率神经网络中进行训练和识别,从而有效地实现车牌汉字的识别.将该方法应用于复杂环境下的车牌汉字图像识别实验,实验结果表明,该方法能有效地降低特征维数,减少识别时间,并能显著地提高车牌汉字的识别率.  相似文献   

19.
喻莹  杨扬  董才林 《计算机工程》2006,32(17):10-11,1
相似字多是造成汉字识别误识率和拒识率高的主要原因之一,该文提出了一种基于动态特征选择的相似字识别方法,其识别过程从初始提取全局特征开始,然后逐步动态地、递归地加入更精细的局部特征以提高识别的判决力,直至识别结果满足判决条件为止。这种方法不需要人工确定相似字组,而且能自动选择相似字间区别最大的部分空间,构成新的特征向量。通过实验验证,该方法使相似字的识别率有了显著提高,证明了该方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号