首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于文本比较算法,以算法的比较为切入点,通过比较算法的时间复杂度,找出适应文本的算法。实验结果表明,Nakatsu算法在长文本和相似度高的文本中效率更高,更易使用。  相似文献   

2.
随着信息技术的发展,信息量呈几何级数增加,人们对信息资源的依赖性越来越大,如何实现信息的分类,尤其是中文文本信息的有效分类是目前中文信息处理研究的一个重要分支领域。本文主要从文本分类技术的角度阐述如何使用户不但能够方便地浏览文档,而且可以通过限制搜索范围来使文档的查找更为容易。  相似文献   

3.
闫政  王年锁 《信息通信》2013,(3):156-157
现在的时代是互联网的时代,随着网络资源的日益丰富,WEB上的图片资源也越来越丰富,图片内容也越来越精彩,吸引了大量网民对于图片的检索。图片检索技术中最常用的方法是基于文本的图片检索,是人们检索图片的主要手段,而基于文本的图片检索技术最核心的技术是图片相关文本的提取,图片相关文本提取技术会给图片检索的查全率和查准率带来最直接的影响。如何提高图片的检索率,是当代互联网基于文本的图片检索技术亟待解决的问题。  相似文献   

4.
基于Web的文本挖掘研究   总被引:10,自引:6,他引:4  
基于Web的文本挖掘是数据挖掘的重要组成部分,文章重点对文本特征提取、文本分类、文本聚类等Web文本挖掘关键实现技术做了介绍,最后讨论了Web文本挖掘的价值及其对Web发展的重要性。  相似文献   

5.
李倩 《电子技术》2014,(10):8-11
文章首先介绍文本分类预处理的几种方法及其不足之处,并提出一种改进的特征提取方法。然后,介绍几种文本分类算法,并指出其缺点。最后本文介绍支持向量机算法,结合改进后的文本预处理方法对网络文本进行分类,并通过与KNN对比分析说明了该算法的高效性能。  相似文献   

6.
TIFF文本介绍   总被引:2,自引:0,他引:2  
说起TIFF,很多使用过扫描仪或做过图像处理、图像印刷的人都不会感到陌生。在目前许许多多的扫描仪配套图像扫描软件中都可以生成TIFF文件;国内外的各种各样的桌面电子印刷系统中也多以TIFF为其图像的标准文本;并且,目前的许多图像处理软件和多媒体著作平台也都支持TIFF文件的输入、输出。  相似文献   

7.
8.
刺客 《新潮电子》2000,(11):106-107
  相似文献   

9.
GIF文本介绍   总被引:1,自引:0,他引:1  
GIF(GIF是Graphic Inter-change Format的缩写),是美国CompuServe Incorporated公司定义的一种在线式静态彩色图象文件传输和交换的协议。它采用了LZW(Lempel-Ziv)压缩技术作为其图象数据的存贮,支持多个24位真彩色图象块共存,并独立于图象生成和显示的具体硬件环境。因此,GIF图象文件对通常的彩色图象具有较高的数据压缩和令人满意的彩色图象描述的支持。目前,伴随CompuServe网络的扩大,GIF成为在许多图象处理软件和多媒体著作平台上较为流行的一种图象文本格式。  相似文献   

10.
袁海  陈康  陶彩霞  陈翀 《电信科学》2014,(4):114-122
文本可视化是数据可视化的新兴主题,其目的是让人直观地认识数据,敏捷地发现数据中隐藏的规律。首先介绍了文本可视化的过程,包括信息收集、预处理、视觉呈现和交互功能等;然后通过分析和使用各种中文文本可视化的工具,从基于标签云、树图、关联和时间序列等多方面研究可视化技术;最后对比了这几种技术的差异和优缺点,并指出各技术的适用场景。文本可视化能够更好地帮助用户处理日益增长的文本信息,提高数据的可视化效率和转换成利益的效率。  相似文献   

11.
针对多方向排列的文本因其尺度变化大、复杂背景干扰而导致检测效果仍不甚理想的问题,本文提出了一种基于注意力机制的多方向文本检测方法。首先,考虑到自然场景下干扰信息多,构建文本特征提取网络(text feature information ResNet50,TF-ResNet),对图像中的文本特征信息进行提取;其次,在特征融合模型中加入文本注意模块(text attention module, TAM),抑制无关信息的同时突出显示文本信息,以增强文本特征之间的潜在联系;最后,采用渐进扩展模块,逐步融合扩展前部分得到的多个不同尺度的分割结果,以获得精确检测结果。本文方法在数据集CTW1500、ICDAR2015上进行实验验证和分析,其F值分别达到80.4%和83.0%,比次优方法分别提升了2.0%和2.4%,表明该方法在多方向文本检测上与其他方法相比具备一定的竞争力。  相似文献   

12.
随着移动运营商网络IP化改造日益深入,运营商内部积累了大量跟IP化网络相关的文本,现有处理移动IP化网络文本的方法一般是采用人工分类归档的方式,这种手工的方法有很多不尽如人意的地方,本文在基于文本分类、聚类算法的基础上,提出了一套移动IP化网络文本分类聚类模型,该模型能够对移动IP化网络文本进行自动分类,并进行系统化管理。实验结果表明,该模型的文本分类准确率很高,改变了中国移动在开展IP化过程中缺乏智能化分析系统的现状,提高了网络维护的针对性、主动性、和前瞻性。  相似文献   

13.
基于改进遗传算法的Web文本挖掘系统   总被引:1,自引:1,他引:0  
文本分类是文本数据挖掘中一个非常重要的技术,已经被广泛地应用于信息管理、搜索引擎、推荐系统等多个领域.现有的文本分类方法很难适用于大规模的文本数据集.为此,提出了一种基于改进遗传算法的文本挖掘系统.提出的改进遗传算法极大地提高了文本挖掘系统的分类效率.实验结果表明,该方法适用于大规模文本数据集;该方法提取规则的分类正确率较高,分类速度较快.  相似文献   

14.
本文提出一种基于概念图和简单语义分析相结合的文本过滤技术.利用概念图知识表示方法定义文本中概念间的语义倾向关系,把文本过滤问题转换成基于概念图的语义匹配问题.在使用概念图匹配推理中,利用敏感词汇分类和词语的褒贬性,有效简化过滤的匹配处理.经实际应用表明,基于概念图的倾向性文本过滤方法可以有效的识别和过滤倾向性文本信息.  相似文献   

15.
一、概论 LG04’能提供一种宽范围的水平和垂直点密度,操作质量,仿真安装容易等特性。 标准特性 1.和计算机之间的接口:并口有——Dataprod-ucts并口,Centronics并口,IEEE1284并口;串口有——RS/232串口,RS/422串口。 2.打印机仿真:Digital LG,P-series,EPSONFX,Proprinter XL,IGP/PGL(上操作),IGP/VGL(下操作)。每一个仿真提供配置菜单,控制编码,字符集的不同设置,而打印机仿真是通过控制板进行选择的。 3.文本格式及语言选件:该打印机能提供如下输出特性:  相似文献   

16.
本文通过对藏文文本中不规范文本进行分类后,针对不同类型的文本特征制定规范化处理方法,最终实现了对藏文文本的规范化处理.但因藏文文本来源的不确定性,文本中可能会存在一些未收集到的不规范文本类型,需在后期的研究工作中继续收集整理.  相似文献   

17.
众所周知,在Windows中有多种数据传送与共享手段,比如利用剪贴板可以方便地截取Windows应用程序及DOS下的屏幕内容,供其它文件使用。这在进行某些图形处理尤其是制作软件说明书的插图时是非常方便的。但在DOS环境下却难以做到这一点。在这里对于屏幕内容只能简单的进行拷屏操作得到它的硬拷贝,这并没有多大的实用价值。下面的程序成功地修改了DOS的拷贝功能,使DOS下绝大多数的文本屏幕内容可以按需要进行剪裁和存盘并形成文件。这样即可在一般的文本编辑器中对保存的内容进行调用,为利用DOS下文本屏幕的内容提供了一个途径。利用此程序为DOS下的程序制作说明书插图是非常方便的。  相似文献   

18.
在分析了文本中重要事件识别和文本分类方法的基础之上,提出了一种基于重要事件的文本分类方法.重点研究了该方法涉及到的两个关键技术:以重要事件表示文本和获取文本类别的模板.在中文事件语料CEC上,使用本文介绍的文本分类方法得到的平均准确率达到80%,而使用传统的以词为特征的文本分类方法得到的平均准确率为72%.  相似文献   

19.
文本伪装算法研究   总被引:17,自引:0,他引:17       下载免费PDF全文
钮心忻  杨义先 《电子学报》2003,31(3):402-405
本文提出了文本伪装的一种新的算法,它是将不具有冗余度的文本信号通过信号处理的变换后,得到具有冗余度的信号,再对冗余信号进行文本的伪装.其效果是,该算法可以实现用一段普通文本来掩饰机密文本的传输,并且该算法具有一定的抵抗干扰的能力.  相似文献   

20.
基于蚁群算法的文本分类和聚类   总被引:2,自引:1,他引:1  
为了研究并提高文本的分类和聚类算法的性能,笔者根据蚁群算法在TSP问题中的应用方法,将其改进引用到文本的分聚类中。在文本聚类中,改变蚂蚁的信息素释放机制,道路节点的聚合方式,最终将相似文本进行聚合。在文本的分类中,将所需要的分类信息装入蚂蚁,蚂蚁根据系统外部所希望的方式将文本分类。实验结果证明,这种新的算法可以使文本分类和聚类的准确度提高,蚁群算法在文本分类聚类中的应用是可行的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号