共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
3.
现在的时代是互联网的时代,随着网络资源的日益丰富,WEB上的图片资源也越来越丰富,图片内容也越来越精彩,吸引了大量网民对于图片的检索。图片检索技术中最常用的方法是基于文本的图片检索,是人们检索图片的主要手段,而基于文本的图片检索技术最核心的技术是图片相关文本的提取,图片相关文本提取技术会给图片检索的查全率和查准率带来最直接的影响。如何提高图片的检索率,是当代互联网基于文本的图片检索技术亟待解决的问题。 相似文献
4.
基于Web的文本挖掘研究 总被引:10,自引:6,他引:4
基于Web的文本挖掘是数据挖掘的重要组成部分,文章重点对文本特征提取、文本分类、文本聚类等Web文本挖掘关键实现技术做了介绍,最后讨论了Web文本挖掘的价值及其对Web发展的重要性。 相似文献
5.
文章首先介绍文本分类预处理的几种方法及其不足之处,并提出一种改进的特征提取方法。然后,介绍几种文本分类算法,并指出其缺点。最后本文介绍支持向量机算法,结合改进后的文本预处理方法对网络文本进行分类,并通过与KNN对比分析说明了该算法的高效性能。 相似文献
6.
9.
10.
11.
针对多方向排列的文本因其尺度变化大、复杂背景干扰而导致检测效果仍不甚理想的问题,本文提出了一种基于注意力机制的多方向文本检测方法。首先,考虑到自然场景下干扰信息多,构建文本特征提取网络(text feature information ResNet50,TF-ResNet),对图像中的文本特征信息进行提取;其次,在特征融合模型中加入文本注意模块(text attention module, TAM),抑制无关信息的同时突出显示文本信息,以增强文本特征之间的潜在联系;最后,采用渐进扩展模块,逐步融合扩展前部分得到的多个不同尺度的分割结果,以获得精确检测结果。本文方法在数据集CTW1500、ICDAR2015上进行实验验证和分析,其F值分别达到80.4%和83.0%,比次优方法分别提升了2.0%和2.4%,表明该方法在多方向文本检测上与其他方法相比具备一定的竞争力。 相似文献
12.
随着移动运营商网络IP化改造日益深入,运营商内部积累了大量跟IP化网络相关的文本,现有处理移动IP化网络文本的方法一般是采用人工分类归档的方式,这种手工的方法有很多不尽如人意的地方,本文在基于文本分类、聚类算法的基础上,提出了一套移动IP化网络文本分类聚类模型,该模型能够对移动IP化网络文本进行自动分类,并进行系统化管理。实验结果表明,该模型的文本分类准确率很高,改变了中国移动在开展IP化过程中缺乏智能化分析系统的现状,提高了网络维护的针对性、主动性、和前瞻性。 相似文献
13.
基于改进遗传算法的Web文本挖掘系统 总被引:1,自引:1,他引:0
余燕芳 《微电子学与计算机》2010,27(4)
文本分类是文本数据挖掘中一个非常重要的技术,已经被广泛地应用于信息管理、搜索引擎、推荐系统等多个领域.现有的文本分类方法很难适用于大规模的文本数据集.为此,提出了一种基于改进遗传算法的文本挖掘系统.提出的改进遗传算法极大地提高了文本挖掘系统的分类效率.实验结果表明,该方法适用于大规模文本数据集;该方法提取规则的分类正确率较高,分类速度较快. 相似文献
14.
本文提出一种基于概念图和简单语义分析相结合的文本过滤技术.利用概念图知识表示方法定义文本中概念间的语义倾向关系,把文本过滤问题转换成基于概念图的语义匹配问题.在使用概念图匹配推理中,利用敏感词汇分类和词语的褒贬性,有效简化过滤的匹配处理.经实际应用表明,基于概念图的倾向性文本过滤方法可以有效的识别和过滤倾向性文本信息. 相似文献
15.
一、概论 LG04’能提供一种宽范围的水平和垂直点密度,操作质量,仿真安装容易等特性。 标准特性 1.和计算机之间的接口:并口有——Dataprod-ucts并口,Centronics并口,IEEE1284并口;串口有——RS/232串口,RS/422串口。 2.打印机仿真:Digital LG,P-series,EPSONFX,Proprinter XL,IGP/PGL(上操作),IGP/VGL(下操作)。每一个仿真提供配置菜单,控制编码,字符集的不同设置,而打印机仿真是通过控制板进行选择的。 3.文本格式及语言选件:该打印机能提供如下输出特性: 相似文献
16.
陈小莹 《智能计算机与应用》2016,(6)
本文通过对藏文文本中不规范文本进行分类后,针对不同类型的文本特征制定规范化处理方法,最终实现了对藏文文本的规范化处理.但因藏文文本来源的不确定性,文本中可能会存在一些未收集到的不规范文本类型,需在后期的研究工作中继续收集整理. 相似文献
17.
众所周知,在Windows中有多种数据传送与共享手段,比如利用剪贴板可以方便地截取Windows应用程序及DOS下的屏幕内容,供其它文件使用。这在进行某些图形处理尤其是制作软件说明书的插图时是非常方便的。但在DOS环境下却难以做到这一点。在这里对于屏幕内容只能简单的进行拷屏操作得到它的硬拷贝,这并没有多大的实用价值。下面的程序成功地修改了DOS的拷贝功能,使DOS下绝大多数的文本屏幕内容可以按需要进行剪裁和存盘并形成文件。这样即可在一般的文本编辑器中对保存的内容进行调用,为利用DOS下文本屏幕的内容提供了一个途径。利用此程序为DOS下的程序制作说明书插图是非常方便的。 相似文献
18.
在分析了文本中重要事件识别和文本分类方法的基础之上,提出了一种基于重要事件的文本分类方法.重点研究了该方法涉及到的两个关键技术:以重要事件表示文本和获取文本类别的模板.在中文事件语料CEC上,使用本文介绍的文本分类方法得到的平均准确率达到80%,而使用传统的以词为特征的文本分类方法得到的平均准确率为72%. 相似文献
19.
20.
基于蚁群算法的文本分类和聚类 总被引:2,自引:1,他引:1
为了研究并提高文本的分类和聚类算法的性能,笔者根据蚁群算法在TSP问题中的应用方法,将其改进引用到文本的分聚类中。在文本聚类中,改变蚂蚁的信息素释放机制,道路节点的聚合方式,最终将相似文本进行聚合。在文本的分类中,将所需要的分类信息装入蚂蚁,蚂蚁根据系统外部所希望的方式将文本分类。实验结果证明,这种新的算法可以使文本分类和聚类的准确度提高,蚁群算法在文本分类聚类中的应用是可行的。 相似文献