共查询到10条相似文献,搜索用时 328 毫秒
2.
3.
介绍文本分类的研究背景、关键技术;总结经典文本分类方法;讨论目前新涌现的分本分类模型及面临的问题,并对文本分类趋势进行展望。 相似文献
4.
文中提出一个IPBPS(Interconnected Processor-Based Parallel Sorting)并行分类算法,运行在由独立处理器构成的计算机网络上,以解决网络分布式数据库的分类计算问题。基于并行算法应与并行计算的拓扑结构相匹配的思想,设计了一种旨在减小处理器间通信开销的网络结构。在此并行计算环境中,每个处理器执行同样的程序,计算负载均匀分布在每个处理器中,具有较高的加速比。同时,这种基本的处理器互联结构可灵活扩展,且随着网络的扩大,算法的并行加速比更高。 相似文献
5.
介绍了以单面判别平面、最优权重向量和权位判定逻辑为基本思想的分段线性分类方法(PLC)。在多时相数字视频数据实浏中,PLC的处理速度虽略低于平行六面休分类法(PPC),却远高于高斯最大似然分类法(GMLC);而PLC的分类精度不但与GMLC相近,且远高于PPC。实验表明,在遥感作物分类精度和运算速度方面,PLC是比GMLC或PPC更优的选择。 相似文献
6.
随着Internet上信息量的飞速增长,成千上万的网上文档需要分类以方便用户的测览和获取。因此文档的自动分类工作已经越来越受到重视,一些相应的分类方法也应运而生。但其中很少有涉及到“层次化”的分类领域,且绝大多数方法仅仅返回单个分类结果。文中,我们提出了一种新的文档自动分类方法:MRHC(Multicategory-Returned Algorithm for Hierarchical aassification)。该方法着眼于屡次化的分类技术,并在适当的情况下为文档返回多个分类结果。该方法中结合了特征削减和增量学习技术以便提高分类性能。最后,为了更加准确、客观的评价分类结果,提出了一种新的评估方法:LEP(Length-of-Error-Path)。实验结果表明,提出的分类方法响应时间短,分类准确度高,具有较强的实用性。 相似文献
7.
8.
基于方向性的VQ分类编码算法 总被引:2,自引:2,他引:0
该文提出了一种基于图像块方向性的分类码书的生成方法,并提出与之相适应的分类编码算法。实验结果表明:用分类码书配合分类编码算法对图像进行编码可以大幅提高图像编码速度。在PSNR仅降低1.8%的情况下,编码速度平均提高38.4%。最高可以提高45.8%。 相似文献
9.
基于密度的kNN文本分类器训练样本裁剪方法 总被引:36,自引:2,他引:36
随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术。kNN方法作为一种简单、有效、非参数的分类方法,在文本分类中得到广泛的应用。但是这种方法计算量大,而且训练样本的分布不均匀会造成分类准确率的下降。针对kNN方法存在的这两个问题,提出了一种基于密度的kNN分类器训练样本裁剪方法,这种方法不仅降低了kNN方法的计算量,而且使训练样本的分布密度趋于均匀,减少了边界点处测试样本的误判。实验结果显示,这种方法具有很好的性能。 相似文献
10.
基于朴素贝叶斯分类器邮件分类系统的改进 总被引:1,自引:0,他引:1
目前朴素贝叶斯分类方法在电子邮件分类起到了良好的效果,但是并不能100%区分垃圾邮件与非垃圾邮件,然而在商业应用中,我们不能遗漏任何一封重要邮件。本文先简单介绍Bayes方法,然后提出一种对目前的Bayes分类方法的改进思想和方法。 相似文献