首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 62 毫秒
1.
随着信息技术的发展,信息量呈几何级数增加,人们对信息资源的依赖性越来越大,如何实现信息的分类,尤其是中文文本信息的有效分类是目前中文信息处理研究的一个重要分支领域。本文主要从文本分类技术的角度阐述如何使用户不但能够方便地浏览文档,而且可以通过限制搜索范围来使文档的查找更为容易。  相似文献   

2.
文本数据挖掘在数字图书馆中的应用研究   总被引:2,自引:0,他引:2  
文本数据挖掘在数字图书馆中的应用进行探索研究,重点对数字图书馆文本分类的构建与实现进行研究,并将开方拟合检验方法、KNN分类算法等经典理论应用到数字图书馆文本分类模型中,以提高数字图书馆检索能力以及检索准确性。  相似文献   

3.
赵坤 《硅谷》2010,(8):64-64
研究基于文本内容的网页过滤技术,网页过滤的成效依赖于网页分类的精度,网页分类的准确与否依赖于网页文本内容抽取的效果,即通过分析网页内容,得到网页中的能够代表网页语义的文本信息。提出一种在同一网站中寻找相似网页的算法,它可以克服其他网页内容抽取方法中存在的弱点。  相似文献   

4.
聚类是一种无指导的分类方法,在没有预先定义好分类的情况下,将一个大的数据集合分成若干个簇,要求数据在同一个簇中相似度尽可能大,而不同簇之间相似度尽可能小。聚类作为数据挖掘的一种重要方法,现在越来越被人们所重视。目前常见的聚类方法有:基于划分的聚类方法、基于层次的聚类方法、基于局部的聚类方法和基于模型的聚类方法,吸取各类聚类算法的实质,提出一种预设阀值,逐一归类的简单聚类实现算法,并在后端对聚类结果做精确行处理,经实验验证该方法能达到一定的聚类效果。  相似文献   

5.
文本分类技术在搜索引擎中有很重要的用途,本文简要分析了文本分类的评估方法,应用于搜索引擎的分类过程,重点介绍了现行的文本自动分类方法,包括经典算法和新算法以及未来的发展趋势。  相似文献   

6.
7.
文本分类技术在搜索引擎中有很重要的用途,本文简要分析了文本分类的评估方法,应用于搜索引擎的分类过程,重点介绍了现行的文本自动分类方法,包括经典算法和新算法以及未来的发展趋势.  相似文献   

8.
提出了一种基于连通域的自动定位图像中场景文本的方法.该方法充分利用了场景文本的两类特征--字符特征和文本区域特征,同时对一些字符特征进行组合,组合得到的新字符特征能够对字符的大小、字体等有很好的不变性.该方法利用级联弱分类器将所有的特征组合到一个框架中,提高了处理速度.实验结果显示,该方法对字符的大小、颜色、语言等具有很好的鲁棒性,并具有较高的召回率.  相似文献   

9.
朴素贝叶斯分类算法是贝叶斯方法中最简单的一个方法,它具有很强的条件独立性,构造过程简单,不需要结构的搜索过程。修改过的分类算法比原朴素贝叶斯分类算法在对大多数文本进行分类时体现出更高的准确率。  相似文献   

10.
随着城市智能化的发展,12345民生服务热线成为广大市民表达诉求的重要渠道之一.民生服务热线所收集的数据蕴含了丰富的当地社会热点,这些文本数据往往具有长度不一、信息量大等特点,而城市诉求管理需要一种高效的分类方法来处理这些热点问题.在此首先阐述文本挖掘中的关键技术,在此基础上研究开发一个针对民生服务热线文本的民生热点挖掘系统,系统主要分为文本预处理、文本智能分类、民生热点挖掘三个功能模块,并借助可视化技术快速准确地分析出群众当前关心的热点,及时处理群众的诉求,使之有助于政府对社会民生建设的管理.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号