首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
基于SVM的中文文本自动分类研究   总被引:1,自引:0,他引:1  
详细介绍了进行文本分类的过程,并着重介绍了一种新的基于结构风险最小化理论的分类算法——支持向量机,通过实验比较支持向量机算法和传统的KNN算法应用于文本分类的效果,证实了支持向量机在处理文本分类问题上的优越性。  相似文献   

2.
中文网页分类技术是数据挖掘中一个研究热点领域,而支持向量机(SVM)是一种高效的分类识别方法,在解决高维模式识别问题中表现出许多特有的优势.提出了基于支持向量机的中文网页分类方法,其中包括对该过程中的网页文本预处理、特征提取和多分类算法等关键技术的介绍.实验表明,该方法训练数据规模大大减少,训练效率较高,同时具有较好的精确率和召回率.  相似文献   

3.
研究哈萨克语自动文本分类,并实现哈萨克语文本自动分类系统.系统首先对测试语料进行特征提取,而后生成训练模型.其次,对训练语料进行特征提取生成SVM向量.最后,给出测试文本的分类结果.同时对哈萨克语单词切分和未切分进行分类对比,得出未切分单词可以得出更好的分类效果.  相似文献   

4.
基于SVM算法的文本分类技术研究   总被引:9,自引:0,他引:9  
在优化分类技术的研究中,文本特征化后通常具有高维性和不平衡性的特点,导致传统的分类算法准确率不高的问题.针对文本分类器的性能容易受到核函数和参数的影响的问题,为提高文本分类器的准确性.采用支持向量机(SVM)的理论在文本分类技术同时将根据优化的粒子群算法(PSO)引入SVM分类算法中进行优化文本分类器的参数,将分类器的准确率作为PSO算法适应度函数通过粒子移动操作找出最佳参数并用SVM算法进行分类.在文本数据集上的仿真结果表明,与传统的算法相比,经PSO算法优化后的SVM文本分类器的准确性更高,PSO算法是一种有效的优化方法,能广泛应用于文本分类问题.  相似文献   

5.
姜鹤  陈丽亚 《微机发展》2010,(3):17-19,23
随着互联网的迅速发展,面向重要网络媒体海量发布信息实现智能分类,对于网络信息监管、舆论引导工作有着深远的意义。文中针对在文本分类中的特征选取问题,描述了一种基于法矢量权重的特征评价和选取方法。将此方法与SVM学习算法进行结合,在路透社标准文本测试集上进行了对比评估。实验结果显示,此特征选取方法相对于传统的特征选取方法可以产生更优的分类性能。此特征提取方法提供一种有效的途径,在基本保持分类器性能的前提下显著地减少特征空间的维数,进而提升系统的资源利用效率。  相似文献   

6.
SVM文本分类中一种新的特征提取方法   总被引:1,自引:0,他引:1  
随着互联网的迅速发展,面向重要网络媒体海量发布信息实现智能分类,对于网络信息监管、舆论引导工作有着深远的意义。文中针对在文本分类中的特征选取问题,描述了一种基于法矢量权重的特征评价和选取方法。将此方法与SVM学习算法进行结合,在路透社标准文本测试集上进行了对比评估。实验结果显示,此特征选取方法相对于传统的特征选取方法可以产生更优的分类性能。此特征提取方法提供一种有效的途径,在基本保持分类器性能的前提下显著地减少特征空间的维数,进而提升系统的资源利用效率。  相似文献   

7.
基于SVM的图像纹理特征分类研究   总被引:2,自引:0,他引:2       下载免费PDF全文
支持向量机(SVM)是一种表现卓越的分类方法,而灰度共生矩阵(GLCM)则是一种很好的纹理分析方法,故而本文提出了一种使用灰度共生矩阵进行特征提取的应用支持向量机的纹理特征分类法。实验结果表明,与直接应用灰度信息进行分类的支持向量机算法相比,本文方法可以取得更为准确的分类结果。  相似文献   

8.
传统的垃圾短信过滤方案,以垃圾短信中出现的敏感词作为判断的依据,却忽略了正常短信中出现的词对分类的贡献,并且由于短信用语的灵活性,特征提取难度较大。提出了一种基于svm算法对垃圾短信进行监控和过滤的方案,该方案根据短信内容、短信长度等特征,对短信文本进行向量空间的表示。通过机器学习的方式,对垃圾短信进行判断,过滤。相比传统方法而言,本系统在过滤准确度和效率两方面均获得大幅度提升。  相似文献   

9.
利用SVM(Support Vector Machine)解决二类分类问题的优势,设计了一个粗细两级指纹分类体器,提出并实现了一种新型的指纹分类算法。测试结果表明,该分类器具有很好的泛化能力,对于新样本分类的正确率达98.5%,具有一定的实用价值。  相似文献   

10.
基于多特征提取和SVM分类器的纹理图像分类   总被引:1,自引:0,他引:1  
能够从大量高分辨率遥感图像中识别出各种感兴趣的目标并进行归类,是一种具有广泛应用前景的技术需求.实验以MATLAB为平台,应用Gabor滤波器、高斯马尔柯夫随机场(GMRF)和灰度共生矩阵(GLCM)三种纹理图像特征提取算法对当前广泛应用于纹理图像分类的样本集brodatz光学数据库图像进行特征提取;然后在二分类支持向...  相似文献   

11.
为了在大量网络Web页面中快速找到用户关心的内容,提出使用词汇之间的"相关度"来存储用户的个性化信息,应用能够在用户进行检索的过程中自动建立针对该用户的"词汇相关度"的算法设计了一个个性化元搜索引擎,并通过使用3种不同的利用词汇相关度对底层搜索引擎所返回的结果进行评估和个性化排序的算法进行实验.这里设计的个性化算法的灵敏度、抗干扰性、语义相关性分析3个指标的实验结果说明该算法最终会影响到网页的排序.基于统计方法的词汇相关度模型是一种有效的个性化信息检索技术,它可以大大提高搜索结果的质量.  相似文献   

12.
网络搜索是目前从因特网上获取信息的主要手段,而网络蜘蛛又是大多数网络搜索工具获取网络信息的主要方法,主题搜索策略是专业搜索引擎的核心技术.通过研究网络蜘蛛的工作原理,分析了网络蜘蛛的搜索策略和搜索优化措施,设计出一种将限制搜索深度.多线程技术和正则表达式匹配方法结合一起的网络蜘蛛,实验结果表明该方法能够快速而准确地搜索所需的相关主题信息.  相似文献   

13.
基于WEB的面向主题搜索引擎的设计与实现   总被引:3,自引:2,他引:3  
针对目前通用搜索引擎所搜索到的结果过多、与主题相关性不强的情况,提出了面向主题的搜索引擎,并从系统结构方面将系统划分为特征提取、存取分析以及搜索控制等3个子系统,并给出了其具体的实现策略。  相似文献   

14.
针对传统字频统计方法周期长、代价高的弱点,提出了一种利用互联网内容并借助搜索引擎检索进行汉字模糊字频统计的全新方法,有效利用了网络时代的相关技术和发展成果,在一定程度上缓解了字频统计需求频繁的和传统统计方法的低效且代价高昂之间的矛盾,同时对该方法进行了实例化的分析、验证和改进.  相似文献   

15.
基于SVM的哈萨克语文本分类   总被引:1,自引:0,他引:1  
介绍了支持向量机(SVM)和k-最近邻法(kNN)分类算法的思想和两种哈萨克语特征提取方法。对SVM、kNN和Bayes算法在哈萨克语文本分类的实验进行了比较。实验结果表明:在处理哈萨克语文本分类问题上,SVM较kNN和Bayes有较好的分类效果。由于哈萨克文单词的语素和构形的特点,若对哈萨克语词缀进行切分,则会降低文本分类的准确率和查全率。  相似文献   

16.
为了有效提取表面肌电信号SEMG(Surface Electromyographic)的特征,更好的识别人体上肢运动模式,提出了一种小波包核主元分析(WPKPCA)和支持向量机(SVM)相结合的新方法。通过虚拟仪器采集桡侧腕屈肌和肱桡肌两路表面肌电信号,应用小波包核主元分析法对表面肌电信号进行特征提取,采用支持向量机对表面肌电信号特征数据进行分类识别。实验结果表明,采用此方法能够从表面肌电信号中识别出握拳、展拳、手腕内翻和手腕外翻4种动作,更能有效提取表面肌电信号信息,动作识别率高达98%。  相似文献   

17.
不良文本识别的实际应用中,大多数文本之间总有交界甚至彼此掺杂,这种非线性不可分问题给不良文本识别带来了难度。应用 SVM 通过非线性变换可以使原空间转化为某个高维空间中的线性问题,而选择合适的核函数是 SVM 的关键。由于单核无法兼顾对独立的不良词汇和词汇组合的识别,使识别准确率不高,而且也无法兼顾召回率。针对不良文本识别的特定应用,依据 Mercer 定理结合线性核与多项式核提出了一种新的组合核函数,这种组合核函数能兼顾线性核与多项式核的优势,能够实现对独立的不良词汇以及词汇组合进行识别。在仿真实验中评估了线性核、齐次多项式核以及组合核函数,实验结果表明组合核函数的识别准确率与召回率都比较理想。  相似文献   

18.
利用SVM进行车型识别   总被引:5,自引:0,他引:5  
为了提高车辆图像的识别率,提出了利用支持向量机(SVM)理论进行轿车车型识别方法.SVM能够解决线性及非线性分类问题,以较少的支持向量确定分类面,对样本数量及维数不敏感.基于颜色直方图及惯性比确定的图像特征具有平移、旋转和尺度不变性,可以用来确定SVM的最优分类面,并由此识别车型.  相似文献   

19.
为了利用网络资源进行化学教学,提出了使用全文文档检索技术整合网络资源进行教学的模式。该技术由3部分组成:一是文档系统,各种格式的文档以文件的形式在服务器硬盘上使用文件系统进行组织。二是全文检索系统,使用Index Server对文档进行过滤和索引。三是检索系统,以IIS(Internet Information Server)为Web服务器,利用ADO访问Index Server数据库,使用ASP编程,实现检索和排序。实践证明该模式实现容易,操作简单,性能优秀,适合于大学化学教学。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号