首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
依据公安情报文本中不同位置的词条对区分文本类别的贡献显著不同的特点,引入位置权重系数,改进了经典的文本特征权重计算方法(TF-IDF),使文本的权重能够更加全面地反映文本的类别信息。根据公安情报分类系统的需求,设计了基于支持向量机(SVM)的公安情报分类系统,该系统不仅能够实现情报文本的自动分类,而且能够保留在情报文本分类的不同阶段语料的特征信息,为情报信息的进一步加工处理提供支持,同时系统中各模块间采用松耦合的方式衔接,提高了系统的适应性和灵活性。通过实验验证了系统设计的合理性和有效性。  相似文献   

2.
刘清  陈炼  吕静 《现代计算机》2007,(10):14-16,57
介绍基于SVM的网络文本信息自动分类算法,该算法在训练阶段将一个大型数据集分成许多不相交的子集,按批次对各个训练子集中的样本进行训练而得到多个分类器,利用误差纠错输出编码优化分类器,从而减少较深层次训练需要学习的文档.  相似文献   

3.
路斌  杨建武  陈晓鸥 《计算机工程》2005,31(1):73-75,113
提出了一种新的基于反例文档选择的多层分类策略I-vs-brothers。与原策略相比,该策略在训练阶段仅仅选择兄弟节点包含的样例文档作为反例,从而减少了较深层次节点需要学习的文档。实验结果表明,在该文的实验条件下,基于该策略的算法使得训练效率提高了60%,而分类精度却基本上保持不变。该策略还可以用在I-vs-I之上形成I-vs-brother策略,用来减少多层分类情况下节点训练时需要对比学习的节点数目。  相似文献   

4.
基于SVM的中文文本自动分类研究   总被引:1,自引:0,他引:1  
详细介绍了进行文本分类的过程,并着重介绍了一种新的基于结构风险最小化理论的分类算法——支持向量机,通过实验比较支持向量机算法和传统的KNN算法应用于文本分类的效果,证实了支持向量机在处理文本分类问题上的优越性。  相似文献   

5.
自动分类技术在企业竞争情报系统中的应用   总被引:3,自引:0,他引:3  
论文介绍了基于支持向量机(SVM)方法的自动分类技术,以及该项技术在企业竞争情报系统中实现情报资料自动分类的应用,通过对测试结果的评估表明,这种基于统计学习原理的自动分类方法能够达到较好的效果,实现企业情报资料智能化预处理功能。  相似文献   

6.
基于SVM的墙地砖颜色自动分类   总被引:1,自引:0,他引:1  
苏彩红  朱学峰  刘笛 《计算机仿真》2004,21(12):179-181
支持向量机(SVM)是一种采用结构风险最小化原则的新的机器学习方法,具有完备的理论基础。该文首次把支持向量机技术应用于墙地砖的自动分类,首先通过对墙地砖图像的RGB通道进行小波分解,由于不同通道的相关性,故提取其协变信号作为特征集,再构建二叉树形式的决策树来实现SVM多类分类,然后对墙地砖进行了颜色分类实验,并与knn分类结果对比,实验结果证明SVM分类器具有更高的分类准确率。  相似文献   

7.
Email自动分类已成为半结构化文本信息自动处理的研究热点。本文在时已有Email自动分类方法深入研究的基础上,提出了一种基于SVM和领域综合特征的Email自动分类方法。主要包括:一是将SVM引入到Email自动分类研究中,并对SVM学习算法中的核函数和参数选择进行了探讨;二是鉴于词频的特征表示方法难以准确表示Email主要内容,因此将领域知识引入Email特征表示中,并在此基础上提出了一种综合领域知识和词频的特征表示方法,用于Email分类。该方法是在词频特征的基础上加入人工总结出的领域特征,从而更能准确地表示Email的主要内容,以提高Email分类的平均F-score。通过实验,验证了基于SVM和领域综合特征的Email自动分类方法能有效地提高Email自动分类处理的准确性。  相似文献   

8.
支持向量机(Support Vector Machine,SVM)是一种基于统计学习理论的机器学习方法,由于其出色的学习性能,早已成为当前机器学习界的研究热点;而决策树是一种功能强大且相当受欢迎的分类和预测工具。本文重点介绍支持向量机与决策树结合解决多分类问题的算法,并对其进行评析和总结。  相似文献   

9.
一种基于选择性集成SVM的新闻音频自动分类方法   总被引:1,自引:0,他引:1  
作为视频检索的一种重要线索,音频检测和分类受到广泛关注并已成为一个热门的研究方向.在新闻视频先验模型和结构的基础上,提出一种基于选择性集成SVM(SEN-SVM)的分类器设计方法.从而将新闻视频划分成静音、音乐、语音和带有背景音乐的语音这4种类型.用8 514s的真实新闻音频数据所作的仿真实验结果表明:所提出基于选择性集成SVM的新闻音频自动分类算法的平均准确率高达98.2%,远远高于单纯基于SVM的方法和传统的基于门限的方法.  相似文献   

10.
支持向量机是在模式分类中表现优秀的一种分类方法。对现有的基于SVM的文本多类分类方法进行了介绍和比较.研究了分类器特征空间模式问题,在这些工作基础上,提出了并行SVM的模型。  相似文献   

11.
公安网络系统安全问题是公安部门网络系统建设必须考虑的首要技术问题,是一项系统工程。分析了公安信息通信网络中面临的安全问题及安全需求,通过建立安全体系结构模型,从通信平台、网络平台、系统及应用平台、安全管理平台等几个方面对网络安全的相关技术进行了研究,探讨了每个层次实现的思路和方法。  相似文献   

12.
杨为民  李龙澍 《微机发展》2007,17(2):135-137
信息检索的一个核心问题是自动文本分类。基于分类体系的文本分类需要全文抽取主题词、计算权重,再根据分类体系对文献进行分类。文中构建一种基于Agent技术的文本自动分类系统,仅需要对文档头进行信息处理就可以进行快速文本分类,有效地减少了文本分类过程中的时间和空间的消耗。  相似文献   

13.
基于SVM的维吾尔文文本分类研究   总被引:1,自引:0,他引:1       下载免费PDF全文
文本自动分类技术在提高文本信息利用的有效性和准确性上具有重要的现实意义和广阔的应用前景。随着Internet上维吾尔文信息的迅速发展,维吾尔文文本分类成为处理和组织这些大量文本数据的关键技术。研究维吾尔文文本分类相关技术和方法,针对维吾尔文文本在向量空间模型表示下的高维性,本文采用词干提取和χ2统计量相结合的方法对表示空间进行降维。采用SVM算法构造了维吾尔文文本分类器。针对维吾尔文文本分类语料进行的实验结果表明,SVM分类器的MacroF1值达到了84.6%,明显好于kNN方法。  相似文献   

14.
公安信息网络是公安系统统一指挥、快速反应、协调作战、打击犯罪的一个内部网络平台,公安网络的安全对于提高互联网安全监控能力、建设网络犯罪监察与防范体系有至关重要的作用。如何在科技进步所带来的安全问题下确保公安信息网络的安全使用是我们每位民警都值得思考的一个问题。  相似文献   

15.
近年来,随着我国改革开放的不断深入和经济的高速发展,使得我国在各个行业领域内高科技软件和设备逐渐升级,对于保护人们生命和财产安全的我国公安系统来说,公安信息化是实现我国公安工作现代化的重要前提,所以,对于当前的公安系统而言,公安信息网络的安全保障工作直接关系到公安工作的效率和成果。本文首先对我国公安信息化工作的进程做了简要叙述,然后对公安信息网络安全保障方面存在的问题进行了分析,最后针对公安信息网络安全保障存在的问题提出了一些措施和建议。  相似文献   

16.
一种用于文本分类的语义SVM及其在线学习算法   总被引:1,自引:1,他引:1  
该文利用SVM在小训练样本集条件下仍有高泛化能力的特性,结合文本分类问题中同类别文本的特征在特征空间中具有聚类性分布的特点,提出一种使用语义中心集代替原训练样本集作为训练样本和支持向量的SVM:语义SVM。文中给出语义中心集的生成步骤,进而给出语义SVM的在线学习(在线分类知识积累)算法框架,以及基于SMO算法的在线学习算法的实现。实验结果说明语义SVM及其在线学习算法具有巨大的应用潜力:不仅在线学习速度和分类速度相对于标准SVM及其简单增量算法有数量级提高,而且分类准确率方面具有一定优势。  相似文献   

17.
本文针对地理课程自动解题,采用SVM学习算法实现地理试题自动分类。通过采用TFIDF技术提取地理试题文本中的特征关键词,并选取LibSVM中的Linear核函数进行训练,以构建用于地理试题分类的预测模型。在所收集的地理试题集上的实验结果表明,在22个试题类别上的单类分类精度达到80%以上,整体分类精度也达到了87%。  相似文献   

18.
支持向量机在文本分类中的应用   总被引:1,自引:0,他引:1  
文中提出了基于朴素贝叶斯的支持向量机的分类方法,首先采用文本预处理,再根据文本的特征进行特征降维,然后用基于朴素贝叶斯的算法对支持向量机进行训练后,再对新的文本进行分类。实验表明,该方法比传统的SVM算法具有较高的准确率。  相似文献   

19.
公安院校信息安全课程教学探微   总被引:3,自引:0,他引:3  
本文介绍了在公安院校中信息安全课程的培养目标;阐明了信息安全教学的正确导向;分析了信息安全课程教学的思路与实践;最后结合典型的案例,对课堂教学方法进行了探讨。  相似文献   

20.
实时文本分类系统的研究与实现   总被引:5,自引:1,他引:4  
分析文本分类过程中影响实时性的因素,即分词处理高耗时和特征空间维数过高问题。结合网页过滤的实时应用提出一种实时文本分类方法,弱化分词处理过程,降低特征空间维数,以提高分类速度。通过优化特征项选取维持分类效果,基于贝叶斯理论实现实时文本分类系统。实验结果表明,该方法在维持精确率和召回率分别为85%, 94%的情况下,显著提高了分类速度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号