首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 57 毫秒
1.
针对垃圾短信分类问题, 提出了一种以词贡献度为基础的分类方法。该方法引入词贡献度的概念表达词在不同短信分类中的权重差别,通过构建词贡献度——分类矩阵和计算矩阵行均方差来实现降维,以词贡献度为基础计算短信隶属于短信分类的隶属度,并通过比较隶属度密度的方法解决分类冲突问题。实验结果表明,该方法在分类效果和实时性方面优于其他常用垃圾短信分类方法。  相似文献   

2.
主要介绍了文本分类问题,讨论了文本分类所涉及的关键技术,包括中文分词,文本表示,特征选取方法,以及Rocchio、朴素贝叶斯、K近邻、决策树、神经网络和支持向量机等文本分类算法的原理和方法.最后,给出了基于文本分类技术的中文垃圾短信过滤方法的实验和结果.  相似文献   

3.
针对目前垃圾短信日益猖獗的现象,研究了一种基于内容的垃圾短信过滤策略。对训练语料进行分词和统计,计算信息增益并通过选取信息增益较大的若干特征项实现特征降维。在短信分类器的设计上,依据朴素贝叶斯算法,进行改进,减小了个别特征项对判断结果的直接影响,使得分类策略更能综合所有特征项的影响因素。实验结果表明,该方法对于手机用户能取得较好的垃圾短信过滤效果。  相似文献   

4.
设计并实现中文垃圾短信过滤器,能够较好识别不断变化的垃圾短信。以逻辑回归模型为基础,提出字节级n元文法提取短信特征,并采用TONE(Train On or Near Error)方法训练过滤器。通过实验测试,证明应用该方法实现的垃圾短信过滤效果很好。  相似文献   

5.
一个大规模垃圾短信实时过滤系统   总被引:1,自引:0,他引:1  
在分析现有短信监控系统不足的基础上,结合文本分类技术和行为识别技术,设计了一种垃圾短信监控和过滤系统. 系统综合考虑短信发送行为特征、短信文本内容等特点,并采用实时分类和离线分类相结合的方法进行高效短信过滤. 此外,还设计了一组基于反馈的自学习机制,使分类器具备增量式学习能力. 与传统方法相比,本文方法在过滤效率和准确率两方面均获得大幅度提升.  相似文献   

6.
基于互信息规则剪枝的关联文本分类   总被引:1,自引:0,他引:1  
传统的关联文本分类算法产生的规则数量巨大,若不对规则剪枝会影响分类效率,而采用以前的剪枝方法又会使分类精度出现不同程度的下降.为此提出以互信息的方法对每个类的规则进行剪枝,挑选出分类能力强的规则构成分类器,对待分类文本进行分类.经过这个方法剪枝后的规则数量大幅减少,且能取得比规则集未修剪过的分类器和采用以前剪枝方法的ARC-BC算法更好的分类效果,大量的实验表明此方法是有效的.  相似文献   

7.
提出了基于频繁闭项集的新关联分类算法ACCF。ACCF首先挖掘出所有频繁闭项集(CFIs)和候选分类关联规则,然后从候选分类关联规则中产生和筛选出若干规则,并用其构建分类器;在分类应用时,采用了一种新的匹配方式对分类实例进行分类。通过理论分析和对18个UCI公共数据集的实验结果表明,ACCF不仅能挖掘出高质量且不丢失信息的关联分类规则,而且大大减少了关联分类规则的数量,在分类准确率上也比现有的关联分类典型算法更高。  相似文献   

8.
基于朴素贝叶斯和支持向量机的短信智能分析系统设计   总被引:2,自引:0,他引:2  
为了解决垃圾短信的骚扰问题,提出了一种基于朴素贝叶斯和支持向量机的短信智能分析系统架构。考虑朴素贝叶斯的快速统计分类及支持向量机的增量训练等特点,将其应用于垃圾短信过滤中,并对关键词库进行及时更新,使得系统具有更好的自适应性。对某移动通信运营商提供的12万条短信进行反复实验,结果表明:该方法可有效地解决当前垃圾短信过滤系统中存在的问题。  相似文献   

9.
波形的自动分类   总被引:4,自引:0,他引:4  
给出了一种新的波形链表达模型,提出了一种新的波峰分类方法,并给出了识别算法。所提方法数学概念清楚,易于计算机实现,可用于具有结构特征的信号的识别。  相似文献   

10.
为避免信息超载而在过多的无用信息中迷失方向,信息检索的重要性日益提高。文本自动分类是信息检索中最重要的工具之一。提出了一个用于中文文本自动分类的、称为关联规则辅助的遗传计算方法(AssociationRulesAidedGeneticComputingMethod,缩写为ARGCM)。提出并实现了文本分类的关联规则辅助的遗传算法;不同于前人的路线,适应度函数的编码借助了关联规则,而关联规则通过此文提出的ARGACM算法挖掘;实现了并测试了一系列基础遗传过程,例如AGACMRouletteSelection过程,AGACMXover过程和AGACMbinaryMutatio过程;实验结果表明新的ARG算法性能远优于传统的算法,其中向量AB Vector经过50代ARG算法的进化后,获得了高达3513.6的评分。  相似文献   

11.
本文在分析了一般汉字输入中联想功能使用率不高的原因后,提出了利用写作人写作内容的相关性进行改进的方法,并通过选用适当软件及编写所需的工具软件实现了这一方法。本文还提出了在一般汉字系统中实现这一方法的具体设想。  相似文献   

12.
为了提高大型土木工程(桥梁、隧道等)中数据采集和传输的效率,设计并实现了一种远程数据传输系统。本文设计的系统由测量前端数据采集电路、嵌入式监测软件、GSM模块和后台PC机监测软件、GSM模块组成,主要研究了短信模块在数据传输系统的应用,并进一步提高数据传输的可靠性和正确性。  相似文献   

13.
介绍了基于互联网的SMS网络架构与基本原理,在此基础上提出了基于SMS短信息服务的校园移动平台UMP(University Mobile Platform),该平台分为3个层次:底层通信、业务处理和数据库.并重点论述了UMP平台实现的关键技术.  相似文献   

14.
To resolve the conflicting requirements of measurement precision and real-time performance speed,an im-proved algorithm for pattern classification and recognition was developed. The angular distribution of diffracted light varies with particle size. These patterns could be classified into groups with an innovative classification based upon ref-erence dust samples. After such classification patterns could be recognized easily and rapidly by minimizing the vari-ance between the reference pattern and dust sample eigenvectors. Simulation showed that the maximum recognition speed improves 20 fold. This enables the use of a single-chip,real-time inversion algorithm. An increased number of reference patterns reduced the errors in total and respiring coal dust measurements. Experiments in coal mine testify that the accuracy of sensor achieves 95%. Results indicate the improved algorithm enhances the precision and real-time ca-pability of the coal dust sensor effectively.  相似文献   

15.
在基于汉明重量的简单能量泄露模型下,我们发现SMS4算法中某些操作会泄露出密钥信息,从而容易受到差分能量分析攻击。通过分析与实验我们证明了该攻击的可行性。随后提出两种对SMS4算法的改进,使其能抵御差分能量分析攻击,由此增强SMS4算法的安全性。  相似文献   

16.
随着无线数据传输技术在远程监控系统中的应用需求不断增强,作为一种重要的技术手段,基于SMS的无线数据传输技术扮演了越来越重要的角色.介绍了传统中文SMS信息收发方法的实现过程,分析了其中存在的主要困难,并在研究GSMModem中文信息发送与接收格式以及相关AT指令的基础上,提出了一种新的中文SMS传输方法,同时给出了该方法关于进行中文信息传输的测试结果.实践证明,该方法简单有效,能大幅度降低常规中文sMs发送与接收的编码难度,可以在实际应用中发挥积极作用.  相似文献   

17.
本文提出一种用隐马氏链模型识别汉语声调的新方案。由每一种声调的训练语音求出相应的概率模型参数作为识别模板。识别时,分别用每一种声调的模型参数计算出现输入语声周期序列的概率,概率最大者即为输入语声的声调模型。实验语音选用的是“小学汉语拼音教学录音磁带”,一个男声和一个女声,对于其中的24个韵母和21组拼音音节,正确识别率为98%。  相似文献   

18.
为完成在邮件服务器内部过滤垃圾邮件的任务,参考经典贝叶斯模型,研究有自动调节能力的模型算法。以实验室样本邮件为目标,定义过滤器算法模型,并对系统环境变量设置进行讨论[5],最后对测试邮件文件进行加工,证明了模型设计的合理性。  相似文献   

19.
反义同词,又叫一词两反义,指同一个词能表示两个相对或相反的意义,这种"义兼正反"的语言现象,就是反义同词。根据不同的依据,反义同词可划分为不同的类别,文章运用认知语言学中的概念转喻相关理论,把反义同词中两义项的反义关系识解为一种转喻关系,根据反义同词生成过程中所体现的转喻关系的类型对反义同词进行分类。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号