首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 180 毫秒
1.
数据库信息分类中,朴素贝叶斯分类模型是一种简单而有效的分类方法,但它的属性独立性假设使其无法表达属性变量间存在的依赖关系,影响了它的分类性能.而一般贝叶斯网络模型则由于能表达属性变量之间的依赖关系而越来越受到人们的重视,但一般贝叶斯网络分类模型结构的学习算法是一个NP完全问题.本研究在一种简化的贝叶斯网络分类模型的基础上,利用其多项式时间复杂度的结构学习算法,将其应用于数据库信息分类,实现了学习效率和分类精度的一种折衷.实验结果表明,这种分类方法有着比较高的数据库信息文本检索性能。  相似文献   

2.
文本分类是数据挖掘领域中重要的研究分支.通过对自适应遗传算法和朴素贝叶斯分类器的研究,提出一种基于自适应遗传算法的朴素贝叶斯分类算法.将该算法应用于中文文本分类中,可以生成最优贝叶斯分类器及最优属性集合,提高分类精度.  相似文献   

3.
朴素贝叶斯分类器是一种简单高效的分类算法,但其属性独立性假设影响了分类效果。通过放松朴素贝叶斯假设可以增强朴素贝叶斯的分类效果,但是通常会导致计算代价大幅提高。针对以上问题,提出了一种基于粗糙集的特征加权朴素贝叶斯算法,加权参数直接从训练数据中学习得到,可以看作是计算某个后验概率时,某个特征对于该类别的影响程度。将该分类算法与朴素贝叶斯分类器(na ve bayesian classifier,NB)、贝叶斯网(bayes networks)和NBTree分类器进行实验比较。结果表明:在大多数数据集上,FWNB分类器在较小的计算代价下,具有较高的分类正确率。  相似文献   

4.
数据库信息分类中 ,朴素贝叶斯分类模型是一种简单而有效的分类方法 ,但它的属性独立性假设使其无法表达属性变量间存在的依赖关系 ,影响了它的分类性能 .而一般贝叶斯网络模型则由于能表达属性变量之间的依赖关系而越来越受到人们的重视 ,但一般贝叶斯网络分类模型结构的学习算法是一个NP完全问题 .本研究在一种简化的贝叶斯网络分类模型的基础上 ,利用其多项式时间复杂度的结构学习算法 ,将其应用于数据库信息分类 ,实现了学习效率和分类精度的一种折衷 .实验结果表明 ,这种分类方法有着比较高的数据库信息文本检索性能 .  相似文献   

5.
以传统朴素贝叶斯算法为基础,研究并提出一种高效、准确的量子模糊贝叶斯分类算法。首先将“模糊集合理论+朴素贝叶斯理论”交叉融合,定义模糊先验概率、模糊条件概率,将朴素贝叶斯推广至模糊朴素贝叶斯,构建模糊贝叶斯模型;其次,将“模糊贝叶斯模型+量子计算”交叉融合,将模糊数据集量子化(编码到量子态上)并设计量子线路,提出一种量子模糊朴素贝叶斯分类算法;最后,将该算法应用到鸢尾花数据集。仿真实验表明,与传统朴素贝叶斯分类算法相比,该算法具有较高的分类效率和准确率。  相似文献   

6.
一种文本处理中的朴素贝叶斯分类器   总被引:22,自引:0,他引:22  
首先在特征独立性假设的基础上,讨论了朴素贝叶斯分类器的原理,以及训练朴素贝叶斯分类器和应用朴素贝叶斯分类器进行分类的问题。然后,通过EM算法(期望值最大算法),自动增加训练量,以得到较为完备的训练文本库,扩展了朴素贝叶斯分类器的应用,提高了朴素贝叶斯分类器的分类精度。文章最后给出一组实验数据。本文的研究发现,朴素贝叶斯分类器分类精度较高,并且不存在单分类器与多分类器的实现差异,是一个比较实用的分类器。  相似文献   

7.
详细讨论了一个基于朴素贝叶斯方法的个性化E-mail分类器的设计,给出了系统体系结构和特征提取算法,试验了一种对新邮件计算所属类别后验概率的方法. 试验结果表明,结合Odds Ratio特征子集提取算法和朴素贝叶斯方法对邮件进行分类具有较好的分类精度. 应用朴素贝叶斯方法在新邮件到达的同时对其进行分类,具有较好的分类速度.  相似文献   

8.
基于加密的数据挖掘技术往往计算复杂度太高,而差分隐私作为一种数据扰动技术,既能有效降低计算复杂度,又能让使用者分析数据的整体价值。简要分析了差分隐私在具有敏感信息的智能数据挖掘系统中的相关技术。首先,介绍了差分隐私的基本概念;其次,针对频繁项挖掘、回归与分类以及深度学习,分别介绍了差分隐私在敏感数据挖掘中的应用;最后,对比了最新研究方法的性能和优缺点,为进一步研究隐私保护数据挖掘技术提供相关参考。  相似文献   

9.
随着人们对隐私权的越来越重视,隐私保护数据挖掘成为当前研究热点.分类算法作为一个重要的数据挖掘方法被应用到各个领域,其中支持向量机(SVM)是分类算法中一个重要方法.并且数据的隐私性和安全性是人们关注的重点.本文对SSP协议进行扩展提出了一个基于垂直分布数据的隐私支持向量机算法,这个算法具有更高的效率和更好的安全性.  相似文献   

10.
自动分类是数据挖掘和机器学习中非常重要的研究领域.针对难以获得大量有类标签的训练集问题,提出了基于小规模训练集的增量式贝叶斯分类,给出增量式贝叶斯分类机理参数计算及其算法.对算法分两种情况处理:第一种情况是新增样本有类别标签,则利用现有分类器检验其类标签,如果匹配则保留当前分类器,否则利用新样本修正分类器;第二种情况是新增样本无类别标签,则利用现有分类器为其训练类标签,然后利用新样本来修正分类器.实验结果表明,该算法是可行有效的,比简单贝叶斯分类算法有更高的精度.增量式贝叶斯分类算法的提出为分类器的更新提供了一条新途径.  相似文献   

11.
结合人工神经网络中的自适应共振理论(ART)及数据挖掘(Data Mining)技术来建构一个可自动聚类族群特征且能挖掘出关联特质的自动化在线推荐系统。探讨如何有效地运用数据挖掘技术从大量的数据库中挖掘出完整知识,以推荐适当的信息给使用者,帮助他们在浩大的信息流中找到真正需要、有用的文件或信息。整合ART及数据挖掘技术,并针对推荐系统的特性提出一种改进的ART算法(MART算法)。实例验证了算法的有效性。  相似文献   

12.
自适应子波神经网络数据挖掘方法   总被引:1,自引:1,他引:0  
分析了人工神经网络所依据的生物学基础,探索改进与完善网络模型的途径,将子波与巳有的神经网络模型相结合,提出一种基于自适应子波神经网络的数据控制方法,并依此来构造数据挖掘过程的机器学习机制,以求提高对问题的处理能力,数据挖掘的仿真实例表明,与一般的人工神经网络相比,用自适应子波神经网络进行数据挖掘不仅是有效的,而且也是可行的。  相似文献   

13.
根据就业数据的特点,采用C4.5决策树算法对就业数据进行预处理,选取决策属性,实现挖掘算法并抽取规则知识,由规则知识指出哪些决策属性决定了就业单位的类别.挖掘结果表明,该算法能够正确将就业数据分类,并得到若干有价值的结论,供决策分析.  相似文献   

14.
数据挖掘 (dateMining)技术是解决如何从实际应用中大量不完整的、模糊的、有噪声和随机的数据中提取 (挖掘 /发现 )事先不知道但又是有用的信息和知识的一种自动地将数据转换成知识的信息技术 ,基于数据挖掘技术的构成、对象与功能 ,以示例的方式说明公共组织在公共事物的治理中如何应用这一前沿的信息技术 .  相似文献   

15.
Apriori算法分析与改进综述   总被引:5,自引:0,他引:5  
数据挖掘中的关联规则挖掘能够发现大量数据中项集之间有趣的关联或相关联系,特别是随着大量数据不停地收集和存储,从数据库中挖掘关联规则就越来越有其必要性.通过对关联规则挖掘技术及其相关算法Apriori进行分析,发现该技术存在的问题.本文介绍了能优化该技术的各种算法,分析了这些算法各自的优缺点,并针对这些问题提出了未来的研究方向.  相似文献   

16.
基于归纳逻辑程序设计的特异规则挖掘   总被引:3,自引:0,他引:3  
从关系数据挖掘的角度提出了挖掘特异规则的方法,该方法通过面向属性的方法来识别特异数据.借鉴Chi2算法的思想实现了特异数据的离散,并定性地描述了数据的特异程度,结合经典的归纳逻辑程序设计系统FDIL,自然地挖掘出了特异规则,突破了传统命题级数据挖掘的框架.试验结果表明利用该方法能够发现被传统的关联规则挖掘算法所忽略的有价值的知识.  相似文献   

17.
18.
数据挖掘研究现状及最新进展   总被引:5,自引:0,他引:5  
随着Internet和大型数据库的出现,“信息爆炸但知识匮乏”的问题日益显著。如何从海量无序的数据中迅速、准确地提取有用信息和知识,创造更大的效益是一个迫切需要研究的课题。因此,数据挖掘应运而生,成为一个新的研究领域。本文对数据挖掘研究及最新进展从三个方面进行综述,总结了数据挖掘的应用现状,然后介绍了作者等人的相关研究工作,最后提出了数据挖掘未来研究方向。  相似文献   

19.
时态数据挖掘的探讨   总被引:15,自引:0,他引:15  
数据挖掘是指从大型数据库或数据集的数据中提取人们感兴趣的知识。在现实世界中,信息系统往往涉及到时态数据。本文试图数据挖掘和时态数据相结合来讨论时态数据挖掘的有关问题。首先简要讨论时间表达式的描述;然后提出有关时态模式和时态关联规则的若干定义;最后讨论时态数据挖掘语言(TDML)的描述并给出一个实例。  相似文献   

20.
在关联规划挖掘理论研究上,首次给出了项目序列集格空间,并且探讨了在这个空间上的基本操作算子、基于项目序列集格空间及其操作,建立了关联规则挖掘模型.在关联规则挖掘算法方面,设计了基于项目序列集操作理论的关联规则挖掘算法SIS,该算法执行时间整体上优于Apriori算法,而且随着数据量的增大,该算法执行时间的增长幅度也小于Apriori算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号