首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
朴素贝叶斯分类方法由于其简单快速的特点,被广泛应用于文本分类领域。但是当训练集中各个类别的样本数据分布不均匀时,朴素贝叶斯方法分类精度不太理想。针对此问题,提出一种基于加权补集的朴素贝叶斯文本分类算法,该算法利用某个类别的补集的特征来表示当前类别的特征,且对特征权重进行归一化处理。通过实验对比了该方法与传统的朴素贝叶斯方法对文本分类效果的影响,结果表明,基于加权补集的朴素贝叶斯算法具有较好的文本分类效果。  相似文献   

2.
为消除朴素贝叶斯分类时的零概率以及过度拟合问题,分析了各种概率平滑方法,给出了基于M估计的多关系朴素贝叶斯分类方法(MRNBC-M)和基于Laplace估计的多关系朴素贝叶斯分类方法(MRNBC-L),分析探讨了M平滑和Laplace平滑方法对多关系分类的影响情况,为进一步优化分类,方法基于扩展互信息标准对数据进行属性过滤。多关系标准数据集上的实验显示,MRNBC-M可以有效改进分类性能。  相似文献   

3.
针对物流新闻类别分布不均衡,分类器容易倾向大类别而忽略小类别的问题,提出基于加权补集的朴素贝叶斯分类模型.构建物流新闻语料库,结合卡方检验进行特征选择,基于局部、全局和类内、类间的思想,分析并改进传统特征加权算法,设计适用于类别分布不均衡物流新闻的加权补集朴素贝叶斯模型.实验结果表明,相较传统分类方法,加权补集朴素贝叶...  相似文献   

4.
施炜利 《信息与电脑》2023,(14):172-174
为了保护用户个人信息不被盗取,提高现有的未知恶意软件识别方法分类准确率,提出了基于改进朴素贝叶斯的未知恶意软件识别方法。首先,在恶意软件识别的神经网络中,利用HOOK跟踪样本,对数据进行预处理;其次,结合朴素贝叶斯理论针对未知恶意软件建立分析模型;最后,建立改进朴素贝叶斯模型,通过搜索加权贝叶斯模型中的权值,经过计算分类准确率结果获得恶意软件识别结果。实验结果表明,该方法对4种病毒样本的分类准确率结果为98%,能够正确分类恶意软件,达到较好的识别效果。  相似文献   

5.
基于条件信息熵的自主式朴素贝叶斯分类算法   总被引:9,自引:0,他引:9  
朴素贝叶斯是一种简单而高效的分类算法,但其条件独立性和属性重要性相等的假设并不符合客观实际,这在某种程度上影响了它的分类性能。如何去除这种先验假设,根据数据本身的特点实现知识自主学习是机器学习中的一个难题。根据Rough Set的相关理论,提出了基于条件信息熵的自主式朴素贝叶斯分类方法,该方法结合了选择朴素贝叶斯和加权朴素贝叶斯的优点。通过在UCI数据集上的仿真实验,验证了该方法的有效性。  相似文献   

6.
随着互联网的到来,其技术的发展导致了各种数据呈现出爆发式的增长,比如文本数据,分类算法在海量数据前面临着新的挑战。为了解决传统朴素贝叶斯分类算法在面临挑战中的不足,对其中关键词进行加权来提高分类准确率,然后通过Map Reduce编程模型,设计出朴素贝叶斯算法在Hadoop平台下的实现。实验表明:在Hadoop集群上通过并行化的设计朴素贝叶斯分类算法展现出了良好的性能,同时表现出了可靠的扩展性。  相似文献   

7.
朴素贝叶斯分类器难以获得大量有类标签的训练集,而且传统的贝叶斯分类方法在有新的训练样本加入时,需要重新学习已学习过的样本,耗费大量时间。为此引入增量学习方法,在此基础上提出了属性加权朴素贝叶斯算法,该算法通过属性加权来提高朴素贝叶斯分类器的性能,加权参数直接从训练数据中学习得到。通过由Weka推荐的UCI数据集的实验结果表明,该算法是可行的和有效的。  相似文献   

8.
不同皮肤病间发病率的差异导致了皮肤病数据类不平衡现象,对使用机器学习方法构建高效、准确的皮肤病诊断模型带来了巨大挑战。提出一种融合生成对抗网络(generative adversarial networks,GAN)和朴素贝叶斯的皮肤病二分类诊断方法:在皮肤病数据集上训练朴素贝叶斯二分类器作为诊断器,创新性地使用GAN为前者生成补充训练样本,使其训练集正负类样本达到平衡。针对皮肤病诊断多分类问题,提出一种融合生成对抗网络和朴素贝叶斯的多分类诊断方法:使用GAN和朴素贝叶斯训练皮肤病单病种二分类器,并结合了词频-逆文档频率算法(term frequency-inverse document frequency,TF-IDF),将多个二分类器组合成一个多分类器作为诊断器。与六种诊断方法进行了对比实验,提出的两种皮肤病诊断方法准确率和召回率均有提升。  相似文献   

9.
文本分类是自然语言处理领域的一项基础工作.文本数据的高维性和稀疏性,给文本分类带来了许多问题和挑战.朴素贝叶斯模型因其简单、高效、易理解的特点被广泛应用于文本分类任务,但其属性条件独立假设在现实的文本数据中很难满足,从而影响了它的分类性能.为了削弱朴素贝叶斯的属性条件独立假设,学者们提出了许多改进方法,主要包括结构扩展、实例选择、实例加权、特征选择、特征加权等.然而,所有这些方法都是基于独立的单词特征来构建朴素贝叶斯分类模型,在一定程度上限制了它们的分类性能.为此,尝试用特征学习的方法来改进朴素贝叶斯文本分类模型,提出了一种双层贝叶斯模型:随机森林朴素贝叶斯(random forest naive Bayes,RFNB).RFNB分为2层,第1层利用随机森林从原始的单词特征中学习单词组合的高层特征.然后将学习到的新特征输入第2层,经过一位有效编码后用于构建伯努利朴素贝叶斯模型.在大量广泛使用的文本数据集上的实验结果表明,提出的RFNB模型明显优于现有的最先进的朴素贝叶斯文本分类模型和其他经典的文本分类模型.  相似文献   

10.
由于朴素贝叶斯算法的特征独立性假设以及传统TFIDF加权算法仅仅考虑了特征在整个训练集的分布情况,忽略了特征与类别和文档之间关系,造成传统方法赋予特征的权重并不能代表其准确性.针对以上问题,提出了二维信息增益加权的朴素贝叶斯分类算法,进一步考虑到了特征的二维信息增益即特征类别信息增益和特征文档信息增益对分类效果的影响,并设计实验与传统的加权朴素贝叶斯算法相比,该算法在查准率、召回率、F1值指标性能上能提升6%左右.  相似文献   

11.
纯量反馈系统稳定零极近似相消的积分约束   总被引:1,自引:0,他引:1       下载免费PDF全文
何汉林  王中生  廖晓昕 《控制理论与应用》2004,21(6):1029-1031,1035
导出了单输入单输出反馈控制系统误差响应基于名义系统稳定的零、极点近似相消的时间域积分约束,此积分约束是任何反馈控制系统均应满足的.这一约束给出了单输入单输出反馈系统固有折中的新的观点.名义系统稳定的零、极点近似相消的存在导致反馈控制系统的调节时间延长或者误差响应的无穷范数变大.因此,在反馈控制系统设计中,尽量避免补偿器的零、极点与名义系统的极、零点近似相消(即使这些零、极点是稳定的).  相似文献   

12.
地图匹配( MM)算法通过粒子滤波( PF)利用室内地图信息来抑制基于惯性传感器的室内定位系统的误差累计。利用区域生长( RG)算法结合当前步长和方向信息在地图上找到合理的落脚范围,并以此来判断粒子的有效性。这种方法能有效改善地图配准算法的实用性和计算复杂度。提出一种改进的零速度( ZV)检测算法能准确提取步伐信息,间接提升了零速度更新( ZUPT)算法和地图配准算法的精度。实验结果表明:该算法的定位误差小于1.0%,定位精度比单纯的航位推算( DR)算法平均提高了5.97%。  相似文献   

13.
This research investigates the impact of intellectual capital components on the competitive advantage in the Jordanian telecommunication companies. The empirical findings indicate that the relational capital and the structural capital have positive impact on competitive advantage. Both the relational capital and the structural capital account for 48.4% of the competitive advantage. It is unexpected to find that the human capital does not have a significant direct impact on competitive advantage. However, it is valid to state that the human capital indirectly and significantly influences competitive advantage as it is embedded in the relational capital. The effect of the relational capital on competitive advantage is moderated by gender and age. The effect is strongest among younger men. In the case of the structural capital its effect is moderated by gender only such that the effect is slightly stronger for females rather than males.  相似文献   

14.
SDSS是较为先进的决策支持系统,但由于其模型库中的模型固定不变,因此在实际应用中具有一定的局限性。提出了集成数据仓库DW、知识仓库KW和模型仓库MW作为底部架构的体系结构,能有效解决这一问题。该架构简化了模型获得和编码任务,增强了决策的有效性和智能性,提高了决策效率。  相似文献   

15.
一、引言计算机仿真接口界面,随着计算机软硬件的不断提高也在快速地变化着。从其发展趋势中我们不难看出这一点:从早期的命令行提示编辑Command Line,到全屏幕菜单编辑(Menu based Editor),再到图形用户界面Graphic User In-terface(GUI),界面在不断追求如何更好地适应用户、与用户更直接地交互。其具体特点包括自然而又丰富的色彩、逼真而又完美的几何造型、柔和而又动听的环境声响、质感而又具有力反馈的实物等。这些人们所需要的真实感,一种技术是难以胜任的,它需要各种软、硬件技术的综合与集成。从目前的趋  相似文献   

16.
Electroencephalography (EEG) is the recording of electrical activity of neurons within the brain and is used for the evaluation of brain disorders. But, EEG signals are contaminated with various artifacts which make interpretation of EEGs clinically difficult. In this research paper, we use a soft-computing technique called ANFIS (Adaptive Neuro-Fuzzy Inference System) for the removal of EOG artifact, combined EOG and EMG artifact. Improvement in the output signal to noise ratio and minimum mean square error are used as the performance measures. The outputs of the proposed technique are compared with the outputs of techniques such as neural network, based on ADALINE (Adaptive Linear Neuron) and adaptive filtering method, which makes use of RLS (Recursive Least Squares) algorithm through wavelet transform (RLS-Wavelet). The obtained results show that the proposed method could significantly detect and suppress the artifacts.  相似文献   

17.
The Prize-collecting Steiner Tree Problem (PCSTP) is a well-known problem in graph theory and combinatorial optimization. It has been successfully applied to solve real problems such as fiber-optic and gas distribution networks design. In this work, we concentrate on its application in biology to perform a functional analysis of genes. It is common to analyze large networks in genomics to infer a hidden knowledge. Due to the NP-hard characteristics of the PCSTP, it is computationally costly, if possible, to achieve exact solutions for such huge instances. Therefore, there is a need for fast and efficient matheuristic algorithms to explore and understand the concealed information in huge biological graphs. In this study, we propose a matheuristic method based on clustering algorithm. The main target of the method is to scale up the applicability of the currently available exact methods to large graph instances, without loosing too much on solution quality. The proposed matheuristic method is composed of a preprocessing procedures, a heuristic clustering algorithm and an exact solver for the PCSTP, applied on sub-graphs. We examine the performance of the proposed method on real-world benchmark instances from biology, and compare its results with those of the exact solver alone, without the heuristic clustering. We obtain solutions in shorter execution time and with negligible optimality gaps. This enables analyzing very large biological networks with the currently available exact solvers.  相似文献   

18.
In this study, we propose an analysis system for single-trial classification of electroencephalogram (EEG) data. Combined with automatic EOG artifact removal and wavelet-based amplitude modulation (AM) features, the support vector machine (SVM) classifier is applied to the classification of left finger lifting and resting. Automatic EOG artifact removal is proposed to eliminate the EOG artifacts automatically by means of independent component analysis (ICA) and correlation coefficient. The features are then extracted from the discrete wavelet transform (DWT) data by the AM method. Finally, the SVM is used for the discriminant of wavelet-based AM features. Compared with EEG data without EOG artifact removal, band power features and LDA classifier, the proposed system achieves promising results in classification accuracy.  相似文献   

19.
基于CAN总线实时应用的可靠调度性研究   总被引:1,自引:0,他引:1  
邓竹莎  雷航  罗淳  康涌泉 《计算机应用》2006,26(6):1301-1303
CAN总线是一种高级的串行通信协议,适用于各种分布式控制系统。在实时应用中,标准的CAN协议使用静态优先级算法,对传输信道的利用率比较低。对基于CAN总线通信的动态优先级调度算法进行研究后,提出了一种基于指数分配方式的MTS算法,在保证强实时性消息的同时兼顾了低优先级消息的公平性。  相似文献   

20.
心电信号是典型的强噪声下的非平稳微弱信号,减小噪声的干扰对心电信号的分析有着十分重要的意义,因此,有效的滤波方法一直是该领域学者关注的热点问题。本文在基于小波变换心电信号分析研究基础上,针对小波去噪时分解只作用于低频部分,从而忽略了高频区域中一部分有用信号的问题,提出了一种采用改进小波包理论实现心电信号去噪的方法,利用小波包在消除信号噪声方面具有更为精确的局部分析能力的特点,采用了‘db4’小波和"最优基"选择的方法,对心电信号进行消噪。以MIT-BIH心电数据库中心律失常数据仿真实验,得到了较理想的去噪效果。对比该方法与小波滤波去噪,发现基于小波包的心电信号去噪具有更优良的去噪性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号