共查询到20条相似文献,搜索用时 46 毫秒
1.
增量学习利用增量数据中的有用信息通过修正分类参数来更新分类模型,而朴素贝叶斯算法具有利用先验信息以及增量信息的特性,因此朴素贝叶斯算法是增量学习算法设计的最佳选择。三支决策是一种符合人类认知模式的决策理论,具有主观的特性。将三支决策思想融入朴素贝叶斯增量学习中,提出一种基于三支决策的朴素贝叶斯增量学习算法。基于朴素贝叶斯算法构造了一个称为分类确信度的概念,结合代价函数,用以确定三支决策理论中的正域、负域和边界域。利用三个域中的有用信息构造基于三支决策的朴素贝叶斯增量学习算法。实验结果显示,在阈值[α]和[β]选择合适的情况下,基于该方法的分类准确性和召回率均有明显的提高。 相似文献
2.
属性约简是粗糙集理论的重要应用之一.为了对部分标记的数据进行属性约简,一些基于粗糙集的半监督属性约简方法相继被提出,但这些方法在数据信息利用、运行代价、约简质量等方面仍然存在挑战.本文针对混合型分类数据,提出了一种新的基于三支标签传播的半监督属性约简(3WLPME)方法.该方法包括两个过程:三支标签传播(3WLP)和基于混合熵的启发式属性约简(MEHAR).其中,3WLP在经典标签传播算法的基础上,结合三支决策和主动学习思想,对无标签数据进行标注,并更新有标签集和无标签集.迭代执行上述过程直至收敛,可以提升最终的伪标签准确率.在MEHAR中,属性重要度由混合熵度量.基于依赖度和条件熵定义的混合熵,融合了粗糙集的代数表示和信息表示,能更深刻地反映属性的分类能力.本文对3WLP算法和MEHAR算法的有效性进行了理论分析.在UCI数据集上进行了以下仿真实验:3WLP与随机标签传播在伪标签准确率上的对比;不同属性约简算法在约简质量上的对比;3WLPME与其他基于粗糙集的半监督属性约简方法,在约简质量上的对比.实验结果验证了3WLP能获得较高的伪标签准确率;MEHAR在不降低分类准确率的前提下,能获得较小的约简;3WLPME在半监督约简过程中具有更高的效率和稳定性,说明本文所提方法是有效的. 相似文献
3.
《计算机科学与探索》2017,(3):502-510
从三支决策发展历史出发,在总结三支决策近年来研究的基础上,基于三支决策现有模型、算法及应用,提出了一种广义三支决策和狭义三支决策理论。广义三支决策注重对三支决策概念内涵和外延进行诠释;狭义三支决策主要注重三支决策在实际决策问题中的语义解释。提出了一种"四层次"三支粒结构决策模型,从静态和动态、广义和狭义两种视角对三支决策进行剖析,厘清了三支决策发展过程和研究脉络。最后,给出了三支决策的研究现状和未来发展方向。 相似文献
4.
针对典型的支持向量机增量学习算法对有用信息的丢失和现有支持向量机增量学习算法单纯追求分类器精准性的客观性,将三支决策损失函数的主观性引入支持向量机增量学习算法中,提出了一种基于三支决策的支持向量机增量学习方法.首先采用特征距离与中心距离的比值来计算三支决策中的条件概率;然后把三支决策中的边界域作为边界向量加入到原支持向量和新增样本中一起训练;最后,通过仿真实验证明,该方法不仅充分利用有用信息提高了分类准确性,而且在一定程度上修正了现有支持向量机增量学习算法的客观性,并解决了三支决策中条件概率的计算问题. 相似文献
5.
k-近邻(k-Nearest Neighbour,KNN)算法是一种有效的多分类算法,他具有简单、稳定的特点,在数据挖掘领域得到了广泛的应用。但是有2个主要缺点,一是算法的准确度与k值有很大关系,不同的k值会导致准确率有很大的不同;二是他属于非增量式算法,随着数据量的增加,算法的分类速度会越来越慢,影响他在海量数据分析中的应用。三支决策的主要思想是将整体分成3个独立的部分,引入了不承诺的决策选项,规避了错误接受或者错误拒绝的损失。把三支决策思想引入KNN算法,对边界域样本特殊处理,会减小分类代价,提高海量数据处理的正确性,同时对KNN算法进行改进,提出了一种基于三枝决策的KNN增量式算法,提高了原有算法的快速性。 相似文献
6.
动态时间弯曲距离算法(DTW)是目前公认的最有效的时间序列相似性计算方法之一,但是较高的时间复杂度一直是其主要缺点。快速弯曲距离算法(FTW)能有效提高DTW的计算速度,但是该算法对不同粒度时间序列剪枝的行为是典型的二支决策,与人类处理不确定问题时普遍采用的三支判断不同。因此,通过将三支决策理论引入到DTW算法的优化工作中,建立了DTW三支决策模型;然后对DTW三支决策模型中的决策阈值α和β进行了基于误识别率的推导,并且给出了具体求解阈值α和β的模拟退火算法;最后基于上述理论提出了基于弯曲距离三支决策的时序相似性算法(3WD-DTW)。通过对比实验表明,与FTW算法相比,3WD-DTW算法在保持较快的计算速度的前提下明显提升了计算准确度,使其接近DTW的水平。 相似文献
7.
8.
9.
10.
模糊信息系统中,对象的相似度往往会受噪声影响,且它在模型运算中常常并非全部需要高精度参与计算。文中首先引入阈值对(α,β),提出了一种基于相似度三支决策的模糊粗糙集模型;其次利用模糊集近似的三支决策方法,给出了对象相似度三支决策的错误率、决策代价以及相应的语义解释;然后以总体决策代价最小化为目标,给出了最优(α,β)的计算方法,从而建立了一种基于最优相似度三支决策的模糊粗糙集模型;最后通过实例分析说明了该模型的可行性和合理性。本文建立的三支决策模糊粗糙集模型保留了模糊信息系统的不确定性,一定程度地去除了噪声影响,且能通过计算得到最优阈值(α,β),从而建立基于相似度三支决策的最优模型,这将有益于模糊信息系统的应用。 相似文献
11.
多视图子空间聚类是一种从子空间中学习所有视图共享的统一表示, 挖掘数据潜在聚类结构的方法. 作为一种处理高维数据的聚类方法, 子空间聚类是多视图聚类领域的研究热点之一. 多视图低秩稀疏子空间聚类是一种结合了低秩表示和稀疏约束的子空间聚类方法. 该算法在构造亲和矩阵过程中, 利用低秩稀疏约束同时捕捉了数据的全局结构和局部结构, 优化了子空间聚类的性能. 三支决策是一种基于粗糙集模型的决策思想, 常被应用于聚类算法来反映聚类过程中对象与类簇之间的不确定性关系. 本文基于三支决策的思想, 设计了一种投票制度作为决策依据, 将其与多视图稀疏子空间聚类组成一个统一框架, 从而形成一种新的算法. 在多个人工数据集和真实数据集上的实验表明, 该算法可提高多视图聚类的准确性. 相似文献
12.
13.
基于警示传播与DPLL算法的启发式极性决策算法 总被引:1,自引:0,他引:1
警示传播(WP)算法是信息传播算法的重要基础,WP算法的本质是因子图上警示信息的迭代过程,在算法收敛时得到一组稳定的警示信息,并利用局部腔域得到公式变元的部分赋值。分析了警示传播算法的基本原理,给出了算法的改进。RB实例集上的实验证明,改进后的算法比原算法具有迭代次数和运行时间,提高了收敛速度。然而,在RB模型产生的大部分实例集上,警示传播算法不收敛,因而不能有效求解公式。警示传播算法与DPLL算法的组合使用使回溯计算次数大大降低,从而有效地弥补了WP算法的不足。通过在RI3实例集上的测试实验表明,该方法是有效的。 相似文献
14.
15.
由于社会网络的日益复杂,具有线性时间复杂度的标签传播算法越来越被广泛的运用,然而在标签传播过程中存在随机性,致使社区划分不稳定.因此,对节点标签初始化、节点更新顺序和节点标签传播选择过程这三个方面改进,提出一种稳定性较高的标签传播算法.该方法引入LeaderRank算法计算节点影响力,在此基础上选取关键节点并为这些关键... 相似文献
16.
17.
18.
基于协同过滤的三支粒推荐算法研究 总被引:1,自引:0,他引:1
为了降低传统协同过滤算法的推荐成本,并解决该算法评分信息单一的问题,提出了一种基于协同过滤的三支粒推荐算法。该算法在传统协同过滤的基础上,考虑项目特征对用户评分的影响,根据项目特征、粒化用户项目评分矩阵,形成用户对项目粒度的评分矩阵,并以此作为用户偏好的测度依据。同时,该算法在推荐过程中引入三支决策,考虑了推荐过程中产生的误分类成本和学习成本,并基于用户真实的评分偏好构建三支推荐。实验结果显示,基于协同过滤的三支粒推荐算法与传统协同过滤算法相比,不但提高了算法的推荐质量,而且降低了推荐成本。 相似文献
19.