首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 765 毫秒
1.
目前基于PU问题的时间序列分类常采用半监督学习对未标注数据集[U]中数据进行自动标注并构建分类器,但在这种方法中,边界数据样本类别的自动标注难以保证正确性,从而导致构建分类器的效果不佳。针对以上问题,提出一种采用主动学习对未标注数据集[U]中数据进行人工标注从而构建分类器的方法OAL(Only Active Learning),基于投票委员会(QBC)对标注数据集构建多个分类器进行投票,以计算未标注数据样本的类别不一致性,并综合考虑数据样本的分布密度,计算数据样本的信息量,作为主动学习的数据选择策略。鉴于人工标注数据量有限,在上述OAL方法的基础上,将主动学习与半监督学习相结合,即在主动学习迭代过程中,将类别一致性高的部分数据样本自动标注,以增加训练数据中标注数据量,保证构建分类器的训练数据量。实验表明了该方法通过部分人工标注,相比半监督学习,能够为PU数据集构建更高准确率的分类器。  相似文献   

2.
通过充分利用多个基分类器间的差异,集成分类器能够有效提高泛化精度,但是分类复杂度也随之增加.针对一类典型基于重采样和投票法的集成分类器,根据少数服从多数原则,在不影响分类精度的前提下给出了硬截止投票方法;针对基于Bagging的SVM集成的特点,引入概率分析,分析根据集成中部分投票预测集成结果的损失概率,给出了基于损失概率的软截止投票方法,该方法可推广到其他基于重采样技术与投票法的集成分类系统.对一个人工数据集和两个UCI数据集的实验表明该方法在保证分类精度的前提下,大幅提高了分类速度.  相似文献   

3.
《计算机科学与探索》2017,(11):1775-1782
针对网络行为数据中中类样本不均衡、样本标注代价大的问题,结合委员会投票和动态代价思想提出一种针对不均衡数据集的分类算法DC-TSVM(dynamic cost and cooperative labeling transductive support vector machine)。该方法在构建每个子分类器时利用类密度之间的关系动态计算各个类的错分代价,减少分类超平面的偏移,然后利用投票熵选择标注准确性较高的样本进行投票标注,减少错误的累积和传递,提高标注准确率,增强最后分类器的泛化性能。KDDCUP99数据集上的实验结果表明该方法对未知攻击有较高的检测准确率。  相似文献   

4.
目的在多标签有监督学习框架中,构建具有较强泛化性能的分类器需要大量已标注训练样本,而实际应用中已标注样本少且获取代价十分昂贵。针对多标签图像分类中已标注样本数量不足和分类器再学习效率低的问题,提出一种结合主动学习的多标签图像在线分类算法。方法基于min-max理论,采用查询最具代表性和最具信息量的样本挑选策略主动地选择待标注样本,且基于KKT(Karush-Kuhn-Tucker)条件在线地更新多标签图像分类器。结果在4个公开的数据集上,采用4种多标签分类评价指标对本文算法进行评估。实验结果表明,本文采用的样本挑选方法比随机挑选样本方法和基于间隔的采样方法均占据明显优势;当分类器达到相同或相近的分类准确度时,利用本文的样本挑选策略选择的待标注样本数目要明显少于采用随机挑选样本方法和基于间隔的采样方法所需查询的样本数。结论本文算法一方面可以减少获取已标注样本所需的人工标注代价;另一方面也避免了传统的分类器重新训练时利用所有数据所产生的学习效率低下的问题,达到了当新数据到来时可实时更新分类器的目的。  相似文献   

5.
基于模糊聚类的思想提出了一种新的两级集成分类器算法.将数据集用Fuzzy C-Means算法进行聚类,得到每个实例对应于每个类别的模糊隶属度.一级集成根据Bagging算法获得成员分类器,分类器个数为数据集类别数且每个成员分类器对应一个类别标号,这些成员分类器的采样方式是通过其对应类别的模糊隶属度为每个实例加权后进行随机重采样.二级集成是将一级集成产生的针对类别的成员分类器通过动态加权多数投票法来组合,学习到最终的分类结果.该算法称为EWFuzzyBagging,实验结果表明,该算法与Bagging和AdaBoost相比具有更好的健壮性.  相似文献   

6.
为了提高图像标注系统的精度和效率,提出了基于遗传特征选择和支持向量机的图像标注方法。该方法从多媒体描述接口(MPEG-7)标准中抽取图像的视觉特征,采用双编码遗传算法从MPEG-7标准中选择最优的加权特征子集,并训练支持向量机分类器用于图像标注,支持向量机分类器采用多数投票机制。对2 000幅Corel图像的标注结果表明:该方法可以获得最优的加权特征子集,提高了图像标注系统的精度和效率。  相似文献   

7.
该文针对集成方法实现支持向量机大规模训练的相关问题进行了深入研究,提出了一种称为"DD-Boosting"的成员分类器产生算法,能够在大规模数据集情况下利用类似Boosting技术产生稳定、高泛化性能的成员分类器。在此基础上,推导出基于OCSVM的分类器集成模型,实验仿真表明,该集成模型能够获得比主投票方法更好的泛化性能,且通过调整正则参数避免了训练过拟合问题。  相似文献   

8.
在分析单一MU(Most Uncertainty)采样缺陷的基础上,提出一种"全局最优搜寻"方法 GOS(Global Optimal Search),并结合MU共同完成查询选择。GOS+MU方法中,GOS着眼全局寻找目标,在应用环境能提供的训练样本数量有限、分类器受训不充分时,该方法选择的对象学习价值高,能快速推进分类器学习进程;MU则能够在GOS采样失效情形下,利用分类器当前训练成果,选择查询不确定性最强的样本补充训练集。通过对网络商品的用户评论进行分类仿真,并比较其他采样学习方法的效果,证明了GOS+MU方法在压缩学习成本、提高训练效率方面的有效性。  相似文献   

9.
基于集成学习的自训练算法是一种半监督算法,不少学者通过集成分类器类别投票或平均置信度的方法选择可靠样本。基于置信度的投票策略倾向选择置信度高的样本或置信度低但投票却一致的样本进行标记,后者这种情形可能会误标记靠近决策边界的样本,而采用异构集成分类器也可能会导致各基分类器对高置信度样本的类别标记不同,从而无法将其有效加入到有标记样本集。提出了结合主动学习与置信度投票策略的集成自训练算法用来解决上述问题。该算法合理调整了投票策略,选择置信度高且投票一致的无标记样本加以标注,同时利用主动学习对投票不一致而置信度较低的样本进行人工标注,以弥补集成自训练学习只关注置信度高的样本,而忽略了置信度低的样本的有用信息的缺陷。在UCI数据集上的对比实验验证了该算法的有效性。  相似文献   

10.
基于本体的Deep Web数据标注   总被引:3,自引:0,他引:3  
袁柳  李战怀  陈世亮 《软件学报》2008,19(2):237-245
借鉴语义Web领域中深度标注的思想,提出了一种对Web数据库查询结果进行语义标注的方法.为了获得完整且一致的标注结果,将领域本体作为Web数据库遵循的全局模式引入到查询结果语义标注过程中.对查询接口及查询结果特征进行详细分析,并采用查询条件重置的策略,从而确定查询结果数据的语义标记.通过对多个不同领域Web数据库的测试,在具有领域本体支持的条件下,该方法能够对Web数据库查询结果添加正确的语义标记,从而验证了该方法的有效性.  相似文献   

11.
In order to improve the pattern classification power of the committee machine, a two-level committee machine, which is a committee machine with several lower committees, is proposed and the learning algorithm for it is described. The discriminant function realized by the two-level committee machine can be considered as the general piecewise linear discriminant function which includes Chang's definition.(15) The proposed algorithm is a kind of error-correction procedure, and the learning procedure of the usual committee machine and the perceptron are clearly explained as special cases of the proposed algorithm.  相似文献   

12.
A committee classification technique based upon a form of seniority decision logic, and which implements piecewise linear decision surfaces, is proposed and a viable training algorithm is presented. The method determines automatically the number of committee members required and is not dependent upon user specified parameters. Examples are given to illustrate the effectiveness of the method using both model data and satellite remote sensing image data.  相似文献   

13.
聚类是一种无监督的机器学习方法,其任务是发现数据中的自然簇。共享最近邻聚类算法(SNN)在处理大小不同、形状不同以及密度不同的数据集上具有很好的聚类效果,但该算法还存在以下不足:(1)时间复杂度为O(n2),不适合处理大规模数据集;(2)没有明确给出参数阈值的简单指导性操作方法;(3)只能处理数值型属性数据集。对共享最近邻算法进行改进,使其能够处理混合属性数据集,并给出参数阈值的简单选择方法,改进后算法运行时间与数据集大小成近似线性关系,适用于大规模高维数据集。在真实数据集和人造数据集上的实验结果表明,提出的改进算法是有效可行的。  相似文献   

14.
图像分割是图像处理、模式识别、计算机视觉等领域的重要技术。为实现高质量的数字图像分割,提出了一种结合图像灰度均衡和改进遗传算法的数字图像阈值分割方法。创新点在于一方面采用结合了最大类间方差法的改进遗传算法,并对遗传算法性能加以改进;另一方面,对图像进行了灰度均衡的图像前处理,使得算法具有更广泛的适应性。实验显示,方法克服了常见的图像阈值分割方法在处理灰度图像时出现的图像细节难以保留的问题,能够稳定地获得图像的最优阈值,实现保留图像细节的分割效果。  相似文献   

15.
基于分治法的快速确定规则获取算法   总被引:2,自引:0,他引:2  
值约简是Rough集理论研究的一个重要内容,目前已有的算法很难快速处理大数据集。文中通过在属性空间上对论域对象的分解,提出一种基于分治法的快速确定规则获取算法,并给出实例说明。该算法可直接从离散的决策表获取确定决策规则,在数据服从均匀分布的条件下,算法的时间复杂度低于n2,适合大数据集的确定规则获取。实验结果说明算法的高效性。  相似文献   

16.
医学图像配准的混合量子粒子群优化算法研究   总被引:1,自引:0,他引:1       下载免费PDF全文
基于互信息的配准方法具有精度高、鲁棒性强等特点,但互信息的配准函数存在局部极值,给配准的过程带来了很大的困难。针对此问题提出了以归一化互信息作为相似性测度,将具有较强全局搜索能力的量子粒子群优化(QPSO)算法用于求解低精度的配准参数,再利用具有较强局部搜索能力的Powell法获得高精度配准参数的方法,应用到医学图像的配准中。实验结果表明,提出的混合算法能够有效地克服互信息函数存在的局部极值和Powell方法存在的初始点依赖问题,提高了配准的成功率,具有较高的配准精度和较快的速度。  相似文献   

17.
委员会共识和混合共识通过选举委员会来代替全网节点完成区块验证, 可有效加快共识速度, 提高吞吐量, 但恶意攻击和收买易导致委员会发生腐败问题, 严重时将影响共识结果甚至造成系统瘫痪. 现有工作虽引入信誉机制降低委员会节点腐败的可能性, 但开销大、可信度低且无法降低腐败问题对系统的影响. 提出一种带有预验证机制的区块链动态共识算法(DBCP), 通过预验证机制在较小开销的前提下对委员会进行可靠的信誉评估, 及时淘汰委员会中的恶意节点. 若腐败问题已影响到共识结果, DBCP会通过动态共识将区块验证权转移到全网节点, 并淘汰给出错误意见的委员会节点, 避免系统瘫痪. 若委员会通过迭代达到高可信状态, 则DBCP会将区块验证权交由委员会, 全网节点将认同委员会的共识结果, 并不再对区块进行验证, 进而加快共识速度. 经实验验证, DBCP的吞吐量与比特币相比提升了两个数量级, 且与Byzcoin相近, 可在一个出块周期内快速应对委员会腐败问题, 安全性优于Byzcoin.  相似文献   

18.
基于改进遗传算法的网格任务调度研究   总被引:3,自引:0,他引:3  
叶春晓  陆杰 《计算机科学》2010,37(7):233-235
网格任务调度是一个NP完全问题,它关注大规模的资源和任务调度,要求采用具有高效性的调度算法.提出了一种基于改进遗传算法的网格任务调度算法,在算法初始化种群产生时引入min-min算法和max-min算法,从而提高初始化种群的质量;算法迭代过程中采用了一种新的局部收敛判断以及改进的变异操作来防止局部收敛.仿真结果表明,该改进算法能更有效地解决网格任务调度问题.  相似文献   

19.
We propose a committee machine whose each committee member is a network of two threshold elements. This improves upon the ability of the usual committee machine. The subsidiary discriminant function in this case is a kind of piecewise linear discriminant function instead of a linear function. We show a sophisticated representation of the discriminant function realized by the proposed committee machine, and give a rational learning algorithm based on the function. We also show that the proposed committee machine, which is a kind of three-layer network of threshold elements, cannot be equivalently transformed to a two-layer network. This fact asserts that the proposed committee machine provides a family of discriminant functions which is intrinsically wider than that of the usual committee machine.  相似文献   

20.
肖丽  张伟  张元清 《计算机科学》2007,34(8):199-201
本文提出一种结合自适应局部搜索的混合粒子群优化算法.该方法在粒子群优化算法的全局搜索过程中,使用能根据当前种群搜索状态自适应地调整局部搜索空间大小的局部搜索算法加强其局部搜索能力.采用了著名的基准函数对算法的性能进行测试,并与其他已有算法进行了比较.结果表明,这种混合粒子群优化算法能获得更高的搜索成功率和质量更好的解,特别在高维复杂函数优化上具有很强的竞争力.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号