首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 70 毫秒
1.
文本分类中普遍应用的TF-IDF特征权重算法没有引入特征项的纯度和类别属性.在结合基尼指数原理和TF-IDF特征权重算法基础上,提出一种基于基尼指数的特征权重改进算法,在计算特征权重时引入特征项的纯度和分类的已知类别属性.进一步,设计了两种特征权重算法的对比实验,并在SVM分类器和kNN分类器下选取不同的特征项数目进行多次实验.实验结果表明,该改进的基尼指数特征权重算法有更好的效果.  相似文献   

2.
在无线传感器网络中进行感知数据查询,必须考虑传感器节点能量受限的特性.提出了一种基于过滤器的无线传感器网络近似一维K-NN查询优化算法FAKNN. FAKNN算法利用样本数据为每一个节点设置一个经验取值区间,并针对查询选择样本数据均值距离查询点最近的部分节点构成候选结果集.由于用户对查询结果的满意度与候选节点的个数和越界概率有关,因此需要通过计算节点的越界概率来确定最终候选结果集,并将候选节点的经验取值区间作为过滤器随查询请求发送到全网.节点利用过滤规则阻止数据发送,从而节省节点能量.仿真实验表明,FAKNN算法在保证查询准确率的同时,可大幅降低查询通信量.  相似文献   

3.
一种基于区分度的信息系统属性约简算法   总被引:1,自引:0,他引:1  
在完备信息系统中,通过引入区分度的概念,以相对区分度为启发式信息,提出一种基于区分度的属性约简启发式算法,并对该算法的时间复杂性进行了分析,最后通过例子说明,该算法能得到完备信息系统的一个约简.  相似文献   

4.
目前诸多的综合测评方法在权重设置等方面的局限性制约了人们对评价对象的科学认识,本文根据Rough 集理论,提出了基于Rough 集的综合评价方法,旨在消除权重设置的主观性,实现完全数据驱动,不需要人为设置权重.通过大学生综合测评实例,验证该方法的实用性、可行性.  相似文献   

5.
一种基于标记的改进RED算法   总被引:1,自引:0,他引:1  
随机早期检测RED算法是主动式队列管理算法(AQM)的代表算法,本文着重分析RED算法的参数配置缺陷,并利用NS2模拟器进行了实验论证.根据实验分析,本文结合标记思想和参数动态设置,提出新的RED改进算法,并通过仿真实验进行验证.实验结果表明,改进算法在一系列性能指标方面有了一定的提高.  相似文献   

6.
针对海量Web文本信息,利用从网页主题内容提取出来的特征关键词,在倒排索引基础上建立相似度计算模型.对一篇新入库的网页文档,利用所包含的关键词迅速缩小计算范围,提高计算效率.实验结果表明该算法是有效的,小规模评测结果得到较好的效果.  相似文献   

7.
由于粗糙集只能对离散属性进行处理,因而连续属性的离散化也就成了粗糙集的主要问题之一.提出了一种从模糊聚类出发的离散化方法,并给出了一个判别函数,由该函数从聚类结果中选择最优的一个解,因而是一种自寻优的求解过程,避免了人为划分类数的主观影响.最后进行了实验比较,证实了该方法的有效性和合理性.  相似文献   

8.
蔡勇  武海峰 《微计算机信息》2008,24(12):168-169
传统的Web Services技术已经不能充分利用语义信息,因此不能够解决服务能力的匹配问题和基于功能的服务定位问题,而Web服务和语义Web结合产生的语义Web服务技术为此提供了一种可行的解决办法.本文充分利用了语义本体的特性,提出了一种基于OWL本体的服务组合算法,并通过对Web Services本体的描述,构建,通过模型实现及实例来验证算法的可行性.  相似文献   

9.
分析现有复杂背景下运动目标检测与分割算法存在的不足,提出一种基于帧间差分与时空相关性分析的运动目标检测算法.结合帧图象中象素的空间相关性和帧间差分进行运动目标的分离,用序列图象中运动目标所具有的时间相关性来验证目标的真实性,剔除虚假的运动信息.实验结果表明,能较好地检测出目标,具有较好地抗干扰能力.  相似文献   

10.
为了保证对电压质量要求较高的敏感负载正常工作,需要及时补偿供电系统的电压波动以维持用户电压稳定.根据这一目的提出一种快速电压补偿算法,该算法使控制电路能够迅速检测出电压波动并输出补偿信号.利用数字处理芯片TMS320F2812实现该算法,并进行了控制系统的相关设计.实验结果证明该算法以及采用的控制器能够快速检测出电压波动量,并驱动功率电路实现电压的及时补偿.  相似文献   

11.
12.
引进了一种新的 skyline 查询类型,不仅考虑最大/最小的硬属性,还考虑时间属性以及这些不同的属性类型之间的关系。找到时间属性和控制关系之间的相互关联,基于这一发现,定义了一种新的基于时间聚集的控制关系;利用时间聚集来分析和时间因素有关时,商品在竞争市场上的定位问题,并提出了一个有效地处理时间聚集控制关系查询的方法——角转换。实验使用真实数据和不同的合成数据,证明了这种新的查询类型确实是有意义的,提出的算法高效、可扩展。  相似文献   

13.
徐晓丹  姚明海  刘华文  郑忠龙 《计算机科学》2015,42(5):106-108, 131
多标签学习已成为当前机器学习的研究热点.为了提高分类性能,对训练集中的噪声数据进行预处理,提出一种基于k近邻(kNN)的多标签分类去噪方法:对现有的多标签数据集进行分析后获得近似正态分布的特征,通过将噪声标记改为其k近邻标记的方法,滤去部分噪声信息,从而得到相对高质量的数据集.在MULAN平台上使用多个数据集对6种多标签分类算法进行了噪声去除前后的对比测试,实验结果表明,多标签的预处理方法有效提高了分类器的性能.此方法对于分布特征明显的数据集具有较好的适用性.  相似文献   

14.
非侵入式负荷监测(Non-intrusive Load Monitoring,NILM)通过分析电力总回路的电气信息得到回路中各电器的运行数据,为用户的节能优化和电网的优化调度提供依据。现有NILM方法主要将研究重点放在提高负荷识别准确度上,模型复杂度高,难以在嵌入式设备上应用。针对上述问题,提出一种基于改进kNN算法与暂稳态特征的NILM方法。首先选择无需训练的kNN算法作为负荷识别模型,采用距离权重统计方法对kNN算法进行改进,并增加余弦相似度判断机制检验kNN算法负荷识别结果准确性;然后选择暂态特征和稳态特征作为负荷特征以提高负荷特征辨识度;最后利用实验采集数据进行验证,上述NILM方法具有良好的性能。  相似文献   

15.
工业过程数据变量呈现非线性、非高斯性与变量之间分布不均等问题。针对数据变量分布不均等问题,提出利用高斯混合模型GMM(Gaussian mixture model),将马氏距离(Mahalanobis distance)与kNN(k nearest neighbors)相结合的故障检测方法,即:基于GMM的马氏距离kNN故障检测方法(GMM—MDkNN)。首先利用高斯混合模型GMM将训练样本数据分为K类,然后利用相应数据类的变量协方差信息计算样本间的马氏距离,得到样本的k近邻样本马氏距离和,并将其作为故障检测的指标。将此方法应用到TE连续工业过程监测实例中,结果表明了该方法的有效性。  相似文献   

16.
17.
在物流末端的配送服务中,实时揽件调度研究尚处于空白。基于GIS技术、Web技术和移动开发技术,构建了针对“最后一公里”配送的智能物流信息系统。在此系统框架内,改进加权kNN分类算法实现快递人员的实时揽件调度。通过在菜鸟驿站某网点配送活动中的应用,表明智能物流信息系统能有效提升物流网点的服务质量,实时揽件调度方法也对解决实际问题效果显著。  相似文献   

18.
Kernel-kNN: 基于信息能度量的核k-最近邻算法   总被引:2,自引:0,他引:2  
刘松华  张军英  许进  贾宏恩 《自动化学报》2010,36(12):1681-1688
提出一种核k最近邻算法. 首先给出用于最近邻学习的信息能度量方法, 该方法克服了高维数据不便于用传统距离度量表示的困难, 提高了数据间类别相似性和距离的一致性. 在此基础上, 将传统的kNN扩展为非线性形式, 并采用半正定规划学习全局最优的度量矩阵. 算法主要特点是: 能较好地适用于高维数据, 并有效提升kNN 的分类性能. 多个数据集的实验和分析表明, 本文的Kernel-kNN算法与传统的kNN算法比较, 在低维数据上, 分类准确率相当; 在高维数据上, 分类性能有明显提高.  相似文献   

19.
张震  胡捍英 《计算机工程》2005,31(15):160-161,171
提出了用于增强kNN的属性Bagging(ABagging),ABagging通过对属性重抽样而不是对训练实例重抽样来获得多个训练集。kNN对于属性重抽样不稳定,因而ABagging能有效降低kNN的错误率。ABaggingkNN对于不相关属性也有比kNN强得多的抵抗力。另外Abagging kNN的速度也比Bagging kNN更快。用UCI数据集证明了ABagging kNN的有效性。  相似文献   

20.
基于MapReduce快速kNN Join方法   总被引:2,自引:0,他引:2  
kNN连接是空间数据库领域里一个基本而又重要的问题,被广泛地应用于多个其他领域.它对提高众多实际应用的性能有着重要意义.随着目前参加kNN连接的数据集的增大和要求的响应时间的缩短(尤其在一些应急环境中),作者实际上对kNN连接的效率要求更高.然而,目前的方法大多基于单个进程或者单台机器,并不具有很好的伸缩性.为了解决这个问题,作者引入了map-reduce框架来运行kNNjoin并提出了两种新的方法:基于map-reduce的分布式网格概略化kNN join(DSGMP-J)和基于map-reduce的voronoi diagram下kNN join(VDMP-J).并把它们和最新的方法H-BNLJ进行了实验对比.实验结果证明了作者提出的DSGMP-J和VDMP-J方法具有较优的伸缩性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号