首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
朱坤  刘林峰  吴家皋 《计算机科学》2018,45(12):61-65, 85
针对机会网络中数据送达率较低的问题,文中根据节点历史接触信息即节点相遇次数、相遇时间长度、节点关系稳定性来计算节点转发效用值。首先选择通信范围内效用值最大的邻居节点作为初始转发节点,再根据余弦相似度选择其他转发节点,使得转发节点能够尽可能均匀地分布。在此基础上,提出一种基于节点位置余弦相似度的机会网络转发算法(Opportunistic Network forwarding algorithm based on Node Cosine Similarity,ONNCS)。该算法使得转发节点能够均匀地分布,因此数据报文能够尽快地被转发到目的节点。实验结果表明,ONNCS具有较高的转发成功率和较低的转发能耗,转发成功率高出其他算法5%~8%。  相似文献   

2.
基于TF-IDF和余弦相似度的文本分类方法   总被引:1,自引:0,他引:1  
文本分类是文本处理的基本任务。大数据处理时代的到来致使文本分类问题面临着新的挑战。研究者已经针对不同情况提出多种文本分类算法,如KNN、朴素贝叶斯、支持向量机及一系列改进算法。这些算法的性能取决于固定数据集,不具有自学习功能。该文提出一种新的文本分类方法,包括三个步骤: 基于TF-IDF方法提取类别关键词;通过类别关键词和待分类文本关键词的相似性进行文本分类;在分类过程中更新类别关键词改进分类器性能。仿真实验结果表明,本文提出方法的准确度较目前常用方法有较大提高,在实验数据集上分类准确度达到90%,当文本数据量较大时,分类准确度可达到95%。算法初次使用时,需要一定的训练样本和训练时间,但分类时间可下降到其他算法的十分之一。该方法具有自学习模块,在分类过程中,可以根据分类经验自动更新类别关键词,保证分类器准确率,具有很强的现实应用性。  相似文献   

3.
面对大量样本特征时很多分类器无法取得较好的分类效果,样本数有限导致贝叶斯算法无法获得精确的联合概率分布估计,在样本局部构建高质量分类器需要有效的样本相似性度量指标. 针对以上问题,提出了一种基于余弦相似度进行实例加权改进的朴素贝叶斯分类算法. 算法考虑特征对分类的决策权重不同,使用余弦相似度度量样本的相似性,选出最优训练样本子集,用相似度值作为训练样本的权值来训练修正后的贝叶斯模型进行分类. 基于UCI数据集的对比实验结果表明,提出的改进算法易于实现且具有更高的平均分类准确率.  相似文献   

4.
蔡发群 《软件工程》2022,(11):39-43
针对客服机器人答非所问的情况,提出一种结合循环神经网络学习算法LSTM(Long Short-Term Memory)、词频-逆文档频率(Term Frequency-Inverse Document Frequency, TF-IDF)算法及余弦相似度算法的客服机器人设计方法。LSTM算法利用长短记忆法更有利于联系上下文进行分词,分词准确率更高。TF-IDF算法可以将非结构化的客户提问和问题库问题用结构化的向量表示出来。通过余弦相似度算法对客户提问标签和问题库标签进行匹配,可以将最优答复提交给客户。试验结果显示,客户提问与问题A的余弦相似度值只有0.52左右,而与问题B的余弦相似度值达0.81,因此可以很好地实现答复推荐。  相似文献   

5.
针对现有计算机病毒特征提取算法无法有效提取未知病毒和变种病毒的特征,本文借鉴人工免疫思想,提出一种基于人工免疫结合余弦相似度的病毒特征提取算法。在代码层,算法采用TF-IDF对病毒DNA进行趋向性提取建立病毒候选基因库;在基因层,算法利用可变r匹配规则提取病毒候选基因库生产病毒检测基因库;在程序层,算法采用余弦相似度算法评估待测程序与病毒的相似度,对待测程序进行识别。经仿真实验,本算法与其他病毒特征提取算法相比,在较低虚警率的情况下有较高的病毒识别率。  相似文献   

6.
针对传统C4.5算法存在容易产生冗余规则、决策树规模过大、分类速度过慢等问题,提出一种基于余弦相似度的改进C4.5决策树算法。计算每个属性的信息熵和增益率,如果任意属性的任意两个属性值的信息熵之差在一个很小范围内时,计算两个属性值的余弦相似度;合并相似度在阈值范围内的属性值,重新计算合并后属性的信息增益率,依据传统的C4.5算法进行计算。抽取某医院普检数据进行仿真,仿真结果表明,所提算法能够有效降低分裂属性维度,缩减了决策树规模,减少了冗余规则,提高了分类速度。  相似文献   

7.
陈俊  何庆 《计算机应用》2021,41(9):2668-2677
针对蝴蝶优化算法(BOA)容易陷入局部最优和收敛性差等问题,提出一种多策略改进的蝴蝶优化算法(MSBOA)。首先引入余弦相似度位置调整策略,通过旋转变化算子和伸缩变换算子进行位置更新,从而有效地保持BOA的种群多样性;其次引入动态切换概率,来平衡BOA局部阶段和全局阶段的转换;最后增加混合惯性权重策略,以提高BOA的收敛速度。使用16个基准测试函数、Wilcoxon检验以及部分CEC2014函数来验证MSBOA的有效性和鲁棒性。仿真实验结果表明,与BOA和其他改进策略BOA及其他群智能算法相比,MSBOA在收敛精度和收敛速度上有明显的提升。  相似文献   

8.
传统的协同过滤推荐算法存在数据稀疏情况下分类准确性低的问题,针对于此提出一种基于改进余弦相似度的协同过滤推荐算法,将数据经嵌入层转换为特征矩阵,将对其计算后得到的改进余弦相似度矩阵和单位矩阵之间的均方误差作为损失函数,从而提高推荐算法在数据稀疏情况下的分类准确性。实验结果表明,该算法的AUC和对数损失函数指标均优于基线模型FM、FFM和DeepFM模型。  相似文献   

9.
基本的非负矩阵分解应用于图像聚类时,对异常点的处理不够鲁棒,稀疏性较差。为了提高分解后的矩阵的稀疏性,在基本的非负矩阵分解算法中引入了L2,1范数,对基本的非负矩阵分解模型进行了改进,从而实现稀疏性,提升算法的性能。同时,为了降低各特征之间的关联,强化非负矩阵分解模型特征的独立性,引入了余弦相似度,提出了基于余弦相似度的稀疏非负矩阵分解算法。该算法在处理高维数据和提取特征方面具有显著优势,并且可提高算法在图像聚类中的辨别准确性。实验结果表明,所提算法在一系列评价指标上的效果优于传统的非负矩阵分解算法。  相似文献   

10.
基于位置指纹的室内定位系统能够实现较高精度的定位,其中KNN(K-nearest neighbor)和余弦相似度定位算法原理简单且易于实现。但每种算法仅从单一限制条件进行匹配,导致定位精度不高。针对此问题,提出基于余弦相似度的加权KNN算法,并通过实验测试算法的定位性能。实测结果表明,该算法的定位精度高于传统定位算法。当AP数量为5时,平均误差为1.67 m。定位精度优于1 m的置信概率为42%,优于2 m的置信概率为88%,最大定位误差为4.3 m。  相似文献   

11.
离群点检测是数据挖掘领域的重要研究方向之一,可以从大量数据中发现少量与多数数据有明显区别的数据对象。在诸如网络入侵、无线传感器网络异常事件等检测应用中,离群点检测是一项具有很高应用价值的技术。为了提高离群点检测准确度,文中在局部离群测度(SLOM)算法的基础上,作了一些改进,提出了一种基于密度的局部离群点检测算法ESLOM。引入信息熵确定数据对象的离群属性,并对对象距离采用加权距离,以提高离群点检测准确度。理论分析和实验表明该算法是可行有效的。  相似文献   

12.
离群点检测是数据挖掘领域的重要研究方向之一,其目的是找出数据集中与其他数据对象显著不同的一小部分数据。离群点检测在网络入侵检测、信用卡欺诈检测、医疗诊断等领域有着非常重要的应用。近年来,粗糙集理论被广泛用于离群点检测,然而,经典的粗糙集模型不能有效处理数值型数据。对此,本文利用邻域粗糙集模型来检测离群点,在邻域粗糙集中引入一种新的信息熵模型——邻域粒度熵。基于邻域粒度熵,提出一种新的离群点检测算法OD_NGE。实验结果表明,相对于已有的离群点检测算法,OD_NGE具有更好的离群点检测性能。  相似文献   

13.
基于局部信息熵的加权子空间离群点检测算法   总被引:7,自引:0,他引:7  
离群点检测作为数据挖掘的一个重要研究方向,可以从大量数据中发现少量与多数数据有明显区别的数据对象.“维度灾殃”现象的存在使得很多已有的离群点检测算法对高维数据不再有效.针对这一问题,提出基于局部信息熵的加权子空间离群点检测算法SPOD.通过对数据对象在各维进行邻域信息熵分析,生成数据对象相应的离群子空间和属性权向量,对离群子空间中的属性赋以较高的权值,进一步提出子空间加权距离等概念.采用基于密度离群点检测的思想,分析计算数据对象的子空间离群影响因子,判断是否为离群点.算法能够有效地适应于高维数据离群点检测,理论分析和实验结果表明算法是有效可行的.  相似文献   

14.
为了减少协同过滤算法存在的噪音数据以及数据稀疏性问题,提高算法准确性,本文提出一种基于信息熵和改进相似度的协同过滤算法,使用用户信息熵模型来判断噪音数据,排除噪音数据对实验结果的干扰;使用面向稀疏数据的改进相似度计算方法,使用全部评分数据而不是依靠共同的评分项来计算,对缓解稀疏数据对推荐结果的精确性影响有很大帮助。实验结果表明,该算法能在一定程度上排除噪音数据对结果的影响,缓解数据稀疏对推荐结果精确性的干扰,提高该推荐算法的精确性,且缓解了传统推荐系统算法中常见的一些问题,与传统的协同过滤算法相比,该算法的精确性更高。  相似文献   

15.
在时间序列相似性研究领域已经发展了多种方法用于时间序列的表示,以达到降低序列维度的目的.作为一种经典的时域-频域转换方法,离散余弦变换目前已经在图形图像处理等领域得到了广泛的应用.将此方法应用于时间序列的表示上,在变换后的数据上进行相似性查询等操作.实验表明,相对以前的方法,这种方法具有明显的性能提升.  相似文献   

16.
现有的基于反向策略的优化算法大多根据初始种群适应度值大小进行反向择优,没有充分考虑迭代过程中的反向且存在收敛速度慢的问题。针对此问题,提出一种基于余弦相似度反向策略的快速收敛自然计算方法,通过计算每个粒子与区域中心粒子的余弦相似度,将粒子划分为相似子群与非相似子群,对非相似子群按照相似程度进行加权反向,进而加快收敛速度,同时引入柯西扰动提高种群多样性。将该策略应用到三种不同的自然计算方法中,对收敛性进行分析,并采用12个经典测试函数验证其性能,对实验数据进行非参数检验。分析结果表明,应用余弦相似度反向策略的方法在大多数测试函数上表现优异,说明提出的方法具有很好的普适性和有效性。  相似文献   

17.
归纳图像调整过程中的相似性判据,提出一种基于相似性判据的图像调整算法。采用Seam Carving算法按一定调整量分步进行 图像尺寸调整,利用相似性判据判断调整图像的变形程度,当变形达到一定程度时,换用双向相似度迭代优化算法完成图像剩余尺寸的调整。实验结果表明,在图像调整量很大时,利用该图像调整算法仍可较好地维持图像的整体视觉效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号