排序方式: 共有63条查询结果,搜索用时 15 毫秒
31.
已有的多标签懒惰学习算法(IMLLA)在利用近邻标签时因仅考虑了近邻标签相关性信息,而忽略相似度的影响,这可能会使算法的鲁棒性有所降低。针对这个问题,引入萤火虫方法,将相似度信息与标签信息相结合,提出一种融合萤火虫方法的多标签懒惰学习算法(FF-MLLA)。首先,利用Minkowski距离来度量样本间相似度,从而找到近邻点;然后,结合标签近邻点和萤火虫方法对标签计数向量进行改进;最后,使用奇异值分解(SVD)与核极限学习机(ELM)进行线性分类。该算法同时考虑了标签信息与相似度信息从而提高了鲁棒性。实验结果表明,所提算法较其他的多标签学习算法有一定优势,并使用统计假设检验与稳定性分析进一步说明所提出算法的合理性与有效性。 相似文献
32.
传统的文本分类多以空间向量模型为基础,采用层次分类树模型进行统计分析,该模型多数没有结合特征项语义信息,因此可能产生大量频繁语义模式,增加了分类路径。结合基本显露模式(eEP)在分类上的良好区分特性和基于最小期望风险代价的决策粗糙集模型,提出了一种阈值优化的文本语义分类算法TSCTO:在获取文档特征项频率分布表之后,首先利用粗糙集联合决策分布密度矩阵,计算最小阈值,提取满足一定阈值的高频词;然后结合语义分析与逆向文档频率方法获取基于语义类内文档频率的高频词;采用eEP分类方法获得最简模式;最后利用相似性公式和《知网》提供的语义相关度,计算文本相似性得分,利用三支决策理论对阈值进行选择。实验结果表明,TSCTO算法在文本分类的性能上有一定提升。 相似文献
33.
从原始信息系统出发,用不可分辨类的思想求解系统的核属性和约简是粗集理论的精华。因此,如何在计算机上实现这种思想关系到读者对粗集理论抽象概念的理解。文中利用MATLAB语言编程实现了不可分辨类算法。考虑该语言的特点,首先将原始信息系统转换为数字型矩阵,然后自定义用户函数attvalist,并结合MATLAB语言中丰富的矩阵与向量运算函数,不经复杂的编程完成了样本分类。 相似文献
34.
35.
在多标记分类中,某个标记可能只由其自身的某些特有属性决定,这些特定属性称之为类属属性利用类属属性进行多标记分类,可以有效避免某些无用特征影响构建分类模型的性能然而类属属性算法仅从标记角度去提取重要特征,而忽略了从特征角度去提取重要标记事实上,如果能从特征角度提前关注某些标记,更容易获取这些标记的特有属性基于此,提出了一... 相似文献
36.
水下对转螺旋桨空化线谱频率预报与数值模拟 总被引:3,自引:1,他引:3
水下高速目标对转螺旋桨常工作在空化状态,其噪声线谱由前后桨相互作用及前后桨 与船舶尾流场的相互作用引起。通过Goldstein 的声相似方程,将空泡看作螺旋桨的一部分,对空 化条件下水下对转螺旋桨的线谱频率进行了理论预报。推导出了远场条件下单极子源性质的声源 所产生的声压表达式,得到了其线谱预报频率。利用Schnerr-sauer 空化模型及RNG k-着湍流模型, 并采用动网格模型对对转螺旋桨进行空化数值模拟。结果表明:预报的DTMB4381 螺旋桨空泡形 态与公开发表实验及数值模拟结果吻合度较好。利用该方法得到的对转螺旋桨空化线谱频率与理 论预报结果完全吻合。 相似文献
37.
38.
程玉胜 《计算机工程与应用》2010,46(10):41-43
知识约简是粗糙集理论研究的核心内容之一。目前,以分布密度为基础的分布约简/分配约简主要集中在对论域中每个对象或每个对象所在的类与决策类的关系展开,因此当论域对象较多时这些方法的应用受到了一定限制,基于变精度粗糙集模型理论和决策表整体确定性的度量方法,通过构造β+正域去定义β+依赖性,获得了在有分类误差情况下决策表整体最大确定性的度量方法,基于此提出了β+依赖性近似约简,通过数值计算和实验仿真,说明该方法是可行的,进而拓展了变精度粗糙集模型近似约简方法。 相似文献
39.
B-树是一种平衡的多路查找树,在文件系统中有着很好的应用。该文分析了在B-树中删除一个关键词的几种情形,给出了B-树删除算法的具体实现,有助于对《数据结构》课程中B-树操作的更好理解。 相似文献
40.
传统的多标签学习算法一般没有考虑标签的不均衡性,从而忽略了标签不平衡给分类带来的影响。但统计发现,目前常用的多标签数据集均存在标签不均衡问题,且少数类标签往往更加重要。基于此,本文提出了一种基于分类间隔增强的不平衡多标签学习算法(Imbalanced multi-label learning algorithm based on classification interval enhanced, MLCIE),旨在利用各标签分类间隔的重构来增强分类器对少数类标签样本的学习效率,提升样本标签质量,从而减少多标签不平衡对分类器学习精度的影响。首先利用各标签密度与条件熵计算各标签的不确定性系数;然后构建分类间隔增强矩阵,将各标签独有的密度信息融入到原始标签矩阵中,获取平衡的标签空间;最后使用极限学习机作为线性分类器进行分类。本文在11个多标签标准数据集上与其他7种多标签学习算法进行对比实验,结果表明本文算法在解决标签不平衡问题上有一定效果。 相似文献