排序方式: 共有151条查询结果,搜索用时 15 毫秒
41.
基于版本空间的并行概念学习 总被引:7,自引:0,他引:7
文中首先介绍了并分析版本空间的概念学习策略,然后提出了一个相应的并行概念学习算法。 相似文献
42.
应用于用户兴趣建模的多文本关键词抽取研究 总被引:1,自引:0,他引:1
现有的关键词抽取算法大部分是基于单篇文档的,虽然能成功抽取出单个文章的关键词,却无法满足针对多文档的关联检索.以单文档关键词抽取为基础,引入多文本文摘中的质心概念和MMR公式并加以变形,提出并分析比较了两种多文档关键词抽取算法:对内容相近的多篇文章进行关键词抽取,并按照权重生成关键词向最,建立基于关键词向量空间的用户兴趣模型.通过对5个主题100篇文章的测试表明,使用这两种算法提取出的关键词的准确率和召回率均达到了85%左右,能够较为准确地表示用户的兴趣模型. 相似文献
43.
44.
相似时间序列的快速检索算法 总被引:10,自引:0,他引:10
在前人提出的扩展时序数据距离定义的基础上 ,首先提出一种在时域上计算时序数据距离的新算法 ,该算法时间复杂度为 O( n× m ) ,能够解决时序数据在 Y轴上的漂移和伸缩带来的问题 ;之后提出一种在频域上计算时序数据距离的新算法 ,该算法时间复杂度仅为 O( n× fc) ,效率很高 ,便于在线实现 ,而且同样能够解决时序数据漂移和伸缩的问题 ;本文还给出和证明了该算法的一个重要组成部分 :时序数据增量式的 DFT算法 相似文献
45.
一种基于关联规则的中文概念集生成算法 总被引:1,自引:0,他引:1
本文提出了一种基于关联规则的中文概念集生成算法。该算法首先产生文档的中文关键词集,采用向量空间模型VSM(vector space model)表示文档;然后以中文关键词为事务项,以中文文档为事务,采用成熟的关联规则算法发现中文关键词频繁集;再生成原始概念集并对原始概念集进行聚类,最终实现了中文概念集的自生成,同时该算法能引入增量更新的特性,对概念集进行增量更新。通过实验,表明该算法能有效地生成中文概念集,可以用之于对表示中文文档的高维特征向量的语义降维,具有一定的使用价值。 相似文献
46.
基于内部信念状态POMDP模型在用户兴趣获取中的应用 总被引:3,自引:0,他引:3
随着智能人机界面的发展 ,用户兴趣获取的研究被引起广泛的重视 ,并有大量的学习模型 .本文根据有模型的POMDP结构 ,提出了基于内部信念状态的 POMDP结构 ,进行用户兴趣获取 ,使得系统既能够结合领域专家的知识 ,在模型中应用部分的用户兴趣结构 .又采用类似有模型的 POMDP结构 ,从而能够直接或者通过简单的转化 ,使用已有的大量成熟算法 ,规划用户兴趣获取的行为 .这里 ,本文研究了模型中参数的设置对用户兴趣获取的影响 . 相似文献
47.
分析了现有文章推荐系统中基于关键词向量的用户模型表示方法存在的不足,提出了基于聚类兴趣点的用户模型表示方法。该方法可通过文章聚类形成兴趣点。由于传统的基于划分的聚类算法存在的不足,提出了基于复杂网络特征的文章聚类算法。实验结果表明该用户模型的表示方法较好地反映了用户多方面的兴趣,提高了文章推荐系统的性能。 相似文献
48.
一种多尺度的时间序列相似模式匹配算法 总被引:3,自引:0,他引:3
提出一种多尺度的时间序列相似模式匹配算法,该算法用离散小波变换对时间序列进行多分辨分析,在多尺度上提取序列的形状特征,然后在不同的尺度上找出相似的序列和子序列模式,该算法可以匹配不同长度的序列,并能支持垂直平移变换和幅度伸缩变换。 相似文献
49.
增量式维护关联规则的时间窗口技术 总被引:3,自引:0,他引:3
数据库中的知识发现是指在大型数据集中识别有效、新奇、潜在有用、且最终可理解模式的非平凡的过程。人们已经提出了许多种知识发现算法,然而,人们对由于数据随时间变化而导致的所发现知识的更新维护问题却较少研究。本文提出一种用于增量式关联规则维护的时间窗口技术。该技术可以集中在当前数据中发现强关联规则。避免利用过时数据,为了避免在已有数据上重新发现,降低数据存储开销,我们保存了次强关联规则。 相似文献
50.