期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

万晓松王志海原继东《计算机应用》2015,35(10):2733-2736

为了提高学术论文检索的精准性,进而为学术研究提供便利,提出了针对学术论文检索问题的排名策略。首先,介绍了基于网页排名算法面向论文索引排名的启发式方法,其中利用Hash索引技术有效地减少了稀疏矩阵计算对内存的消耗;其次,定义了论文间引用关系图的密集度均衡值,并通过大量实验阐明了不同排名算法的迭代次数与图密集度均衡值之间的关系;最后,将所提出的基于论文索引排名的启发式算法应用于科学引文索引(SCI)数据库中,并与原被引频次降序的排序结果进行比较与分析。实验结果表明:在三种基于网页排名技术的算法中,基于链接结构分析的随机过程算法比较适合于按关键词搜索得到的相关领域学术论文的排名。相似文献

2.

时间序列可变尺度的时频特征求解及其分类

魏池璇王志海原继东林钱洪《软件学报》2022,33(12):4411-4428

对于许多实际应用来说,获取多个不同窗口尺度上的模式,有助于发现时间序列的不同规律性特征.同时,通过对时间序列时域和频域两方面的分析,有助于挖掘更多的知识.提出了一种新的基于可变尺度的时域频域辨别性特征挖掘方法以及应用于分类的算法.主要采用了不同尺度窗口、符号聚合近似技术以及符号傅里叶近似技术等,以有效地发掘时间序列不同尺度时域频域模式;与此同时,使用统计学方法挖掘部分最具辨别性的特征用于时间序列分类,有效地降低了算法时间复杂度.在多个数据集上的对比实验结果,说明了该算法具有较高的准确率;在真实数据集上的解析,表明了该算法具有更强的可解释性.同时,该算法可扩展应用到多维时间序列分类问题中. 相似文献

3.

一种基于时间衰减模型的数据流闭合模式挖掘方法 总被引：1，自引：0，他引：1

韩萌王志海原继东《计算机学报》2015,(7)

数据流是随着时间顺序快速变化的和连续的,对其进行频繁模式挖掘时会出现概念漂移现象。在一些数据流应用中,通常认为最新的数据具有最大的价值。数据流挖掘会产生大量无用的模式,为了减少无用模式且保证无损压缩,需要挖掘闭合模式。因此,提出了一种基于时间衰减模型和闭合算子的数据流闭合模式挖掘方式TDMCS （Time-Decay-Model-based Closed frequent pattern mining on data Stream）。该算法采用时间衰减模型来区分滑动窗口内的历史和新近事务权重,使用闭合算子提高闭合模式挖掘的效率,设计使用最小支持度-最大误差率-衰减因子的三层架构避免概念漂移,设计一种均值衰减因子平衡算法的高查全率和高查准率。实验分析表明该算法适用于挖掘高密度、长模式的数据流;且具有较高的效率,在不同大小的滑动窗口条件下性能表现是稳态的,同时也优于其他同类算法。相似文献

4.

基于Shapelet剪枝和覆盖的时间序列分类算法 总被引：2，自引：0，他引：2

原继东王志海韩萌《软件学报》2015,26(9):2311-2325

时间序列shapelets是时间序列中能够最大限度地表示一个类别的子序列.解决时间序列分类问题的有效途径之一是通过shapelets转换技术,将shapelets的发现与分类器的构建相分离,其主要优点是优化了shapelets的选择过程,并能够灵活应用不同的分类策略.但该方法也存在不足:一是在shapelets转换时,用于产生最好分类结果的shapelets数量是很难确定的;二是被选择的shapelets之间往往存在着较大的相似性.针对这两个问题,首先提出了一种简单有效的shapelet剪枝技术,用于过滤掉相似的shapelets;其次,提出了一种基于shapelets覆盖的方法来确定用于数据转换的shapelets的数量.通过在多个数据集上的测试实验,表明了所提出的算法具有更高的分类准确率. 相似文献

5.

一种基于Shapelets的懒惰式时间序列分类算法

王志海张伟原继东刘海洋《计算机学报》2019,42(1)

相似文献

6.

一种基于数据流模式表示的半懒惰式分类算法

江晶晶王志海原继东《计算机科学》2017,44(7):167-174, 202

依据从大规模数据中抽取的模式来建立分类模型是模式挖掘的重要研究问题之一。一种可行的方法是根据模式集合建立贝叶斯分类模型。然而,目前基于模式的贝叶斯分类模型大多是针对静态数据集合的,通常不能适应于高速动态变化与无限的数据流环境。对此,提出一种数据流环境下基于模式发现的贝叶斯分类学习模型,其采用半懒惰式学习策略,针对分类实例在不断更新的频繁项集合上建立局部的分类模型;为加快流数据处理的速度,提出了结构更为简单的混合树结构,同时提出了给定项限制的模式抽取机制以减少候选项集的生成;对数据流中模式抽取不完全的情况,使用平滑技术处理未被抽取的项。大量实验分析证明,相较于其他数据流分类器,所提模型具有更高的分类正确率。相似文献

7.

一种时间序列鉴别性特征字典构建算法

张伟王志海原继东郝石磊《软件学报》2020,31(10):3216-3237

时间序列数据广泛产生于科技和经济的多个领域.基于符号傅里叶近似（symbolic Fourier approximation）和滑动窗口的定长单词抽取算法是目前时间序列特征字典构建过程中最有效的特征生成算法之一,但是该算法在特征生成过程中不能根据不同滑动窗口长度动态地选择保留的最优傅里叶值的个数,而且特征字典构建过程中缺少从生成的海量特征中对鉴别性特征进行有效选择的算法.为此,提出一种鉴别性特征字典构建算法.首先,提出一种针对不同长度滑动窗口学习最优单词长度的基于Fourier近似的可变长度单词抽取方法;其次,构建了一种新的特征鉴别性评价指标,并依据其动态阈值对生成的特征进行选择.实验结果表明,基于构建的特征字典的逻辑回归模型不仅分类精度高,而且可以有效发现预测过程中的鉴别性特征. 相似文献

8.

基于CAS理论的出版企业成长路径的选择与仿真

原继东王树恩《工业工程》2012,15(4):89-95

从复杂适应系统(CAS)理论角度认知我国出版企业成长的路径选择行为模式,提出出版企业成长的自主发展型、动态模仿型和创新涌现型3种路径选择。基于多主体建模思想和Swarm仿真平台,通过出版企业主体描述、行为规则设定、市场环境模拟和选择遗传算法等方式,构建不完全竞争出版市场环境下多出版企业主体竞争博弈的成长路径选择仿真模型。仿真结果表明出版企业市场经历常规产品竞争、创新涌现竞争和动态模仿竞争3个典型成长阶段,据此提出了出版企业在各阶段成长的战略选择。相似文献

9.

时间序列的表示与分类算法综述 总被引：1，自引：0，他引：1

原继东王志海《计算机科学》2015,42(3):1-7

时间序列是按照时间排序的一组随机变量,它通常是在相等间隔的时间段内,依照给定的采样率,对某种潜在过程进行观测的结果。时间序列数据广泛地存在于商业、农业、气象、生物科学以及生态学等诸多领域,从时间序列中发现有用的知识已成为数据挖掘领域的研究热点之一。在时间序列表示方面,主要介绍了非数据适应性表示方法、数据适应性表示方法和基于模型的表示方法;针对时间序列的分类方法,着重介绍了基于时域相似性、形状相似性和变化相似性的分类算法,并对未来的研究方向进行了进一步的展望。相似文献

10.

基于逻辑 shapelets 转换的时间序列分类算法

原继东王志海韩萌游洋《计算机学报》2015,(7)

时间序列 shapelets 是序列之中最具有辨别性的子序列。解决时间序列分类问题的有效途径之一是通过shapelets 转换技术,将其发现与分类器的构建相分离,其主要优点是优化了 shapelets 的选择过程并能够灵活应用不同的分类策略。但此方法也存在不足,仅仅简单地应用这些 shapelets 而忽略它们之间的逻辑组合关系,有可能降低分类的效果;另外,离线式的发现 shapelets 的过程是相当耗时的。文中针对后一个问题,采用了一种基于智能缓存的计算重用技术,将发现 shapelets 的时间复杂度降低了一个数量级。在此基础上,作者提出了一种基于合取或析取的逻辑 shapelets 转换方法,并通过在多个经典的基准数据集上测试,表明了该方法能够在提升分类准确性的同时保持 shapelets 所具有的解释力。相似文献