基于模式增长的高效用序列模式挖掘算法 |
| |
引用本文: | 唐辉军, 王乐, 樊成立. 基于模式增长的高效用序列模式挖掘算法.自动化学报, 2021, 47(4): 943-954 doi: 10.16383/j.aas.c180660 |
| |
作者姓名: | 唐辉军 王乐 樊成立 |
| |
作者单位: | 1.宁波财经学院金融与信息学院 宁波 315175;2.宁波财经学院数字技术与工程学院 宁波 315175 |
| |
基金项目: | 浙江省公益技术应用研究计划项目LGF19H180002浙江省公益技术应用研究计划项目2017C35014宁波市自然科学基金项目2017A610122慈溪市社会发展科技计划项目CN2018001 |
| |
摘 要: |  高效用序列模式挖掘是数据挖掘领域的一项重要内容, 在生物信息学、消费行为分析等方面具有重要的应用.与传统基于频繁项模式挖掘方法不同, 高效用序列模式挖掘不仅考虑项集的内外效用, 更突出项集的时间序列含义, 计算复杂度较高.尽管已经有一定数量的算法被提出应用于解决该类问题, 挖掘算法的时空效率依然成为该领域的主要研究热点问题.鉴于此, 本文提出一个基于模式增长的高效用序列模式挖掘算法HUSP-FP.依据高效用序列项集必须满足事务效用闭包属性要求, 算法首先在去除无用项后建立全局树, 进而采用模式增长方法从全局树上获取全部高效用序列模式, 避免产生候选项集. 在实验环节与目前效率较好的HUSP-Miner、USPAN、HUS-Span三类算法进行了时空计算对比, 实验结果表明本文给出算法在较小阈值下仍能有效挖掘到相关序列模式, 并且在计算时间和空间使用效率两方面取得了较大的提高.

|
关 键 词: | 高效用序列模式 模式增长 闭包属性 数据挖掘 |
收稿时间: | 2018-10-11 |
|
| 点击此处可从《自动化学报》浏览原始摘要信息 |
|
点击此处可从《自动化学报》下载免费的PDF全文 |
|