摘 要: | 在频繁项集挖掘过程中会发现事务或关系数据集中项目具有不同的重要性,而一些经典的频繁模式挖掘算法仅考虑项目频数这一属性来进行挖掘操作。针对该问题为不同的项目添加不同权重,提出一个新的加权规则模型,定义一种特殊的模式即显著模式。构造一棵类似于FPTree树的、具有高度压缩存储特性的数据结构树——SPTree(Significant Pattern Tree),之后基于SPTree树提出一个新颖的挖掘显著模式的算法DMSP(Data Mining Significant Pattern)。实验结果验证DMSP算法能够高效地挖掘显著模式。该算法可以有效解决由于项目重要性各不相同而导致的问题,有利于发现更多有研究价值的信息。
|