基于粒度计算的覆盖算法在文本挖掘中的应用研究 |
| |
引用本文: | 周瑛,牛浏.基于粒度计算的覆盖算法在文本挖掘中的应用研究[J].数字社区&智能家居,2014(11):2548-2552,2566. |
| |
作者姓名: | 周瑛 牛浏 |
| |
作者单位: | 安徽大学管理学院; |
| |
基金项目: | 教育部人文社科基金项目“基于粒度计算理论的文本挖掘技术的研究”(项目编号:11YJA870032)的研究成果之一 |
| |
摘 要: | 该文首先分析了粒度计算的研究现状和原覆盖算法里面存在的缺点,即测试样本识别时拒识的概率较大以及当所得的覆盖存在交叉时,测试样本的类别确定问题,然后应用基于商空间的粒度计算理论针对覆盖算法的第一个缺点进行改进和优化,即对覆盖算法中的拒识样本进行二次处理。通过改变处理问题的粒度,使覆盖粒度在由粗到细的变化过程中,实现对拒识样本的渐进识别,在更细的空间中减少拒识的样本数,提高识别率。最后在中文文本数据库中使用优化后的覆盖算法,该数据库已进行过预处理。实验结果显示,这种优化后的方法减少了测试样本识别时的拒识样本数量,降低了识别样本时的出错率,有效地提高了实验结果的精度。
|
关 键 词: | 覆盖算法 粒度计算 商空间理论 文本挖掘 |
本文献已被 CNKI 等数据库收录! |
|