排序方式: 共有3条查询结果,搜索用时 0 毫秒
1
1.
特征选择是文本分类的一个重要步骤。分析了互信息,针对其不足引进了粗糙集给出了一个基于关系积的属性约简算法,并以此为基础提出了一个新的适用于海量文本数据集的特征选择方法。该方法使互信息进行特征初选,利用基于关系积的属性约简算法消除冗余词。实验结果表明此种特征选择方法的微平均F1和宏平均F1较高。 相似文献
2.
基于类别相关性和优化的ID3特征选择 总被引:1,自引:0,他引:1
简单分析了词频方法和文档频方法,在总结其不足的基础上,提出了一个类别相关性方法,随后分析了ID 3中信息增益的缺点并引进属性依赖度来加以改进,并进一步根据其中信息增益的计算特点,利用凸函数的性质来进行简化,减少了信息增益的计算量,提高了信息增益的计算效率;最后将此优化的ID 3同类别相关性方法结合起来,提出了一个综合的特征选择方法。该综合方法首先使用类别相关性方法进行特征初选以降低文本向量的稀疏性,然后再使用优化的ID 3来进一步选择特征,从而获得较具代表性的特征子集。实验结果表明该方法性能良好。 相似文献
3.
为基于差别矩阵的属性约简算法求解时,先要求出差别矩阵,问题规模增大,将导致存放差别矩阵的空间过大和算法执行时间过长.针对这一问题,本文提出了辨识集的定义,并利用辨识集设计了新的属性约简算法,减少了存储量和计算量,提高了算法的效率. 相似文献
1