排序方式: 共有89条查询结果,搜索用时 15 毫秒
71.
特征选择是数据挖掘和机器学习等领域内重要的预处理步骤,近年来得到了广泛的关注。文本数据的高维性往往会影响分类等数据挖掘任务的效率,因此特征选择常被作为文本分类过程中的重要组成部分,以达到降维的目的。随着分类技术的快速发展,类别的日益细化,文本的多类分类问题为特征选择方法提出了更多的挑战。本文面向文本多类分类的应用背景,阐述了目前特征选择方法所面临的主要挑战,给出了多分类特征选择方法的主要种类。本文沿着相关研究的发展路线,由易至难,由浅入深,通过对目前多分类特征选择算法的应用情况进行总结,并进行综述评论,最后对全文进行了概括,提出了未来可能的研究方向。 相似文献
72.
当前,Web文本聚类主要存在三个挑战:数据规模海量性、高雏空间处理复杂性和聚类结果的可理解性。针对上述挑战,本文提出了一个基于top-k频繁词集和k-means的混合聚类算法topHDC。该算法在生成初始聚簇时避免了高维空间向量处理,k个频繁词集对聚类结果提供了可理解的解释。topHDC避免了已有算法中聚类结果受文档长度干扰的问题。在两个公共数据集上的实验证明,topHDC算法在聚类质量和运行效率上明显优于另外两个具有代表性的聚类算法。 相似文献
73.
数据流管理系统计算聚集查询结果保存在内存中形成流数据方(StreamCube),提供快速、精确的在线OLAP查询。有限的内存空间需要一种有效的存储方法来存储更大时间窗口的流数据方。提出一种基于QC-Tree结构的流数据方StreamQCTree生成、裁剪及查询方法。将QC-Tree结构中上界集划分为基本上界类和附加上界类;并分析附加上界类的成本计算模型;根据该模型在固定存储空间下,采用动态选择物化结点的方案选择物化部分附加上界类,使对StreamQCTree的平均查询响应时间最小。实验表明,StreamQCTree能够有效地访问数据方且获得较好的压缩效果。 相似文献
74.
针对骨干网上异常检测的特殊要求,提出了一种基于Filter-ary-Sketch数据结构的异常检测方法。该方法通过Filter-ary-Sketch实时记录网络流量信息,然后每隔一定周期进行基于多维熵值的异常检测。如果出现异常则根据Filter-ary-Sketch记录的流量信息进行异常点定位,最后利用Bloom Filter中记录的源IP信息进行恶意流量阻断。该方法能够检测多种类型的网络攻击,且能有效地进行恶意流量阻断。利用实际骨干网流量数据,分别从效率和精度2个方法进行对比实验,取得了较好的效果。 相似文献
75.
随着电子信息技术的迅速普及和广泛应用,网络面临的安全问题也随之而来.本文从虚拟资产的安全问题出发,首先分析了目前虚拟资产存在的安全问题;然后对eID(electronic IDentity)技术进行了简要的阐述;最后对虚拟资产保全系统的安全对策进行了研究,提出了基于eID的虚拟资产保全在虚拟资产交易中的应用,提高了虚拟资产交易的安全性,规范网络虚拟资产领域体系结构,保障虚拟资产交易安全实施.基于eID的虚拟资产保全适合各种网络领域,电子商务、网络游戏等.基于eID的虚拟资产保全系统表明使用eID技术可以提高虚拟资产交易的安全性. 相似文献
76.
77.
78.
79.
本文介绍了一个基于两种傅氏变换进行图谱增强,用概率神经网络进行指纹分类的指纹自动分类系统,又称AFCS(Automatic Fingerprint Classification System)。该系统运用了一种新的图谱增强方法及不均匀的特征表示方法,用PNN(Probabilistic Network)进行分类,实现了提纹的自动分类。 相似文献
80.