共查询到19条相似文献,搜索用时 171 毫秒
1.
文本分类中特征权重因子的作用研究 总被引:1,自引:0,他引:1
在传统的基于向量空间的文本分类中,特征权重计算与特征选择过程完全割裂,特征选择函数的得分能反映特征的重要性,却未被纳入权重表示,造成特征表示不精确并影响分类性能。一些改进方法使用特征选择函数等修改TFIDF模型,提高了分类性能,但没有探究各权重因子如何影响分类的性能。该文以词频、逆文档频率及特征选择函数分别作为衡量特征的文档代表性、文档区分性及类别区分性的因子,通过实验测试了它们对分类性能的影响,得到文档代表性因子能使分类效果峰值最高但抵抗噪音特征能力差、文档区分性因子具有抗噪能力但性能不稳定、而类别区分性因子抗噪能力最强且性能最稳定的结论。最后给出权重表示的四点构造原则,并通过实验验证了其对分类性能的优化效果。 相似文献
2.
分析了高斯似然分类错误率和Bhattacharyya距离的关系,同时推导出在独立特征条件下Bhattacharyya距离具有相加的性质,并在这些基础上提出了一种新的特征选择算法。该算法以各特征的相对Bhattacharyya和作为准则函数选择能有效降低分类错误率的一组特征,最后利用这组特征进行高斯似然分类。实验采用AVIRIS数据,结果证明了该算法的有效性。 相似文献
3.
针对网络安全监控对应用层数据的监测与分析,传统的基于端口、负载和关键字的应用层协议识别法不再适用,提出了一种基于分类和特征匹配的应用层协议识别法.其核心思想是先提出分类的判定规则,对待识别的数据流依据判定规则进行一个粗粒度的分类,针对不同的数据流采取不同的协议特征匹配,从而达到识别更多入侵行为以及提高特征识别速度的目的.将仿真结果与其他识别法进行比较,表明了该方法的执行效率优于其他识别法. 相似文献
4.
路由选择协议的分类探讨 总被引:1,自引:0,他引:1
路由器的主要工作就是为经过路由器的每个数据帧寻找一条最佳传输路径,并将该数据有效地传送到目的站点。在这一过程中,路由选择协议发挥着巨大的作用。本文对于路由选择协议的分类进行了详细的阐述。 相似文献
5.
6.
7.
未知工控协议分类是实现多类型混合工控协议识别的前提。利用工控协议报文格式精简且广泛采用二进制序列的特点,提出基于字符距离聚类的未知工控协议分类方法。该方法打破传统方法计算文本协议报文的欧氏距离而难以准确反映工控协议报文相似性的问题,通过构建二进制特征序列,计算字符距离,并开展基于字符距离K-means聚类,实现了未知工控协议分类。其中,为确保分类的准确性,提出基于最大平均字符距离的最佳聚类K值确定方法。半物理仿真结果表明,所提方法对未知工控协议分类的准确率可达96.80%,协议类型判别的正确率可达97.07%。 相似文献
8.
Client Puzzle协议在防御资源耗尽型DoS攻击中的应用 总被引:2,自引:0,他引:2
文章在研究现有的被动式Client Puzzle协议(CPP)对防御资源耗尽型DoS攻击的基础上,结合分类服务的基本思想,在应用层提出了一个基于主动式CPP协议的HTTP请求分类服务系统模型(CPPWQ)。在对模型的分析和设计基础上,给出了它的一个实现原型,并在局域网条件下对原型系统的性能进行了测试和分析,验证了模型在防御资源耗尽型DoS攻击中的应用效果。 相似文献
9.
10.
多标签情感分类任务旨在处理一个实例可能与多个情感标签关联的问题。现有的大多数多标签情感分类模型都是基于完整的数据设计,模型性能和语义易受到数据本身存在的不完全性影响。针对此问题本文提出一种基于栈式降噪自编码器的跨语言多标签情感分类模型,引入标签感知损失函数弥补训练带来的损失。该模型通过栈式降噪自编码器对词向量去噪以构建原始数据的低维特征,降低特征空间的噪声干扰,为下游任务提供有效特征表示。在SemEval2018的3种语言数据集(即英语、阿拉伯语和西班牙语)多标签情感分类实验中,该模型在测试集上的micro_F1、macro_F1、jaccard这3个指标均得到提升,其中macro_F1分别提升了约0.82、1.45和1.83个百分点。 相似文献
11.
12.
针对当前网络中加密流量的快速分类和准确识别的问题,提出了一种新的数据流特征提取方法。依据序列型数据特点和SSL握手协议规律,采用了端到端的一维卷积神经网络模型,并利用五元组来标记数据流;通过对数据流表示方式、数据包个数和特征字节长度的选择,更准确地定位了样本分类的关键字段位置,去除了对样本分类影响较小的特征,从而把原始输入时单个数据流使用的784字节缩减到529字节,精简了原长度的32%,并且实现了加密流量服务类型的12分类,其准确率达到95.5%。这些结果表明,所提方法可以在保证当前研究准确率的基础上减少原始输入特征维度并提高数据处理的效率。 相似文献
13.
14.
TCP与UDP网络流量对比分析研究* 总被引:12,自引:1,他引:11
网络带宽不断增长,越来越多的音/视频、在线游戏等应用成为网络空间的主体。基于实时性考虑,这些新兴应用协议多选择UDP作为其底层的传输协议,使得UDP流量呈上升趋势,而以往的流量测量工作一般基于TCP进行,忽略了UDP协议。对国内某骨干网流量进行了连续12 h的在线测量,在传输层和应用层分别对TCP和UDP及其应用层协议的流的总数、长度分布、持续时间分布、流的速度分布等进行了详尽的分析,并对TCP和UDP的应用层协议流的大小、长短、快慢作了详细的分类。为网络流的分类技术、网络行为发现、网络设计等提供了数据支持。 相似文献
15.
16.
物联网的迅速普及使得数据规模以几何式上升.集中在云中心处理数据的方式逐渐出现通信时延及隐私泄露等问题.边缘计算将部分云中心业务下沉到设备边缘,使得数据处理在终端网络完成,从而实现数据快速处理.同时,由于避免了远距离通信,用户数据在本地处理,使得用户隐私数据得以安全保护.然而网络架构的改变对边缘计算环境下的安全协议又提出了新的要求.对边缘计算环境下安全协议进行分类总结有助于相关从业人员快速掌握该领域的研究进展,更有助于边缘计算安全领域的初学者快速了解安全协议在该领域中的应用方法.综述了近年来边缘计算环境下认证协议、密钥协商协议、隐私保护协议以及数据共享协议的典型研究成果,对每个安全协议进行了具体的分类、分析及总结.给出了边缘计算环境下安全协议所存在的核心问题并针对这些问题给出了具体的研究方向及建议.实现了对边缘计算环境下安全协议研究进展进行总体把握的目的. 相似文献
17.
在对卫星网络的安全认证需求进行分析的基础上,结合卫星网络的特点,设计了一种适用于卫星网络的端到端认证协议。该协议是基于IKE协议的,可以实现星地和星间的身份认证和会话密钥的协商。另外,为了验证该协议的可行性,文章设计了一个包含多颗卫星的卫星网络仿真平台。在该平台上对协议性能的测试结果表明,该协议具有较好的效率,适用于卫星网络环境。 相似文献
18.
19.
为实现对基站监控系统的遥调、遥控和遥信,本文制定了监控系统数据传输协议,设计了基于LabWindows/CVI平台的网络通信软件.在恶劣的网络环境下的测试结果表明,采用该数据传输协议可有效的实现远程多数据的可靠性与稳定性传输. 相似文献