共查询到17条相似文献,搜索用时 79 毫秒
1.
2.
为解决基于文件后缀名和文件特征标识识别文件类型误判率较高的问题,在基于文件内容识别文件类型的算法基础上,提出主成分分析(PCA)和K近邻(KNN)算法相结合的文件类型识别算法。首先,使用PCA方法对样本预处理以降低样本空间的维数;然后,对降维后的训练样本集进行聚类处理,即用聚类质心代表每种类型的文件;最后,针对训练样本分布不均匀可能造成的分类误差,提出基于距离加权的KNN算法。实验结果表明,改进算法在样本数较多的情况下,能降低分类的计算复杂度,并保持了较高的识别正确率;而且该算法不依赖文件类型的特征标识,应用范围更为广泛。 相似文献
3.
不同类型文件的识别与匹配是计算机文件系统中一个重要问题,一般分为特征标识(魔数)和后缀名两种方式,其中后者是被广泛接受的一种方式.然而在使用过程中,经常遇见文件名被篡改或损坏、文件后缀名缺失而无法被系统自动识别的情况,此时无法正常打开、浏览或编辑文件.文件头的特征标识将文件特征信息存储于文件数据内部,不容易被修改或损坏... 相似文献
4.
5.
6.
7.
一般的情况下,我们可以通过文件的扩展名(后缀名)来判断文件的类型,从而找到打开它们的对应程序。假如因为某种原因,可能会得到一个文件,却是没有扩展 相似文献
8.
9.
10.
11.
12.
应用协议识别在网络安全领域具有极其广泛的应用,而如何发现协议特征是协议识别的核心问题。为此,提出一种高效准确的协议特征自动发现方法。利用协议自身的格式特点,将消息进行token化,并根据token序列对消息进行分类。由分类数的变化曲线大致判别协议的首部长度,从而确定字频统计的范围。对数据流中每个数据包的消息首部进行字节频率统计,并将字节频率进行归一化处理,得到字节频率特征向量。通过计算待测协议与样本协议的余弦相似度对协议进行分类和识别。实验结果表明,用该方法所提取的特征进行识别,准确率超过93.5%。 相似文献
13.
14.
把二进制粒子群优化算法(BPSO)应用到人脸识别中.对人脸图像进行二维离散余弦变换(DCT),获得人脸图像的特征向量,应用BPSO算法对得到的特征向量进行特征选择,得到最具代表性的人脸特征.与遗传算法(GA)相比,在选择的特征较少的情况下,BPSO算法比遗传算法有更好的识别率.实验结果表明,BPSO算法应用到人脸识别中有较高的识别率,是一种非常有效的特征提取方法. 相似文献
15.
特征选择是维吾尔语文本分类的关键技术,对分类结果将产生直接的影响。为了提高传统信息增益在维吾尔文特征选择中的效果,在深度分析维吾尔文语种特点的基础上,提出了一种新的信息增益特征选择方法。该方法结合类词频和特征分布系数以及倒逆文档频率,对传统信息增益进行修正;引入一个备选特征分布系数来平衡类间选取的特征个数;在维吾尔文数据集上实验验证。实验结果表明,改进的算法对维吾尔文分类效果有明显的提高。 相似文献
16.
17.