首页 | 本学科首页   官方微博 | 高级检索  
     

改进的基于内容的文件类型识别算法
引用本文:曹鼎,罗军勇. 改进的基于内容的文件类型识别算法[J]. 计算机工程与设计, 2011, 32(12): 4246-4250
作者姓名:曹鼎  罗军勇
作者单位:解放军信息工程大学信息工程学院,河南郑州,450002
摘    要:
在现有基于内容的文件类型识别算法基础上,针对统计特征提取方面存在的问题,采用定长和变长窗口对文件二进制内容进行划分,提取文件的统计特征,并提出将特征选择应用于文件类型识别,结合特征的广度和稳定度设计出一种特征选择评估函数选择标志特征,从而建立文件类型模型,以此为标准识别文件类型.该算法不依靠特定文件类型的结构和关键标识...

关 键 词:文件类型识别:元组频率分布:文件二进制内容  余弦相似度  文件类型模型  特征选择

Improved of content-based file type identification algorithm
CAO Ding,LUO Jun-yong. Improved of content-based file type identification algorithm[J]. Computer Engineering and Design, 2011, 32(12): 4246-4250
Authors:CAO Ding  LUO Jun-yong
Affiliation:CAO Ding,LUO Jun-yong(Institute of Information Engineering,PLA Information Engineering University,Zhengzhou 450002,China)
Abstract:
On the basis of the content-based file type identification algorithm,both fixed and variable size window are adopted to extract statistic characteristic of files' binary content,which improves feature extraction in current algorithm.Feature selection is introduced into file type identification and a novel evaluation function combing feature width and stability is used for feature selection,which are used to establish models for different file types as standard to determine a tested file type.Our aim is not ...
Keywords:file type identification  gram frequency distribution  files' binary content  cosine similarity  file type models  feature selection  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号