首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
基于改进HTML-Tree的中文网页特征向量提取方法   总被引:1,自引:0,他引:1  
中文网页特征向量的提取是提高中文网页分类准确度和召回度的关键.经过研究HTML网页的结构特点,提出一种基于改进的HTML-Tree及网页元素权重的中文网页文本预处理方法,并在此基础上进行网页文本特征向量的提取.该方法充分利用不同类别网页的特点,考虑了网页内各种元素权重的贡献.经过实验验证,该方法提高了网页特征向量提取的效率,有效提高了中文网页分类的准确度和召回度.  相似文献   

2.
实现了一个中文网页采集、过滤和分类系统.文中从网页预处理、特征选择、分类器模型等方面介绍了该系统的具体解决方案.实验结果表明,该分类系统取得了令人满意的分类效果.  相似文献   

3.
网页分类存在着新词多、特征维数高的问题,提出了一种新的网页分类方法。首先利用桥本体对分类领域本体进行集成,建立多本体语义标注模型,对文本特征进行降维。在此基础上,对不同类标号的关健词进行聚类,解决新词无法识别的问题,同时考虑网页标签的不同权重,用改进的SVM模型对中文网页进行分类。实验结果表明,上述方’法改进了传统SVM分类器的性能。  相似文献   

4.
在研究Web结构特征的基础上,综合网页的结构和内容,抽取网页不同区域的内容信息,并赋予不同权重来表明其重要程度的不同。按网页间相互链接关系,扩展链接,将链接源网页所含有的类别信息传播给目标网页,从而提高分类效果。实验证明,该方法比单独依赖网页内容信息的分类在效果上有所提高。  相似文献   

5.
郭晓  蒋宗礼 《现代电子技术》2010,33(22):54-56,63
提出一种通过综合考虑网页的HTML结构信息以及网页间的链接关系,修改网页文本在向量空间模型表示中的权值,对网页进行分类的方法。考虑到页面里处在不同HTML标记下的内容具有不同的语义含义,某些特殊标记下的内容具有较重要的意义,对网页的分类起较大的作用,因此对不同标记下的内容赋以不同的权值,可以提高分类效果。考虑到页面正文中链接指向的页面内容与原网页相关度较高,通过综合考虑这些页面的内容,可以有效加强类别关键词的权值,减少噪声,提高分类效果。经过实验证明这一方法提高了分类结果的F1值。  相似文献   

6.
为了提高网页文本分类的准确性.克服传统的文本分类算法易受网页中虚假、错误信息的影响.提出一种基于链接信息的网页分类算法.通过对K近邻方法的改进.利用当前网页与其父网页的链接信息对网页实沲分类,用空间向量表示待分类网页的父链接信息。在训练集合中找到K篇与该网页链接信息向量最相似的网页,计算该网页所属的类别,通过实验与传统文本分类算法进行了对比,验证了该方法的有效性.  相似文献   

7.
鲁明羽  沈抖  郭崇慧  陆玉昌 《电子学报》2006,34(8):1475-1480
网页分类是网络挖掘的重要研究内容之一.与文本分类相比,网页分类面临的困难更多.去除网页中的噪声信息可以提高网页分类的精度,基于摘要的网页分类方法利用了这一思想.本文对三种传统的网页摘要方法进行了分析和改进,提出了Content Body摘要方法以及基于四种摘要方法的混合摘要方法;在此基础上,进行了大量基于摘要的网页分类实验.实验结果表明,所有的摘要方法都可以提高分类效果,其中混和摘要方法效果最好,可以使分类的F1值得到12.9%的改进.  相似文献   

8.
汤琛  王攀 《电信快报》2009,(12):42-45
网页自动分类是Web数据挖掘中的一个重要研究方向,也是搜索引擎前期的准备工作。文章介绍了一种利用搜索引擎原理构建从网页URL到行为类别映射关系的分类系统.该系统结合爬虫原理和网页自动分类技术实现了根据网页URL来判断用户行为的类别功能。实验表明该分类系统具有较高的分类质量和较强的适应能力。  相似文献   

9.
《现代电子技术》2019,(13):81-85
以Web of Science中1998—2017年间收录的1 277篇网页分类领域文献为研究对象,采用CiteSpace可视化工具,并使用科学计量学方法,系统回顾了网页分类领域中主要的研究机构、研究热点及研究脉络等内容。研究发现,目前的网页分类技术已完成理念界定和概念推广,并形成较为完善的研究体系结构。在该领域中,中国科学院和北京大学具有较强的科研能力,而美国在国际影响力上处于领先地位。另外,文中发现机器学习和数据挖掘是近几年网页分类领域的研究热点。文中的分析结果将为我国网页分类技术领域的研究提供一些参考。  相似文献   

10.
面向互联网视频的话题分析技术研究   总被引:1,自引:0,他引:1  
本文提出了一种互联网视频话题分析方法,在利用自动网页抓取技术获取的视频信息数据集合基础上,首先利用中文分词技术对视频文本信息进行自动分词,并采用基于不同时间周期的关键词词频过滤算法进行关键词选择,然后采用基于频繁项挖掘的话题聚类方法对热点视频话题进行检测,最后采用贝叶斯分类方法对视频话题进行分类。  相似文献   

11.
赵飞  李隐峰 《电子科技》2013,26(8):172-174
提出了一种基于角色访问控制(RBAC)的权限管理方法,并在用户和角色之间引入部门对象,通过用户和部门、用户和角色以及角色和权限的关系,抽象出用户、部门、角色和权限的关系,从而增加权限配置的粒度,实现数据上报的分级管理,降低了权限管理的复杂性。  相似文献   

12.
汪杰  孙玲芳 《信息技术》2011,(3):110-113
基于角色的访问控制模型是访问控制中一个被广为接受的模型,但作为静态的被动控制模型,权限没有时间约束,在动态授权约束上存在局限性。引入任务的概念并阐述相关约束,提出多约束的基于角色的访问控制扩展模型,模型中通过任务或任务实例将角色和权限联系在一起,使得权限管理更为灵活,减轻了管理员的负担,满足动态职责分离原则、最小权限原则和限制权限继承原则等。  相似文献   

13.
文章对比分析了主流的访问控制模型,以基于角色的访问控制模型为基础,设计了适合云平台下CRM系统的访问控制机制,该机制增加了用户组、部门、资源、操作等实体。在优先通过角色授权的基础上,允许对用户直接授权,在权限设计中增加了用户权限直接授权,用户角色权限的动态授权等。本文还介绍了云平台下CRM系统的访问流程,并实现了云平台下CRM系统的访问控制。  相似文献   

14.
大多数电子政务项目中,组织机构一般呈层次型结构,传统的基于角色的安全性难以根据当前角色在机构中的层次位置,控制其涉及上、下级机构的操作功能。随着部门问协作的加深,如何控制管理跨部门授权也成为突出的问题。论文通过在“角色-功能”配置关系中增加层次和职能范围属性的办法,结合设计模式和通用表表达式,实现适合组织机构层次特征并支持跨部门协同的授权原型。本原型可为类似模块设计提供参考。  相似文献   

15.
王颖 《电子工程师》2008,34(11):38-41
WFM(工作流模型)和RBAC(基于角色的访问控制)模型都包含角色空间和任务空间两个组件,在二者的基础上提出工作流框架下基于任务的访问控制模型(TRBAC)。分析了工作流中的任务空间和RBAC模型中的权限空间,在此基础上研究了任务空间的状态。解决了OA(办分自动化)系统层次空间上多个角色参与的协同工作流状态的判断和转移状况的判断。  相似文献   

16.
基于角色权限管理模型对于大规模授权具有优势,但缺少了对一个用户授权的灵活。提出了合理可行的改进模型。采用J2EE经典的开源工具实现了这个扩展型基于角色权限管理模型。在保留角色授权的同时,增加了给某个用户单独授权的机制。扩展模型很好的丰富了基于角色权限管理模型的授权方式。  相似文献   

17.
基于RBAC的层次管理模型的设计与实现   总被引:1,自引:0,他引:1  
研究了基于角色访问控制的参考模型及其中的层次关系和约束条件,并给出了以集合论为基础的一个基于RBAC层次管理模型的设计与实现,从而解决了具有层次关系的权利组进行划分时任意扩展的问题,适用于实际政府部门、企业的权限管理。  相似文献   

18.
本文介绍了基于RBAC模型的权限管理系统的实现.首先描述了RBAC模型的基本思想,然后重点阐述了权限控制系统设计和实现效果.研究内容主要是基于.NET Framewok2.0的多层体系结构设计,并讨论了基于RBAC的访问控制模型和动态授权机制的多级权限管理模型,以及权限访问、权限控制和权限数据存储等关键技术.文中提出采用RBAC模型进行权限管理系统的实现与部署,将用户纳入角色组进行集中统一管理的思路,在企业应用系统开发中具有重要的参考价值.  相似文献   

19.
文中介绍了军用访问控制模型和基于角色的访问控制模型,对军用访问控制模型进行了分析,指出它们缺点和存在的问题;在不改变系统原有安全标记的基础上,用基于角色的访问控制模型对军用的BLP模型和它的变化形式进行了改造,并给出了证明,从而建立了新的访问控制模型.  相似文献   

20.
借助可信计算的完整性检验、认证及访问控制和密封存储等关键技术,在现有PC体系结构下提出了支持可信计算的密级标识信息控制模型,并提出密级权限域的概念。该模型利用PC机USB接口外接TCM,结合身份认证、基于角色的访问控制和信道加密技术,从不同层次和角度进行涉密文档保护,实现用户细粒度控制和信息流控制。同现有的技术相比较,该模型能够满足国家相关标准的技术要求,实现更灵活、更安全的信息控制,并能够适应新的Cyber Security环境下的安全挑战。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号