期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

邵延振蒙韧袁鼎荣李新友《计算机技术与发展》2010,20(6):67-69,73

Intenet的快速增长导致了个性化服务的需求急剧增加.基于页面结构的信息提取与推荐是Web数据挖掘中三大研究领域之一.该研究的关键技术是识别Web页面的组织形式,从中挖掘所需要的个性化页面信息.基于Web数据挖掘的个性化信息推荐系统可以满足互联网未来发展趋势的需要.与传统的以页面为单位的Web信息提取相比,基于页面结构分区的信息推荐更符合实际情况,粒度优势明显.以一组数据为实例阐述了基于Web挖掘的协同过滤推荐算法是如何进行数据表示、近邻查询以及产生推荐页面分区信息的. 相似文献

2.

基于异构代价敏感决策树的分类器算法

阮晓宏黄小猛袁鼎荣段巧灵《计算机科学》2013,40(Z11):140-142,146

代价敏感学习方法常常假设不同类型的代价能够被转换成统一单位的同种代价,显然构建适当的代价敏感属性选择因子是个挑战。设计了一种新的异构代价敏感决策树分类器算法,该算法充分考虑了不同代价在分裂属性选择中的作用,构建了一种基于异构代价的分裂属性选择模型,设计了基于代价敏感的剪枝标准。实验结果表明,该方法处理代价机制和属性信息的异质性比现有方法更有效。相似文献

3.

基于频繁链表的完全加权项频繁集挖掘算法

蒙韧李新友袁鼎荣邵延振《网络安全技术与应用》2009,(8):39-41

频繁项集的挖掘是关联规则挖掘中一个关键的问题,典型的关联规则挖掘算法都是以数据库的多次扫描来实现的,而且不能即时反映数据库的变化,且其频繁项集的产生都只考虑了项目在数据库中出现的频度而没有考虑项目的重要性。本文提出了一种基于频繁链表的完全加权项频繁集的挖掘算法,该算法不但能动态反映数据库的变化,而且在频繁集的挖掘中只需扫描一次数据库,并根据项目的重要性程度对项目赋予了一定的权值,用以挖掘人们更感兴趣的关联规则。相似文献

4.

Web页面信息主动检索模型

袁鼎荣钟宁《智能系统学报》2010,5(2):112-116

单个页面信息量远远大于特定用户对页面中的信息需求.为快速准确从当前页面中获取特定用户所需求的兴趣信息,提出了页面信息主动检索模型.该检索模型中,根据页面Block特点将当前Web页面转化成信息树,根据用户过去的浏览行为构造用户特征树,挖掘用户特征树产生用户需求信息集,然后从当前页面中检索需求的信息,获取用户兴趣信息集.详述了主动检索的基本原理,给出了相应的算法描述,并通过实验证明了该模型具有可行性. 相似文献

5.

一种单位代价收益决策树剪枝算法

周美琴陈诗旭袁鼎荣朱新华《计算机工程与科学》2016,38(5):1023-1030

目前关于决策树剪枝优化方面的研究主要集中于预剪枝和后剪枝算法。然而,这些剪枝算法通常作用于传统的决策树分类算法,在代价敏感学习与剪枝优化算法相结合方面还没有较好的研究成果。基于经济学中的效益成本分析理论,提出代价收益矩阵及单位代价收益等相关概念,采用单位代价收益最大化原则对决策树叶节点的类标号进行分配,并通过与预剪枝策略相结合,设计一种新型的决策树剪枝算法。通过对生成的决策树进行单位代价收益剪枝,使其具有代价敏感性,能够很好地解决实际问题。实验结果表明,该算法能生成较小规模的决策树,且与REP、EBP算法相比具有较好的分类效果。相似文献

6.

基于频繁链表的频繁集的挖掘算法 总被引：4，自引：0，他引：4

袁鼎荣张师超《计算机科学》2003,30(7):165-166

自从1989年提出KDD以来,关联规则的挖掘一直是人工智能及数据库领域关注的焦点,尤其是项目决策者渴求的制胜法宝。挖掘关联规则的前提是频繁集的挖掘,目前典型的频繁集挖掘算法以Appriori算法为代表。在Appriori算法的基础上提出了一些可行的方法,所有这些算法不外乎达到两个目的:①在穷举的基础上,设法删除对关联规则不太有效的频繁集,减少候选频繁集的数量,达到提高挖掘算法性能的目的。②直接挖掘最大频繁集,以最大频繁集为基础挖掘感兴趣相似文献

7.

一个新的概率数据模型 总被引：1，自引：0，他引：1

袁鼎荣严小卫陈宏朝《计算机应用研究》2003,20(10):65-67,73

为扩展传统关系数据模型，处理概率方面的不确定性数据，以描述动态的世界，建立了一个新型的数据模型——PRM模型。在该模型中引进概率属性，并提出对象属性、静态属性、动态属性、概率属性联合构成元组，形成二维关系表中的一个动态数据理论；为克服当前在概率数据模型研究方面的缺陷，定义了一个新的PRM模型体系及操作，使其具有处理概率数据的能力。相似文献

8.

用于中文分词的组合型歧义消解算法

袁鼎荣李新友邵延振《计算机应用与软件》2011,28(6)

自动分词技术的瓶颈是切分歧义,切分歧义可分为交集型切分歧义和组合型切分歧义。以组合型歧义字段所在句子为研究对象,考察歧义字段不同切分方式所得结果与其前后搭配所得词在全文中的支持度,构造从合或从分切分支持度度量因子,依据该因子消除组合型歧义。通过样例说明和实验验证该方法可行并优于现有技术。相似文献

9.

基于决策树的软件使用异常用户挖掘

刘玉峰李新友袁鼎荣《网络安全技术与应用》2010,(1):55-58

本文提出一种基于决策树ID3算法的软件使用用户分类方法,利用软件的运行日志提取出软件使用记录的主要属性数据,对源数据进行数据预处理转化为挖掘算法可用数据集,从中提取出软件使用用户的分类规则,构建分类模型并根据形成的规则找出使用软件的异常用户,从而便于管理人员对B／S模式软件数据库系统的安全管理和维护。相似文献

10.

基于核估计和区间聚类的数据流中异常模式发现

下载免费PDF全文

张师超尤晓芳袁鼎荣《计算机科学与探索》2007,1(1):108-115

研究数据流中异常模式发现问题。为保证可以随时输出当前的异常模式,引入一种简单且有效的数据结构——三层时间区间嵌套模式(TTI),来监测数据流。对新到数据是否为异常加以判断评价的标准不是预先分配的静止阈值,而是由算法(KIC:核估计和置信区间聚类分析)计算得到的动态阈值,从而在仅占用很小内存的前提下提高了算法的准确性。设计的SWMA算法进一步降低了时间和空间复杂度。最后分别在模拟线性模型、非线性模型及带时间戳的真实数据流上对方法的准确性、可行性和时效性进行了验证。相似文献