首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   393篇
  国内免费   4篇
  完全免费   108篇
  自动化技术   505篇
  2011年   2篇
  2010年   2篇
  2009年   4篇
  2008年   6篇
  2007年   5篇
  2006年   8篇
  2005年   8篇
  2004年   5篇
  2003年   32篇
  2002年   53篇
  2001年   55篇
  2000年   74篇
  1999年   62篇
  1998年   34篇
  1997年   34篇
  1996年   32篇
  1995年   28篇
  1994年   19篇
  1993年   7篇
  1992年   4篇
  1991年   5篇
  1990年   2篇
  1989年   5篇
  1988年   8篇
  1987年   1篇
  1986年   3篇
  1985年   1篇
  1983年   2篇
  1982年   2篇
  1980年   1篇
  1977年   1篇
排序方式: 共有505条查询结果,搜索用时 46 毫秒
1.
个性化推荐算法设计   总被引:67,自引:4,他引:63  
协同过滤技术(collaborative filtering)目前被成功地应用于个性化推荐系统中,但随着系统规模的扩大,它的效能逐渐降低,提出了一种高效的个性化推荐算法,它包括维数简化和项集相似性计算两个过程,这种算法在提高精确性的基础上减少了计算耗费,可以较好地解决应用协同过滤技术的推荐系统所存在的稀疏性,扩展性等问题,快速产生精确的个性化推荐结果。  相似文献
2.
关联规则挖掘综述   总被引:59,自引:0,他引:59  
介绍了关联规则挖掘的研究情况,提出了关联规则的分类方法,对一些典型算法进行了分析和评价,指出传统关联规则衡量标准的不足,归纳出关联规则的价值衡量方法,展望了关联规则挖掘的未来研究方向。  相似文献
3.
兴趣度--关联规则的又一个阈值   总被引:54,自引:3,他引:51  
关联规则的采掘是数据采掘研究的一个重要方面,分析现有的关联规则采掘算法中所存在的问题:首先是关联规则在其表达形式上没有考虑各种可能的反面示例的影响,因而导致知识表达功能的不够完善;其次是有可能一条规则即使可信度和支持度都很高,仍没有实际意义,甚至是误导性的,因此对关联规则的形式定义作了修改,将运用差异思想引兴起度阈值运用到关联规则中来,并给出其形式定义,在分析了兴趣度的实际意义以后,讨论了举度与概  相似文献
4.
从多角度分析现有聚类算法   总被引:53,自引:3,他引:50       下载免费PDF全文
钱卫宁  周傲英 《软件学报》2002,13(8):1382-1394
聚类是数据挖掘中研究的重要问题之一.聚类分析就是把数据集分成簇,以使得簇内数据尽量相似,簇间数据尽量不同.不同的聚类方法采用不同的相似测度和技术.从以下3个角度分析现有流行聚类算法: (1)聚类尺度; (2)算法框架; (3)簇的表示.在此基础上,分析了一些综合或概括了一些其他方法的算法.由于分析从3个角度进行,所提出的方法能够涵盖,并区分绝大多数现有聚类算法.所做的工作是自调节聚类方法以及聚类基准测试研究的基础.  相似文献
5.
一种基于密度的快速聚类算法   总被引:46,自引:0,他引:46  
聚类是数据挖掘领域中的一个重要研究方向,聚类技术在统计数据分析、模式识别、图像处理等领域有广泛应用,迄今为止人们提出了许多用于大规模数据库的聚类算法。基于密度的聚类算法DBSCAN就是一个典型代表。以DBSCAN为基础,提出了一种基于密度的快速聚类算法。新算法以核心对象领域中所有对象的代表对象为种子对象来扩展类,从而减少区域查询次数,降低I/O开销,实现快速聚类,对二维空间数据测试表明:快速算法能够有效地对大规模数据库进行聚类,速度上数倍于已有DBSCAN算法。  相似文献
6.
独立于语种的文本分类方法   总被引:44,自引:4,他引:40  
文本分类是指在给定分类体系下,根据文本的内容自动确定文本类别的过程。本文提出了一个基于机器学习的、独立于语种的文本分类模型,并对模型中的特征抽取、分类器和评价方法进行了详细的介绍。该模型已经在中文和日文两个语种的新闻语料上得到实现,并获得了较好的分类性能。  相似文献
7.
面向数据库应用的隐私保护研究综述   总被引:34,自引:3,他引:31  
随着数据挖掘和数据发布等数据库应用的出现与发展,如何保护隐私数据和防止敏感信息泄露成为当前面临的重大挑战.隐私保护技术需要在保护数据隐私的同时不影响数据应用.根据采用技术的不同,出现了数据失真、数据加密、限制发布等隐私保护技术.文中对隐私保护领域已有研究成果进行了总结,对各类隐私保护技术的基本原理、特点进行了阐述,还详细介绍了各类技术的典型应用,并重点介绍了当前该领域的研究热点:基于数据匿名化的隐私保护技术.在对已有技术深入对比分析的基础上,指出了隐私保护技术的未来发展方向.  相似文献
8.
基于数据分区的DBSCAN算法   总被引:32,自引:1,他引:31  
数据聚类在数据挖掘、模式识别、图像处理和数据压缩等领域有着广泛的应用。DBSCAN是一种基于密度的空间聚类算法,在处理空间数据时具有快速、有效处理噪声点和发现任意形状的聚类等优点,但由于直接对数据库进行操作,在数据量大的时间就需要较多的内存和I/O开销;此外,当数据密度和聚类间的距离不均匀时聚类质量较差,为此,在分析DBSCAN算法不足的基础上,提出了一个基于数据分区的DBSCAN算法,测试结果表  相似文献
9.
一种高效的检测相似重复记录的方法   总被引:31,自引:0,他引:31  
如何消除数据库中的重复信息是数据质量研究中的一个热课题。文中提出了一种高效的基于N-Gram的检测相似重复记录的方法,主要工作有:(1)提出了一种高效的基于N-Gram的聚类算法,该算法能适应常见的拼写错误从而较好地聚类相似重复记录,复杂度仅为O(N);同时提出该算法的改进形式,使其在检测的同时能自动校正单词的插入、删除错误、提高检测精度。(2)采用了一种高效的应用无关的Pair-wise比较算法,该算法以单词间的编辑距离为基础,通过计算两记录中单间的编辑距离来判断记录的相似与否。(3)给出了一种改进的优先队列算法来准确地聚类相似重复记录,该算法使用固定大小的优先队列顺序扫描已排序的记录,通过比较当前记录和队列中记录的距离来聚类相似重复记录,此外,该文构造了合适的实验环境并作了大量的算法实验,在此基础上,文中分析了大量、翔实的实验结果从而验证了算法的科学性。  相似文献
10.
基于统计方法的中文姓名识别   总被引:31,自引:6,他引:25  
本文介绍一个中文姓名的自动识别系统,该系统使用从姓名样本库和真实文本语料库中得到的大量统计数据,以提高系统识别性能。我们从1994年人民日报中随机抽取100篇文章作为测试样本,实验结果表明,准确率和召加回率可同时达到90%以上。  相似文献
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号