首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   22篇
  完全免费   14篇
  自动化技术   36篇
  2015年   3篇
  2014年   7篇
  2013年   2篇
  2012年   3篇
  2011年   1篇
  2010年   2篇
  2009年   3篇
  2008年   1篇
  2007年   2篇
  2006年   5篇
  2005年   4篇
  2004年   1篇
  2003年   1篇
  2002年   1篇
排序方式: 共有36条查询结果,搜索用时 31 毫秒
1.
数据仓库环境下以用户为中心的数据清洗过程模型   总被引:8,自引:1,他引:7       下载免费PDF全文
数据清洗是数据仓库和数据挖掘中非常重要的一个环节。本文首先分析总结了数据清洗的有关概念,给出了数据清洗中需要解决的质量问题,并总结了解决这些问题的技术和方法。在此基础上提出了以人为中心的数据清洗过程模型。该模型集成了工作流技术、数据集成、数据转换和数据挖掘技术。给出了每个工具箱应该提供的基本功能。  相似文献
2.
一种基于划分的孤立点检测算法   总被引:7,自引:0,他引:7       下载免费PDF全文
孤立点是不具备数据一般特性的数据对象.划分的方法是通过将数据集中的数据点分布的空间划分为不相交的超矩形单元集合,匹配数据对象到单元中,然后通过各个单元的统计信息来发现孤立点.由于大多真实数据集具有较大偏斜,因此划分后会产生影响算法性能的大量空单元.由此,提出了一种新的索引结构--CD-Tree(cell dimension tree),用于索引非空单元.为了优化CD-Tree结构和指导对数据的划分,提出了基于划分的数据偏斜度(skew of data,简称SOD)概念.基于CD-Tree与SOD,设计了新的孤立点检测算法.实验结果表明,该算法与基于单元的算法相比,在效率及有效处理的维数方面均有显著提高.  相似文献
3.
一种优化的基于网格的聚类算法   总被引:5,自引:0,他引:5  
聚类是数据挖掘领域中一个重要的研究课题.与其它算法相比,基于网格的聚类算法可以高效处理低维的海量数据.然而,由于划分的单元数与数据的维数呈指数增长,因此对于维数较高的数据集,生成的单元数过多,导致算法的效率较低.本文基于CD—Tree设计了新的基于网格的聚类算法,该算法的效率远高于传统的基于网格聚类算法的效率.此外,本文设计了一种剪枝优化策略,以提高算法的效率.实验表明,与传统的聚类算法相比,基于CD-Tree的聚类算法在数据集的大小及维度的可伸缩性方面均有显著提高.  相似文献
4.
星链ER模型:一种数据仓库概念设计模型   总被引:5,自引:0,他引:5  
对于流程工业中的数据仓库建设,存在一贯性质量分析的需求,即前一个工序的工艺可能影响下一个工序的产品质量.针对这种需求,提出了一种数据仓库的概念设计模型,星链ER模型.其中引入了链式事实主题结构的概念,并把度量细分为传递型度量与非传递型度量,给出了星链ER模型的图形表示法以及由概念模型到逻辑模型的转换规则.该模型可以方便地转化成多种逻辑模型如星型模式、雪花模式以及星座模式.  相似文献
5.
基于XML技术的数据仓库多维数据模型   总被引:4,自引:0,他引:4  
本文介绍了一种基于关系数据库、利用 XML技术实现多维数据模型方法 .首先讨论了在关系数据库之上构建数据仓库的系统结构 ,利用面向对象的技术构建一个逻辑多维数据模型 ,通过 XML 文档保存多维数据模型的元数据 .配合数据仓库的数据抽取工具、汇总工具可以实现数据仓库的基本功能 .对于实现关系数据库之上 OL AP和数据挖掘有一定的参考价值 .  相似文献
6.
一种VoIP软交换系统QoS策略控制器的设计和实现   总被引:1,自引:0,他引:1  
QoS策略控制器是VoIP软交换系统中的一个重要部件.它与目录服务器之间通过LDAP协议进行通信,访问目录服务器并作出决策.同时它又通过COPS协议与支持QoS的路由器建立联系,通知它所作出的决策.于是,在系统内实现了服务质量控制策略.本文详细地给出了该QoS策略控制器的设计以及具体的实现.  相似文献
7.
数据立方的计算是数据仓库和OLAP研究的一个重要方向,同时又是数据仓库中代价很大的操作。针对在生物信息、统计分析、文本处理等领域中存在的基数较小的高维数据集,X.L.Li等人提出了Frag-Cubing算法。为了提高Frag-Cubing算法的效率,本文提出了基于分片思想的算法CBFrag-Cubing。该算法使用了位图索引结构,优化了数据立方的存储,减少了数据立方的计算时间。实验表明,与Frag-Cubing算法相比,该算法在存储空间上至少节省25%,在计算时间上节省30%。  相似文献
8.
基于签到数据的短时间体验式路线搜索   总被引:1,自引:0,他引:1  
路线搜索已经广泛地应用于基于位置的服务和旅游路线推荐等领域.现有的关于路线搜索的研究,通常只考虑景点之间路线的流行程度与用户的需求,因此提供的推荐路线并未考虑景点类别的丰富性,存在类别重复的现象.为了能使用户在短时间内体验所在地区不同类别特色的景点,增强旅游体验效果,文中提出一种新的路线搜索:短时间体验式路线搜索(SERS).该路线搜索方法根据用户给定的查询位置vs、旅行时间限定t以及用户对景点类别选择的集合uc,找到一条非重复多类别且收益最大化的最优景点访问路线.为了有效处理SERS,提出一种预计算结点收益上界值的优化策略,设计了两种优化搜索算法:单收益上界剪枝搜索算法(SUB)和多收益上界剪枝搜索算法(MUB).优化的搜索算法利用收益上界值剪掉了不可能产生结果的分枝,提高了搜索效率.利用Gowalla和Foursquare社交网站真实的签到数据集进行了充分实验,评估了所提出的算法在不同参数设置下的搜索效率,验证了算法的有效性.  相似文献
9.
GRkNN:空间数据库中组反k最近邻查询   总被引:1,自引:0,他引:1  
反k最近邻(Reverse k-Nearest-Neighbor,RkNN)查询是在k最近邻(k-Nearest-Neighbor,kNN)查询问题的基础上产生的,获得将查询对象作为kNN的数据对象集合,RkNN可以用于评价查询对象的影响力.根据实际应用中需要查询一组对象的RkNN,如评价连锁店或商业区的影响.文中提出了针对空间数据库的组反k最近邻(Group RkNN,GRkNN)的概念,并设计了相关算法.查询点集合是一组邻近的空间对象,计算查询对象的最小覆盖圆,将最小覆盖圆中的对象作为一个整体进行过滤,设计了基于R树的剪枝方法,通过提炼获取了最终的GRkNN结果.针对真实数据集进行的大量实验表明,提出的GRkNN算法的效率明显优于目前最好的RkNN算法.  相似文献
10.
基于张量分解的个性化标签推荐算法   总被引:1,自引:0,他引:1       下载免费PDF全文
基于互联网的社会标签推荐系统为广大用户提供了一个信息共享平台,让用户以"标签"的形式为其浏览的物品标注信息。标签既描述了物品语义,又反映了用户偏好。标签系统的最大优势在于可以发挥群体的智能,获得用户对物品比较准确的关键词描述,而准确的标签信息是提升个性化推荐系统性能的重要资源。然而,现存的标签推荐系统面临的问题是:由于兴趣的不同,不同的用户对于同一物品可能会打不同的标签,或者是同一标签对于不同用户可能会蕴含不同的语义。因此如何有效获取用户、物品、标签3者之间潜在的语义关联成为标签推荐系统需要解决的主要问题。为此引入三维张量模型,利用三维张量的3个维度来分别描述社会标签推荐系统中3种类型的实体:用户、物品、标签。在基于历史标签数据(标签元数据)构建初始张量的基础上,应用高阶奇异值分解(HOSVD)方法降低张量维度,同时实现3种类型实体之间潜在的语义关联分析,从而进一步提高标签推荐系统的准确性。实验结果表明,该方法较当前两种典型的标签推荐算法(FolkRank和PR)在准确率和召回率性能指标上有明显提升。  相似文献
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号