排序方式: 共有50条查询结果,搜索用时 31 毫秒
41.
基于数据分区的DBSCAN算法 总被引:34,自引:1,他引:33
数据聚类在数据挖掘、模式识别、图像处理和数据压缩等领域有着广泛的应用。DBSCAN是一种基于密度的空间聚类算法,在处理空间数据时具有快速、有效处理噪声点和发现任意形状的聚类等优点,但由于直接对数据库进行操作,在数据量大的时间就需要较多的内存和I/O开销;此外,当数据密度和聚类间的距离不均匀时聚类质量较差,为此,在分析DBSCAN算法不足的基础上,提出了一个基于数据分区的DBSCAN算法,测试结果表 相似文献
42.
复杂企业决策支持环境下的数据仓库体系结构的演化 总被引:1,自引:1,他引:0
在基于复杂的企业决策支持系统环境下,讨论决策支持系统数据仓库体系结构的演化,并由此进一步讨论对动态集成问题的解决方案。文章还讨论了分布式知识管理体系结构和数据采掘的关系,对决策支持系统数据仓库体系结构中的各个阶段进行了简要评估。 相似文献
43.
由于Skyline查询广泛应用于多目标决策、数据可视化等领域,近年来成为数据库领域的一个研究热点。针对云计算环境,在MapReduce框架下设计并实现了Skyline算法。MapReduce是一个运行在大型集群上处理海量数据的并行计算框架,其主要思想是任务的分解与结果的汇总。基于不同的数据划分思想,实施了三种Skyline并行算法,分别是基于MapReduce的块嵌套循环算法(MapReduce based block-nested-loops,MR-BNL)、基于MapReduce的排序过滤算法(MapReduce based sort-filter-skyline,MR-SFS)以及基于MapReduce的位图算法(MapReduce based bitmap,MR-Bitmap),并针对这三种算法进行了系统的实验比较,得出了不同数据分布、维数、缓存等因素对算法性能的影响结果。 相似文献
44.
GML很好地解决了不同GIS系统间地理数据的共享、交换和集成问题,已逐步成为空间数据编码、传输、存储和发布的国际标准.随着GML的广泛应用,如何有效地管理GML数据已成为亟待解决的问题.本文提出一种基于区间编码的方法对GML文档中的元素、属性、文本、几何体等要素进行编码,对非空间特性信息建立B树以实现值查询,对空间特性信息建立R树索引或四又树索引以进行空间分析.在查询处理中,采用以xQuery为基础的GQL查询语言,以实现对GML文档的非空间查询、空间查询及混合查询.实验证明这种方法能够有效地处理在GML文档上进行的值查询和空间分析操作. 相似文献
45.
随着Web服务应用的迅速发展与日益普及, 如何快速、准确地搜索到用户所需的Web服务成为了制约Web服务发展的关键问题之一。目前的Web服务搜索技术包括:基于UDDI注册中心、通过Web服务网站、使用专用搜索引擎与使用通用搜索引擎四种方式。对现有主要Web服务搜索技术进行了详细评述。在对典型Web服务搜索技术分析比较的基础上, 指出了建立专用的Web服务搜索引擎的必要性以及所面临的问题与挑战。 相似文献
46.
47.
隐含语义索引及其在中文文本处理中的应用研究 总被引:33,自引:0,他引:33
信息检索本质上是语义检索,而传统信息检索系统都是基于独立词索引,因此检索效果并不理想,隐含语义索引是一种新型的信息检索模型,它通过奇异值分析,将词向量和文档向量投影到一个低维空间,消减了词和文档之间的语义模糊度,使得文档之间的语义关系更为明晰。实验和理论结果证实了隐含语义索引能够取得更好的检索效果。本文论述了隐含语义索引的理论基础,研究了隐含语义索引在中文文本处理中的应用,包括中文文本检索、中文文本分类和中文文本聚类等。 相似文献
48.
一个无需词典支持和切词处理的中文文档分类系统 总被引:12,自引:0,他引:12
报道了一个无需词典支持和切词处理的中文文档分类系统。其特点是利用N-gram信息进行中文文档分类,使中文文档分类摆脱了对词典和切词处理的依赖,实现了中文文档分类的领域无关性和时间无关性;采用开放的体系结构使文档分类系统易于功能扩充和性能完善。测试结果表明该系统具有令人满意的分类性能。 相似文献
49.
基于改进的神经元网络的图像恢复与重建新算法 总被引:1,自引:0,他引:1
本文简单介绍了最早的图像恢复的神经网络方法,Lambertian反射模型虽可用于图像的恢复与重建,但它有很大的局限性。为此,本文给出了一种基于改进的神经元网络的新型反射模型,用于三维图像的恢复与重建,此新法不需知道光源方向,经实验证明,具有计算快捷且图像识别精度高的特点。 相似文献
50.