首页 | 本学科首页   官方微博 | 高级检索  
     

基于数据空间网格划分的PK 树索引结构*
引用本文:胡云,孙志挥,李存华. 基于数据空间网格划分的PK 树索引结构*[J]. 计算机应用研究, 2005, 22(12): 33-35
作者姓名:胡云  孙志挥  李存华
作者单位:(1.淮海工学院 计算机科学系, 江苏 连云港 222005;2.东南大学 计算机科学与工程系, 江苏 南京 210018)
基金项目:国家自然科学基金资助项目(70371015);高等学校博士学科点专项科研基金资助项目(20040286009);江苏省教育厅自然科学基金资助项目(02KJB520012)
摘    要:在大规模高维数据挖掘研究中,数据存储与索引方法的有效性是决定算法时空效率的重要因素。将数据空间网格划分策略与高效率的树型索引结构结合起来,可以充分发挥两者在数据组织上的综合优势,将复杂问题转换为结构化的简单重复问题。在统一的框架下给出了各种数据空间网格划分的定义,讨论了两种适用于实现网格化数据索引的R树和PK树索引结构。试验结果表明,PK树在数据存储和索引上具有更高的效率,与网格化数据组织方法结合起来,对于降低大规模高维数据分析问题的时空复杂度具有重要意义。

关 键 词:网格划分   PK树   索引

On the PK tree Index Structure for Grid based Point Data
HU Yun,SUN Zhi hui,LI Cun hua. On the PK tree Index Structure for Grid based Point Data[J]. Application Research of Computers, 2005, 22(12): 33-35
Authors:HU Yun  SUN Zhi hui  LI Cun hua
Affiliation:(1.Dept. of Computer Science, Huaihai Institute of Technology, Lianyungang Jiangsu 222005, China;2.Dept. of Computer Science & Engineering, Southeast University, Nanjing Jiangsu 210018, China)
Abstract:One of the key factor in large-scsle and high dimensional data mining is the efficiency of data handling and indexing. A promised approach to this concern is to take advantages of both grid partition and efficient tree structure indexing. With this means a complicated problem can be significently simplified. The paper formulizes the definition of various grid partition methods and discusses a pair of tree index structures which are preferable for handling large scale and high dimensional point data set. Results show that the PK tree is superior both in space usage and retrieve depth.
Keywords:Grid Partition   PK tree   Indexing
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号