智能数据库学习型索引研究综述 |
| |
引用本文: | 蔡盼,张少敏,刘沛然,孙路明,李翠平,陈红.智能数据库学习型索引研究综述[J].计算机学报,2023(1):51-69. |
| |
作者姓名: | 蔡盼 张少敏 刘沛然 孙路明 李翠平 陈红 |
| |
作者单位: | 1. 中国人民大学数据工程与知识工程教育部重点实验室;2. 中国人民大学信息学院 |
| |
摘 要: | 建立高效的索引结构是提升数据库存取性能的关键技术之一.在数据呈爆发式增长、海量聚集、高维复杂的大数据环境下,传统索引结构(例如B+树)处理海量数据时面临空间代价高、查询效率低、存取开销大等难题.学习型索引技术通过对底层数据分布、查询负载等特征进行建模和学习,有效的提升了索引性能,并减少了访存空间开销.本文从学习型索引技术的基础模型入手,对RMI基础模型实现原理、构造和查询过程进行了分析,并总结了基础模型的优点和存在的问题;以此为基础,按照索引结构特点对学习型索引技术进行分类,从索引创建方式和更新策略两方面对学习型索引技术进行了系统梳理,并对比分析了典型学习型索引技术的优点及不足之处.另外,本文总结了学习型索引技术的扩展研究.最后,对学习型索引的未来研究方向进行了展望.
|
关 键 词: | 机器学习 学习型索引 索引结构 RMI模型 智能数据库 |
|
|