首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  完全免费   1篇
  自动化技术   1篇
  2020年   1篇
排序方式: 共有1条查询结果,搜索用时 15 毫秒
1
1.
在大数据与云计算时代,数据访问速度是衡量大规模存储系统性能的一个重要指标.因此,如何设计一种轻量、高效的数据索引结构,从而满足系统高吞吐率、低内存占用的需求,是当前数据库领域的研究热点之一.近期,Kraska等提出使用机器学习模型代替传统的B树索引,并在真实数据集上取得了不错的效果,但其提出的模型假设工作负载是静态的、只读的,对于索引更新问题没有提出很好的解决办法.在本文中,我们提出一个基于中间层的可扩展的学习索引模型Dabble,用来解决索引更新引发的模型重训练问题.首先,Dabble模型利用K-Means聚类算法将数据集划分为K个区域,并训练K个神经网络分别学习不同区域的数据分布.在模型训练阶段,我们创新性地把数据的访问热点信息融入到神经网络中,从而提高模型对热点数据的预测精度.在数据插入时,我们借鉴了LSM树延迟更新的思想,大大提高了数据写入速度.在索引更新阶段,我们提出一种基于中间层的机制将模型解耦,从而缓解由于数据插入带来的模型更新问题.我们分别在Lognormal数据集以及Weblogs数据集上进行实验验证.结果表明,与当前先进的方法相比,Dabble模型在查询以及索引更新方面都取得了非常好的效果.  相似文献
1
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号