FINEdex: A Fine-grained Learned Index Scheme for Scalable and Co
2024-06-14 来源:百合文库
本文发表于PVLDB:www.vldb.org/pvldb/volhttps://wimgs.ssjz8.com/upload/15/p321-hua.pdf
ABSTRACT 内存系统中的索引结构对于提高整个系统的性能非常重要。有前途的学习索引利用深度学习模型来补充现有的索引结构,并获得显著的性能改进。现有方案依靠增量缓冲区来支持可伸缩性,但由于需要检查学习到的索引和额外的增量缓冲区,因此在插入大量数据时会产生很高的开销。由于共享的增量缓冲区很快变大,并且由于高度的数据依赖性,需要经常重新训练,实际系统性能也会下降。为了解决可伸缩性有限和频繁重新训练的问题,作者提出了一种具有高可伸缩性的细粒度学习索引方案,称为FINEdex,它在训练数据数组下构造具有肥化数据结构(即低数据依赖的数据数组)的独立模型,以低开销并发处理请求。通过进一步有效地探索和利用工作负载的特征,FINEdex在无阻塞再培训的支持下处理新请求,从而适应新的分布而不阻塞系统。作者通过YCSB和真实世界的数据集评估了FINEdex,大量的实验结果表明,FINEdex比最先进的XIndex和Masstree分别提高了1.8倍和2.5倍的性能。