对数复杂度的聚集算法

作者: rockeet 发表日期: 2010年07月12日分类: 算法评论: 0 条阅读次数: 2,985 次

SQL 有5个标准聚集函数：SUM, AVG, MIN, MAX, COUNT, 一般情况下，这几个函数的时间复杂度至少都是O(n), n是结果集的尺寸。然而，给定表：

CREATE TABLE ACCESS_LOG(accTime DATETIME, stayTime INTEGER, INDEX(accTime));

如果要进行以下查询：

SELECT AVG(stayTime) WHERE accTime > ‘2009-07-11 21:00’ AND accTime < ‘2010-07-12 01:00’;

传统上，数据库要扫描 ‘2009-07-11 21:00’ ～ ‘2010-07-12 01:00’ 之间的每条记录，计算SUM(stayTime)/COUNT(*), 这个时间复杂度是O(n).

然而，可以使用一些技术，实现O(log(n))复杂度的算法。这个算法，我已经实现了，代码在：

示例用法（单元测试）在：

核心思想请见：

更早的一篇关于该算法的文章：

近期文章