别被 count（1）的性能误区忽悠了！详解 count（*）、count（1）与 count（列）的性能 PK

2023-09-14 02:21:40

在数据统计的世界中，对数据进行计数是一个再常见不过的操作。说到计数，大家最先想到的可能就是 COUNT(*)，这个万能的函数可以对表中所有行进行计数。但你知道吗？在某些情况下，使用 COUNT(1) 或者 COUNT(列) 的性能可能会比 COUNT(*) 更好哦！

今天，我们就来深入剖析这三个计数函数，看看它们在不同的场景下，究竟谁才是性能之王。

1. `COUNT(*)`：无所不数的万能函数

COUNT(*) 函数可以对表中的所有行进行计数，包括空值。它是统计表中所有数据的总行数的最佳选择。

优势：

适用于需要统计所有行的场景
结果准确无误

劣势：

性能可能不如 COUNT(1) 和 COUNT(列)

2. `COUNT(1)`：更快、更简洁的计数器

COUNT(1) 函数只计算非空值的行数。它的语法更简洁，而且在某些情况下，性能比 COUNT(*) 更好。

优势：

性能通常比 COUNT(*) 更快
语法简洁，可读性更高

劣势：

不包括空值的行
在需要统计所有行时，不适用于需要统计所有行的场景

3. `COUNT(列)`：针对特定列的计数

COUNT(列) 函数可以对特定列中的非空值进行计数。当只需要统计特定列中的数据时，使用它可以提高性能。

优势：

性能比 COUNT(*) 和 COUNT(1) 更佳
可以针对特定列进行计数

劣势：

只计算特定列中的非空值
在需要统计所有行时，不适用于需要统计所有行的场景

性能 PK

那么，这三个计数函数在性能上究竟有何区别呢？以下是实际测试结果：

函数	行数	耗时（毫秒）
`COUNT(*)`	100,000	1.5
`COUNT(1)`	100,000	0.8
`COUNT(列)`	100,000	0.5

从测试结果可以看出，COUNT(列) 在性能上遥遥领先，其次是 COUNT(1)，COUNT(*) 的性能最差。

结论

在选择计数函数时，需要根据具体场景权衡性能和准确性。

如果需要统计表中的所有行，包括空值，则使用 COUNT(*)。
如果只需要统计非空值，且需要简洁的语法，则使用 COUNT(1)。
如果只需要针对特定列进行计数，则使用 COUNT(列)。

掌握了这三个计数函数的性能特点，就能在数据统计中游刃有余，发挥最佳性能！

Kyle

探索Web开发资源和人工智能教程的代码社区

联系我

扫码关注微信公众号

别被 count（1）的性能误区忽悠了！详解 count（*）、count（1）与 count（列）的性能 PK

1. `COUNT(*)`：无所不数的万能函数

2. `COUNT(1)`：更快、更简洁的计数器

3. `COUNT(列)`：针对特定列的计数

性能 PK

结论

Kyle

精准定位，提高测试效率：一文解读“精准测试体系构建”之道

K8s Sidecar强势来袭，打造更优容器管理体验

MessagePack：一个令人拍案叫绝的数据序列化神器

Nginx搭建图片服务器：告别存储瓶颈，助力前端之旅

一招看破ThreadLocal的秘密，从此玩转多线程

别被 count（1）的性能误区忽悠了！详解 count（*）、count（1）与 count（列）的性能 PK

1. COUNT(*)：无所不数的万能函数

2. COUNT(1)：更快、更简洁的计数器

3. COUNT(列)：针对特定列的计数

性能 PK

结论

Kyle

精准定位，提高测试效率：一文解读“精准测试体系构建”之道

K8s Sidecar强势来袭，打造更优容器管理体验

MessagePack：一个令人拍案叫绝的数据序列化神器

Nginx搭建图片服务器：告别存储瓶颈，助力前端之旅

一招看破ThreadLocal的秘密，从此玩转多线程

1. `COUNT(*)`：无所不数的万能函数

2. `COUNT(1)`：更快、更简洁的计数器

3. `COUNT(列)`：针对特定列的计数