【MySQL】Join原理

damion 收录于 MySQL

发布于 2021-09-17

Join 原理

常有人说，查询数据时不要使用Join，因为性能很差。然而，你是否好奇过，事实真的是这样吗？

为了能准确分析出Join语法的执行效率，接下来将会对Join的原理进行讨论。

Index Nested-Loop Join简称为NLJ，算法的具体执行流程为：

上述算法的重要前提是，被驱动表可以使用索引。此时，因为使用到了表2的索引，所以Join的性能较好。

该算法的使用前提是，被驱动表无法使用索引。

因为无法使用索引，所以每次去被驱动表做匹配时，都需要进行全表扫描，性能很差。

注意，无索引情况下，MySQL使用的是Block Nested-Loop Join算法。

Block Nested-Loop Join简称BNL，该算法也不会用到被驱动表的索引。

具体的执行流程为：

BNL与Simple Nested-Loop Join的区别在于，BNL的匹配操作是在内存中完成的，速度更快。

如果join_buffer内存放不下表1的所有数据，则执行流程为：

join_buffer的大小受参数join_buffer_size控制，默认是256k。该参数设置的越大，可以容纳的表1数据就会越多，被驱动表的扫描次数越少，性能也会越好。

如果能使用到被驱动表的索引，则可以使用Join。

如果不能使用到被驱动表的索引，查询时会扫描过多行数。在这种情况下，尽量不要使用Join。

对于Index Nested-Loop Join，应选择小表做驱动表。

对于Simple Nested-Loop Join，无论哪张表做驱动表，性能都是一样的。

对于Block Nested-Loop Join，如果join_buffer_size足够大，则任何一种选择都没差别，如果不够大，则选择小表做驱动表。

可以根据执行计划的extra字段，来判断join使用的是何种算法。

查找小表的步骤如下：