列前缀匹配索引的原理

Mar 10, 2025 · 1 min read · 性能优化 mysql

当对 name 列的所有内容建立完整索引时，WHERE name LIKE 'John%' 仍然可以利用索引的核心原因在于 B+Tree 索引的排序存储特性和 前缀匹配的天然优势。以下是详细解释：

完整索引会存储 name 列的完整值，并按字符顺序排序在 B+Tree 结构中。例如，值 'John'、'Johnny'、'Johnson' 会按字典序排列为：

1John
2Johnson
3Johnny
4...

由于索引键是完全有序的，数据库可以通过以下步骤高效处理 LIKE 'John%'：

这一过程仅需遍历索引的一部分，无需全表扫描。

LIKE 'John%' 是典型的前缀匹配查询，而 B+Tree 索引的排序特性使其天然支持此类查询。以下对比说明不同匹配模式的索引利用率：

虽然完整索引和前缀索引都支持 LIKE 'John%'，但二者在性能和存储上有差异：

完整索引的优势：
由于存储了完整值，数据库在索引中即可完成 LIKE 'John%' 的匹配，无需回表读取数据行验证完整值（覆盖索引）。而前缀索引可能需要回表确认剩余字符是否匹配。

如果查询仅需访问 name 列（如 SELECT name FROM users WHERE name LIKE 'John%'），完整索引可直接作为覆盖索引（Covering Index），避免访问数据行，进一步提升性能。

B+Tree 索引的键值按从左到右的字符顺序排序，而 LIKE '%John' 要求匹配末尾的 'John'。由于索引无法反向遍历或跳跃匹配，数据库只能全表扫描所有值，逐个检查是否符合条件。

使用 name 列的完整内容建立索引时，WHERE name LIKE 'John%' 能利用索引的核心原因是：

完整索引在支持前缀匹配的同时，还能优化精确匹配和覆盖索引场景，但需权衡存储成本。