不能直接在商品表加 tags 字段用逗号分隔,因无法高效查询、更新易错、无取值约束、不支持计数去重;应采用三表结构:products、tags(id+name唯一)、product_tags(product_id+tag_id联合主键),并建对应索引与外键。
用 TEXT 或 VARCHAR 存逗号分隔的标签(如 "php,mysql,backend")看似简单,但会导致:
无法高效查询“所有带 mysql 标签的商品”;
更新单个标签时需字符串解析,易出错;
无法约束标签取值范围,脏数据多;
不支持标签计数、去重合并等常见需求。
必须拆成三张表:主实体表(如 products)、标签字典表(tags)、关联表(product_tags)。关键点:
tags 表只需 id(主键)和 name(唯一索引),避免重复标签product_tags 表只有两个字段:product_id 和 tag_id,联合主键或双唯一索引product_tags 加自增 id —— 没业务意义,还拖慢 JOINCREATE TABLE tags ( id INT PRIMARY KEY AUTO_INCREMENT, name VARCHAR(50) NOT NULL UNIQUE, INDEX idx_name (name) );CREATE TABLE products ( id INT PRIMARY KEY AUTO_INCREMENT, title VARCHAR(200) );
CREATE TABLE product_tags ( product_id INT NOT NULL, tag_id INT NOT NULL, PRIMARY KEY (product_id, tag_id), FOREIGN KEY (product_id) REFERENCES products(id) ON DELETE CASCADE, FOREIGN KEY (tag_id) REFERENCES tags(id) ON DELETE CASCADE );
最常见需求是“找出所有有 php 或 mysql 标签的商品”,别用子查询套子查询。正确姿势是:
INNER JOIN 关联一次 product_tags,再用 IN 或多个 OR 条件筛 tag_id
product_id 分组并 HAVING COUNT(DISTINCT tag_id) = 2
product_tags 上有 (tag_id, product_id) 的复合索引,否则 WHERE tag_id IN (...) 会全表扫描SELECT DISTINCT p.*
FROM products p
INNER JOIN product_tags pt ON p.id = pt.product_id
WHERE pt.tag_id IN (
SELECT id FROM tags WHERE name IN ('php', 'mysql')
);用户输入“PHP”“Php”“php”都应归一为同一条记录。不能靠应用层判断,要用数据库保证:
INSERT IGNORE 或 INSERT ... ON DUPLICATE KEY UPDATE,依赖 tags.name 的唯一索引LOWER()),或用 MySQL 8.0+ 的 collation 如 utf8mb4_0900_as_cs 控制大小写敏感INSERT INTO product_tags SELECT ... FROM tags WHERE name = ?,避免先查 ID 再插,减少往返容易被忽略的是:批量打标签时,product_tags 的 (product_id, tag_id) 主键能天然去重,不用额外判重逻辑。