在线教育平台数据库需定制设计:课程与章节用闭包表优化查询,学习进度用设备维度唯一键+时间戳防覆盖,JSON仅存非结构化元数据,分库分表前须验证真实瓶颈。
在线教育平台的数据库不能直接套用通用 CMS 或电商模型——课程原子性、学习状态强时序、多角色权限交叉、实时互动数据高频写入,这些会立刻暴露简单表结构的缺陷。
把 course 和 chapter 设计成父子 ID 关系(parent_id)是常见错误:递归查目录、前端懒加载展开、后台导出全路径都会触发深度 JOIN 或多次查询。
course_chapter_closure)预存所有祖先-后代关系,查某课程全部章节只需 SELECT child_id FROM course_chapter_closure WHERE ancestor_id = ?
chapter 表保留 course_id(直连课程)、parent_id(支持单层嵌套),但禁止跨层递归;真实多级目录由前端按 sort_order 渲染,后端只提供扁平列表 + 层级标识字段 level
path 字段的扁平数组(如 "1.2.5"),避免前端拼接或服务端递归用户拖拽进度、倍速播放、多
端切换、离线缓存回传,会导致同一视频的多个 watch_progress 记录高频写入,仅靠 UNIQUE(user_id, video_id) 会因并发更新失败或覆盖旧值。
REPLACE INTO 或 INSERT ... ON DUPLICATE KEY UPDATE 替代普通 INSERT,但必须确保 updated_at 时间戳严格递增,否则旧客户端回传会覆盖新进度device_id 字段组成联合唯一键(user_id, video_id, device_id),允许同视频在不同设备有独立进度,合并逻辑交给聚合任务而非实时写入last_second(秒级整数)和 play_rate(1.0/1.5/2.0),减少浮点精度问题和存储体积不是所有“动态字段”都该进 JSON:搜索、排序、索引字段(如课程标签、适用年级)仍需拆成关联表;JSON 只用于真正非结构化、低频查询、且无需事务强一致的数据。
course.meta):含视频分辨率、字幕语言列表、配套文档 URL 数组exam_question.options):每道题可有 2–8 个选项,每个选项含 is_image、explanation 等不定字段answer_choice、is_correct、submit_time)CREATE TABLE course ( id BIGINT PRIMARY KEY, title VARCHAR(255), meta JSON, CHECK (JSON_VALID(meta)) );
教育平台早期就分库分表,90% 情况下只是提前引入路由复杂度,而不是解决实际问题。先确认以下三点是否真卡住:
user_study_log 超过 2000 万行?没到就用 PARTITION BY RANGE (created_date) 按月分区,比 ShardingSphere 更轻量SELECT * FROM order WHERE status = 'paid' AND created_at > '2025-01-01'?加联合索引 (status, created_at) 比分表见效更快daily_student_answer_summary),而非硬扛大表 JOIN最常被忽略的是事务边界:一个“报名课程并生成首章学习任务”的操作,涉及 order、user_course、study_task 三张表,它们必须在同一库同一事务内完成;跨库事务会直接导致数据不一致,而多数教育 SaaS 在订单量破万前根本不需要分库。