数据库升级前，先准备一份能真的执行的回滚清单

2016年11月8日 · 阅读需 3 分钟

全栈开发者

数据库升级这种事，很多团队会认真写升级步骤，却不认真写回滚步骤。可真正到了线上，最能决定你心态的往往不是“怎么升”，而是“如果升坏了，能不能稳稳退回来”。

2016 年我在处理 MySQL、MongoDB 这类服务时，越来越不相信“应该没问题”这种判断。我更信一份已经想清楚的回滚清单。

一份回滚清单至少要回答四件事

我后来给自己列的清单，最少要把下面四个问题写清楚：

没有这四件事，所谓回滚计划常常只是心理安慰。

很多人会说升级前先备份，这当然没错，但还不够。
真正有用的是你要知道：

这些问题如果不提前想，等事故真的发生，再去问已经来不及。

我见过一种最危险的状态：大家都觉得“再看看，也许一会就好”。
结果原本可以十分钟内止损的故障，被拖成了一个小时。

所以我更喜欢在升级前就写下明确条件，比如：

条件写清楚，不是为了悲观，而是为了让团队在压力下还能保持判断一致。

回滚成功不等于业务恢复。
服务启动了、数据库能连上，只说明技术动作做完了一半。真正要看的，是核心业务链路有没有恢复：

如果没有业务验证，团队很容易在“数据库已经起来了”的错觉里提前散场。

不是不能升级，也不是每次都要如临大敌，而是只要涉及数据层，就必须把“退出策略”设计得和“进入策略”一样认真。
升级步骤是把你送到新世界的路，回滚清单则是防止你迷路时回不来的绳子。

有了这根绳子，很多线上动作反而会更稳。