计划恢复复制并解决与4/9事件相关的WordPress数据库不一致问题

4月9日星期二,WordPress服务发生了一起事件,导致服务暂时中断,容量减少。使用复制的辅助数据库恢复了服务,但是对该事件的进一步分析确定了与服务中断和恢复过程相关的活动在主数据库和辅助数据库之间引入了数据不一致。没有数据丢失,但是数据库不同步。这将从两个方面影响当前的服务:

  1. 在此事件期间在网站上添加或编辑的内容和设置可能会从您的网站中丢失或恢复到以前的状态。
  2. 数据库复制业务无法恢复,必须先清除不一致的问题。在恢复复制之前,我们的生产故障转移选项是最近的每日备份。

经过广泛的分析,IS&T团队正在制定一个三步计划来解决这些问题,并尽快恢复正常运营。

步骤1 -准备(已完成)

周五早上(4月26日)凌晨2点开始,应用程序开发人员将部署对WordPress代码的更改,以促进下面步骤2和3中描述的工作。这些变化不会影响WordPress网站的服务。这些更改的成功部署和测试将允许我们继续进行步骤2。

更新:步骤1(准备)工作于2013年4月26日凌晨2点46分成功完成。第二步将按计划于2013年4月28日进行。

步骤2 -恢复数据库复制(已完成)

周三早上(5月1日)午夜过后不久,波士顿大学所有基于wordpress的网站将进入“维护模式”。这将暂时挂起写入数据库的函数——主要是编辑、评论和表单。我们预计所有网站在此期间将继续以只读模式运行。网站将完全可以浏览,但编辑将无法登录和编辑内容,访问者将无法留下评论,大多数表单将不可用。我们将自动在评论和提交表单通常出现的地方发布通知,敦促访问者稍后返回完成表单。我们预计在凌晨5点之前完成这项工作。成功完成第2步将恢复主数据库和辅助数据库之间的正常复制过程,并允许我们继续进行第3步。计划在此时间段内发布的页面/帖子将在此工作完成后发布。

更新:开发人员在4月28日的第2步遇到了问题,所以这已经被重新安排在5月1日星期三早上,午夜后不久开始。波士顿大学所有基于wordpress的网站都将进入“维护模式”,我们预计这项工作将在早上5点前完成。

更新二:维护模式在5月1日凌晨3:30左右解除。数据库复制在5月1日上午5:20恢复。

步骤3 -调和数据不一致性

在复制恢复之后,我们将逐个站点运行受监视的脚本,以协调在4/9事件和随后的服务恢复活动期间引入的数据不一致。这些将在工作开始前进行测试,我们预计在工作期间不会有任何服务中断。

更新:在5月20日的那一周,IS&T网络团队将开始联系那些我们发现数据不一致的网站的管理员。贵方将收到有关数据差异的详细信息,并可选择1)自行手动检查和修复任何问题;或者2)允许IS&T继续使用将协调数据问题的被监视脚本。

我们收到了几份报告,说在这次事件中丢失了几页或修改了几页,还有其他不一致的地方没有被注意到。但是这个事件的持续时间是已知的,我们的分析表明,大多数数据库不一致都是相对良性的。我们将继续更新上述步骤和下面的列表,因为我们正在努力解决这些问题。

数据不一致会影响什么?

最初的事件发生在4月9日早上7点02分到下午12点17分之间。这是服务中断和切换到备用数据库。4月13日,服务被切换回主数据库。此时开始发现数据不一致,复制无法继续进行。

  • 在4/9原始事件期间编辑的网页/帖子可能已经恢复到以前的状态。这些编辑将在步骤3中概述的工作期间恢复。
  • 在原始事件期间添加并随后在4月9日至4月13日之间编辑的网页/帖子可能会恢复到以前的状态。编辑将被恢复。
  • 在事件中创建的网页/帖子现在可能会丢失。这些将被恢复。
  • 从“已发布”状态移至“回收站”的网页/帖子可能已恢复到“已发布”状态。这些将被送回垃圾桶。
  • 从草稿状态移到回收站的网页/帖子可能已恢复到草稿状态。这些将被送回垃圾桶。
  • 已编辑/更改的站点设置可能已恢复到以前的状态。编辑后的设置将被恢复。
  • 事件期间提交的评论可能会丢失。这些将被恢复。
  • 在事件期间提交的重力表单条目可能会丢失。这些将被恢复。请注意,在事件发生期间,提交表单的电子邮件通知继续正常运行。
  • 在4/9事件期间,表单视图计数、表单提交计数和表单转换百分比可能略有不准确。对这些指标的影响是可以忽略不计的,这些数字将无法调和。
  • 4/9事件期间的页面修订历史可能不再可用。
  • 在4/9事件期间被网站管理员或编辑删除的表单条目可以被恢复。这可能需要管理员/编辑在完成此工作后再次删除表单条目。

WordPress数据库非常活跃,支持800多个网站和数千个博客。数据库不仅存储站点设置和页面内容,而且还存储使整个应用程序更高效的临时内容,并有助于最大限度地减少访问者的页面加载时间。IS&T团队一直在逐个站点仔细评估不一致性,过滤掉临时存储数据的问题,以便识别和解决那些面向公众的内容和站点设置可能受到影响的问题。

核对数据差异

澳门威尼斯人注册行动

数据不一致包括三种场景。站点管理员将收到一份报告,其中列出了数据差异的类型以及解决问题所需的操作。

  1. 插入-此数据是在4/9事件期间添加的,目前在您的网站上缺失。如果您选择加入我们的计划,IS&T将为您插入(恢复)这些数据。
  2. 替换-该数据在4/9事件期间被编辑,但编辑恢复到以前的状态。如果您选择加入我们的计划,IS&T将用您编辑的最新版本替换此数据。
  3. 删除-这些数据在4/9事件期间从您的网站上删除,并已恢复为实时内容。如果您选择加入我们的计划,IS&T将删除这些数据。

文章类型

网站管理员收到的报告还将列出数据不一致的帖子类型。这些都是:

  1. Page——一个标准的网页
  2. 帖子——标准帖子(通常是新闻或博客文章)
  3. 配置文件-使用BU配置文件插件的网站的澳门威尼斯人注册网站/员工配置文件
  4. 附件-一个媒体项目(通常是图片或文档),已经上传到你的媒体库,并与特定的页面或帖子相关联。(注意:媒体项目仍然在您的网站上,其链接继续工作,但您可能无法在WP媒体库中看到它。)

表单条目

重力表单提交-通过重力表单在您的网站上提交的条目。在此事件中,表单条目的电子邮件通知不受影响-见下文。

当有人提交表单时,大多数部门工作流程使用WordPress发送的电子邮件通知。电子邮件通知没有受到4/9事件的影响,因此站点管理员已经正常收到这些通知,但在事件期间提交的表单条目目前不在数据库中。如果您部门的工作流程依赖于表单条目数据库而不是电子邮件通知,请在回复我们的消息时通知网络团队。我们只计划解决那些表明其工作流依赖于数据库中存在的表单条目的站点的表单条目差异。

后元数据

报告还会列出在“帖子元”数据中存在差异的页面/帖子——澳门威尼斯人注册或与页面或帖子相关的信息(如内容横幅设置、导航标签等)。具体的数据差异将不会在报告中列出。如果你选择加入和解计划,这些问题将得到解决。

分类法

IS&T无法解决分类法之间的差异。从技术上讲,查明与分类法(与页面或帖子相关的类别和标记)之间的任何差异是非常复杂的。鼓励网站管理员检查在此事件中编辑的任何页面/帖子,以确保使用正确的类别/标签。

如果您对基于wordpress的网站有疑问或遇到与此事件相关的问题,请报告并详细描述问题,以便IS&T团队进行调查。