111.什么是分库分表?

数据分片,指按照某个维度将存放在单一数据库中的数据分散地存放至多个数据库或表中以达到提升性能瓶颈以及可用性的效果。数据分片的有效手段是对关系型数据库进行分库和分表

  • 分库和分表均可以有效的避免由数据量超过可承受阈值而产生的查询瓶颈。除此之外,分库还能够用于有效的分散对数据库单点的访问量。
  • 分表虽然无法缓解数据库压力,但却能够提供尽量将分布式事务转化为本地事务的可能,一旦涉及到跨库的更新操作,分布式事务往往会使问题变得复杂。
  • 使用多主多从的分片方式,可以有效的避免数据单点,从而提升数据架构的可用性。

通过分库和分表进行数据的拆分来使得各个表的数据量保持在阈值以下,以及对流量进行疏导应对高访问量,是应对高并发和海量数据系统的有效手段。数据分片的拆分方式又分为垂直分片和水平分片。

? 垂直分片

按照业务拆分的方式称为垂直分片,又称为纵向拆分,它的核心理念是专库专用。 在拆分之前,一个数据库由多个数据表构成,每个表对应着不同的业务。而拆分之后,则是按照业务将表进行归类,分布到不同的数据库中,从而将压力分散至不同的数据库。

下图展示了根据业务需要,将用户表和订单表垂直分片到不同的数据库的方案:

111.什么是分库分表? - 图1

垂直分片

垂直分片往往需要对架构和设计进行调整。通常来讲,是来不及应对互联网业务需求快速变化的;而且,它也并无法真正的解决单点瓶颈。 垂直拆分可以缓解数据量和访问量带来的问题,但无法根治。如果垂直拆分之后,表中的数据量依然超过单节点所能承载的阈值,则需要水平分片来进一步处理。

垂直拆分的优点:

  • 库表职责单一,复杂度降低,易于维护。
  • 单库或单表压力降低。 相互之间的影响也会降低。

垂直拆分的缺点:

  • 部分表关联无法在数据库级别完成,需要在程序中完成。
  • 单表大数据量仍然存在性能瓶颈。
  • 单表或单库高热点访问依旧对 DB 压力非常大。
  • 事务处理相对更为复杂,需要分布式事务的介入。
  • 拆分达到一定程度之后,扩展性会遇到限制。

? 水平分片

水平分片又称为横向拆分。 相对于垂直分片,它不再将数据根据业务逻辑分类,而是通过某个字段(或某几个字段),根据某种规则将数据分散至多个库或表中,每个分片仅包含数据的一部分。

例如:根据主键分片,偶数主键的记录放入 0 库(或表),奇数主键的记录放入 1 库(或表),如下图所示:

111.什么是分库分表? - 图2

水平分片

水平分片从理论上突破了单机数据量处理的瓶颈,并且扩展相对自由,是分库分表的标准解决方案。

水平拆分的优点:

  • 解决单表单库大数据量和高热点访问性能遇到瓶颈的问题。
  • 应用程序端整体架构改动相对较少。
  • 事务处理相对简单。
  • 只要切分规则能够定义好,基本上较难遇到扩展性限制。

水平拆分缺点:

  • 拆分规则相对更复杂,很难抽象出一个能够满足整个数据库的切分规则。
  • 后期数据的维护难度有所增加,人为手工定位数据更困难。
  • 产品逻辑将变复杂。比如按年来进行历史数据归档拆分,这个时候在页面设计上就需要约束用户必须要先选择年,然后才能进行查询。

? 总结?

  • 数据表垂直拆分:单表复杂度。
  • 数据库垂直拆分:功能拆分。
  • 水平拆分
    • 分表:解决单表大数据量问题。
    • 分库:为了解决单库性能问题。