面试题：MySQL配置优化之多实例与分布式优化

一、MySQL 多实例配置优化

实例参数优化
- innodb_buffer_pool_size：这是最重要的参数之一，它用于缓存 InnoDB 数据和索引。在大型企业级应用中，应根据服务器内存大小尽可能设置较大的值，比如如果服务器有 64GB 内存，可以设置为 48GB 左右，以减少磁盘 I/O，提升读写性能。例如：

[mysqld]
innodb_buffer_pool_size = 48G

- **innodb_log_file_size**：该参数决定了 InnoDB 重做日志文件的大小。适当增大此值可以减少日志切换频率，提高写入性能。但如果设置过大，恢复时间可能会变长。一般建议设置为 `innodb_buffer_pool_size` 的 25% - 50%。例如：

[mysqld]
innodb_log_file_size = 12G

- **innodb_flush_log_at_trx_commit**：此参数控制 InnoDB 日志刷新到磁盘的频率。取值 0 表示每秒刷新一次日志到磁盘；取值 1（默认值）表示每次事务提交时都刷新日志到磁盘，保证数据的一致性，但会影响写入性能；取值 2 表示每次事务提交时将日志写入文件系统缓存，每秒再刷新到磁盘。对于追求高性能且能接受一定数据丢失风险的场景，可以设置为 0 或 2。例如：

[mysqld]
innodb_flush_log_at_trx_commit = 2

- **sync_binlog**：控制二进制日志刷新到磁盘的频率。默认值 1 表示每次事务提交时都将二进制日志刷新到磁盘，保证数据一致性，但性能较低。设置为 0 表示由操作系统控制刷新，性能较好但存在数据丢失风险。根据业务对数据一致性的要求来调整，例如对于数据一致性要求不那么高的分析型业务，可以设置为 0：

[mysqld]
sync_binlog = 0

多实例拓扑优化
- 主从复制：通过配置主从复制，可以实现读写分离，提升读性能。主库负责写操作，从库负责读操作。在主库配置文件中设置 server-id 和开启二进制日志：

[mysqld]
server-id = 1
log-bin = /var/log/mysql/mysql-bin.log

在从库配置文件中设置不同的 server-id 并配置复制相关参数：

[mysqld]
server-id = 2

然后在从库上执行 CHANGE MASTER TO 命令来连接主库，获取主库的二进制日志位置并进行复制。 - 多主多从：在某些场景下，为了进一步提升写入性能和高可用性，可以采用多主多从架构。每个主库可以接受写操作，然后通过复制将数据同步到其他主库和从库。但这种架构需要注意数据冲突的处理，例如可以通过设置不同的自增长范围来避免主键冲突。

二、分布式中间件配置优化

MyCat 配置优化
- 数据分片规则：合理设置数据分片规则是提升性能和数据一致性的关键。例如按用户 ID 进行哈希分片，将用户相关的数据均匀分布到不同的节点上，避免数据热点。在 MyCat 的配置文件 schema.xml 中定义分片规则：

<schema name="TESTDB" checkSQLschema="false" sqlMaxLimit="100">
    <table name="user" dataNode="dn1,dn2,dn3" rule="mod-long">
</table>
<dataNode name="dn1" dataHost="host1" database="db1"/>
<dataNode name="dn2" dataHost="host2" database="db2"/>
<dataNode name="dn3" dataHost="host3" database="db3"/>
<dataHost name="host1" maxCon="1000" minCon="10" balance="0" writeType="0" dbType="mysql" dbDriver="native">
    <heartbeat>select user()</heartbeat>
    <writeHost host="hostM1" url="192.168.1.100:3306" user="root" password="123456"/>
</dataHost>
<dataHost name="host2" maxCon="1000" minCon="10" balance="0" writeType="0" dbType="mysql" dbDriver="native">
    <heartbeat>select user()</heartbeat>
    <writeHost host="hostM2" url="192.168.1.101:3306" user="root" password="123456"/>
</dataHost>
<dataHost name="host3" maxCon="1000" minCon="10" balance="0" writeType="0" dbType="mysql" dbDriver="native">
    <heartbeat>select user()</heartbeat>
    <writeHost host="hostM3" url="192.168.1.102:3306" user="root" password="123456"/>
</dataHost>
<rule name="mod-long">
    <rule>
        <columns>user_id</columns>
        <algorithm>mod-long</algorithm>
    </rule>
</rule>
<function name="mod-long" class="io.mycat.route.function.PartitionByMod">
    <property name="count">3</property>
</function>

- **读写分离配置**：在 MyCat 中可以配置读写分离，将读请求分发到从库，写请求发送到主库。在 `server.xml` 中配置用户权限和读写分离规则：

<user name="root">
    <property name="password">123456</property>
    <property name="schemas">TESTDB</property>
    <property name="readOnly">false</property>
</user>
<user name="readuser">
    <property name="password">123456</property>
    <property name="schemas">TESTDB</property>
    <property name="readOnly">true</property>
</user>

ShardingSphere 配置优化
- 分片策略配置：ShardingSphere 支持多种分片策略，如标准分片策略、复合分片策略等。以标准分片策略为例，在配置文件 sharding - sphere - yaml 中定义：

rules:
  - !SHARDING
    tables:
      user:
        actualDataNodes: ds${0..1}.user_${0..1}
        tableStrategy:
          standard:
            shardingColumn: user_id
            shardingAlgorithmName: mod - sharding - algorithm
    shardingAlgorithms:
      mod - sharding - algorithm:
        type: MOD
        props:
          shardingCount: '2'

- **读写分离配置**：通过配置读写分离数据源，将读操作分发到从库。例如：

dataSources:
  master - slave - ds:
    url: jdbc:mysql://master:3306/demo_ds?serverTimezone = UTC
    username: root
    password: root
    slaveDataSourceNames: slave_0,slave_1
    loadBalanceAlgorithmType: ROUND_ROBIN
  slave_0:
    url: jdbc:mysql://slave0:3306/demo_ds?serverTimezone = UTC
    username: root
    password: root
  slave_1:
    url: jdbc:mysql://slave1:3306/demo_ds?serverTimezone = UTC
    username: root
    password: root

三、解决数据热点问题

配置调整
- 缓存热点数据：使用 Redis 等缓存系统缓存热点数据。例如对于经常访问的商品详情页数据，可以在 Redis 中缓存，当用户请求时先从 Redis 读取，如果没有再从 MySQL 读取并更新 Redis 缓存。
- 调整分片规则：如果发现某个分片上的数据成为热点，可以调整分片规则，将热点数据分散到其他分片上。比如原来按用户 ID 取模分片，发现某个用户 ID 范围的数据访问量特别大，可以改为按用户 ID 哈希后再取模，使数据分布更均匀。
架构优化
- 垂直拆分：将热点数据所在的表按功能进行垂直拆分，将不经常访问的字段拆分到其他表中，减少热点表的压力。例如将用户表中的一些扩展信息拆分到另外的表中，主用户表只保留核心信息。
- 水平扩展：增加节点数量，将热点数据进一步分散。比如在 MyCat 或 ShardingSphere 中添加新的数据节点，将部分热点数据迁移到新节点上。例如通过调整分片规则，将部分热点数据迁移到新增的数据节点 dn4 上：

<dataNode name="dn4" dataHost="host4" database="db4"/>

然后重新进行数据分片，将部分热点数据分配到 dn4 节点。

通过以上从配置层面和架构优化层面的措施，可以有效提升 MySQL 在大型企业级应用中的数据一致性、读写性能以及高可用性，并解决数据热点问题。

面试题：MySQL配置优化之多实例与分布式优化

知识考点

面试题答案

一、MySQL 多实例配置优化

二、分布式中间件配置优化

三、解决数据热点问题