MQ 技术与 RocketMQ 集群：秒杀系统的优化与全链路消息可靠性解析

引入MQ，将同步的时间驱动转为异步的消息驱动，完成服务解耦。

什么是消息驱动？什么是MQ？有什么用？

提到秒杀相关–立即使用mq

提到mq想到：

1. MQ的三个优点

异步
- 同步的事件驱动改为异步的消息驱动
- 快递直接送到家–>菜鸟驿站–>客户自己去取
解耦
- 不同技术、不同语言系统对接
- Thinking in java–>编辑社–>中文版、法语版、韩文版
削峰（最重要的场景，秒杀场景）
- 用稳定的系统资源处理突发的流量冲击
- 长江水涨水落–>三峡大坝–>蓄水

2. 秒杀有哪些难点？如何优化一个秒杀系统？

秒杀前，页面访问压力大解决方案：页面静态化，CDN+Redis+Nginx多级缓存
秒杀时，下单过于集中，作弊软件刷单解决方案：前端页面增加答题环节
秒杀时，下单请求对系统冲击大，影响其他正常功能解决方案：为秒杀独立一套订单系统
秒杀时，快速精准扣减库存。解决方案：基于缓存如Redis实现快速精准扣减库存
秒杀后，快速过滤未抢到的下单请求解决方案：库存扣减完后，快速通知Nginx，过滤下单请求
秒杀后，下单模块压力大。解决方案：下单请求写入MQ，后端下单模块慢慢下单。下单后，也通过MQ通知下游服务，完成下单。

MQ的以下问题如何解决？

如何保证消息不丢失？
消息积压严重怎么办？
如何保证消息不重复消费？
如何保证消息消费顺序？
RocketMQ如何优化底层数据读写？

3. 常用的MQ技术

4. RocketMQ的集群架构

RocketMQ架构上主要分为四部分：

Producer 消息生产者
Consumer 消息消费者
NameServer 路由注册中心
Broker 服务调度节点

问题：为什么RocketMQ要自己做一个NameServer，而不使用线程的Zookeeper、Nacos、Eureka？

答：NameServer非常轻量级（节点之间不存在数据通信），每个节点上保存全量的broker信息，不需要进行交互（例如选举等操作）。轻量带来的问题：broker有可能在NS1上注册成功，但是在NS2上注册失败，这就会导致两台NameServer上数据不一致，牺牲了数据一致性。基于AP，牺牲了CP。

一谈到微服务就要考虑CAP，根据自己业务定制。

5.RocketMQ如何保证全链路消息不丢失？

所有MQ产品消息丢失的元凶：网络+缓存

生产者发送消息到MQ有可能丢失消息
MQ收到消息后，写入硬盘时有可能丢失消息
消息写入硬盘后，硬盘坏了，也有可能丢失消息
消费者消费MQ消息，如果进行异步消费，也有可能丢失消息

5.1 路由中心挂了怎么办？

问题：

NameServer的路由发现与路由剔除机制是什么样的？
从CAP理论的角度分析，NameServer保证的是CP还是AP？为什么要这样设计？
NameServer全部挂了，客户端还能不能正常工作？
1. 答：短时间可以。Producer和Consumer本地都有一个本地缓存（缓存Broker信息），所以在短时间内是可以正常工作的（比如Producer一下子发10条消息，发到第5条的时候NS挂了，剩余5条还是可以继续发送的，但是后续还想重新发消息就不能发了；对于Consumer基本上就立即不能用了，Producer和Consumer会不断的向NS发送心跳请求询问是否更新缓存）

5.2 生产者发送消息到MQ消息丢失

方案一：同步发送+多次重试。最通用的方案

方案二：RocketMQ提供的事务消息机制。

从具体的业务场景理解事务消息机制的作用。

问题：

理解分布式事务问题
half消息如何保证不向下游服务推送？
如何控制RocketMQ进行消息状态回查的次数和频率？
1. 回查15次（transactionCheckMax），可修改
2. 频率（回查间隔，transactionCheckInterval）。60s，可修改
事务消息机制真的只跟生产者端有关吗？

一个订单系统mq的设计（可以作为面试的一个示例–内外网的webservice调用）