大型车祸现场,电商秒杀超卖,这个锅到底有谁来背?
- 2019 年 10 月 17 日
- 筆記
背景
小明在一家在线购物商城工作,最近来了一个新需求,需要他负责开发一个商品秒杀模块,而且需求很紧急,老板要求必须尽快上线。
方案
小明一开始是这么做的,直接用数据库锁进行控制,获取秒杀商品数量并加锁,如果数量大于零则成功,否则秒杀失败。
@Override @Transactional public Result startSeckilDBPCC_ONE(long seckillId, long userId) { //获取秒杀商品数量并加锁 String nativeSql = "SELECT number FROM seckill WHERE seckill_id=? FOR UPDATE"; Object object = dynamicQuery.nativeQueryObject(nativeSql, new Object[]{seckillId}); Long number = ((Number) object).longValue(); if(number>0){ nativeSql = "UPDATE seckill SET number=number-1 WHERE seckill_id=?"; dynamicQuery.nativeExecuteUpdate(nativeSql, new Object[]{seckillId}); SuccessKilled killed = new SuccessKilled(); killed.setSeckillId(seckillId); killed.setUserId(userId); killed.setState((short)0); killed.setCreateTime(new Timestamp(new Date().getTime())); dynamicQuery.save(killed); return Result.ok(SeckillStatEnum.SUCCESS); }else{ return Result.error(SeckillStatEnum.END); } }
写了并发线程,跑了一下,没问题,搞定!但是,小明转头一想,老板曾经说过,这次活动宣传力度很大,有可能会有很多用户参与活动。恰好项目中使用了 Redis
作为缓存,何不借用一下 Redis
的发布订阅功能,实现秒杀队列,从而减轻后端数据库的访问压力,提升服务性能!这可是个升职加薪,当上总经理,出任CTO,迎娶白富美的好机会。说干就干,复制、黏贴一把撸,很快小明就把消息队列方案搞定了。
事故
开发、测试、上线一条龙,活动开始了,秒杀商品是 100 部苹果手机,活动结束以后,居然产生了 106 个订单!老板很生气,后果很严重,这个锅必须有人得背,吓得小明赶紧仔细复查复制粘贴的代码。
监听配置 RedisSubListenerConfig
:
@Configuration public class RedisSubListenerConfig { //初始化监听器 @Bean RedisMessageListenerContainer container(RedisConnectionFactory connectionFactory, MessageListenerAdapter listenerAdapter) { RedisMessageListenerContainer container = new RedisMessageListenerContainer(); container.setConnectionFactory(connectionFactory); container.addMessageListener(listenerAdapter, new PatternTopic("seckill")); return container; } //利用反射来创建监听到消息之后的执行方法 @Bean MessageListenerAdapter listenerAdapter(RedisConsumer redisReceiver) { return new MessageListenerAdapter(redisReceiver, "receiveMessage"); } //使用默认的工厂初始化redis操作模板 @Bean StringRedisTemplate template(RedisConnectionFactory connectionFactory) { return new StringRedisTemplate(connectionFactory); } }
生产者 RedisSender:
/** * 生产者 * @author 爪哇笔记 By https://blog.52itstyle.vip */ @Service public class RedisSender { @Autowired private StringRedisTemplate stringRedisTemplate; public void sendChannelMess(String channel, String message) { stringRedisTemplate.convertAndSend(channel, message); } }
消费者 RedisConsumer:
/** * 消费者 * @author 爪哇笔记 By https://blog.52itstyle.vip */ @Service public class RedisConsumer { @Autowired private ISeckillService seckillService; @Autowired private RedisUtil redisUtil; public void receiveMessage(String message) { //收到通道的消息之后执行秒杀操作 String[] array = message.split(";"); if(redisUtil.getValue(array[0])==null){//control层已经判断了,其实这里不需要再判断了 Result result = seckillService.startSeckilDBPCC_TWO(Long.parseLong(array[0]), Long.parseLong(array[1])); if(result.equals(Result.ok(SeckillStatEnum.SUCCESS))){ WebSocketServer.sendInfo(array[0], "秒杀成功");//推送给前台 }else{ WebSocketServer.sendInfo(array[0], "秒杀失败");//推送给前台 redisUtil.cacheValue(array[0], "ok");//秒杀结束 } }else{ WebSocketServer.sendInfo(array[0], "秒杀失败");//推送给前台 } } }
数据层代码:
@Override @Transactional public Result startSeckil(long seckillId,long userId) { //由于使用了队列,小明这里没用数据库锁 String nativeSql = "SELECT number FROM seckill WHERE seckill_id=?"; Object object = dynamicQuery.nativeQueryObject(nativeSql, new Object[]{seckillId}); Long number = ((Number) object).longValue(); if(number>0){ //扣库存 nativeSql = "UPDATE seckill SET number=number-1 WHERE seckill_id=?"; dynamicQuery.nativeExecuteUpdate(nativeSql, new Object[]{seckillId}); //创建订单 SuccessKilled killed = new SuccessKilled(); killed.setSeckillId(seckillId); killed.setUserId(userId); killed.setState((short)0); Timestamp createTime = new Timestamp(new Date().getTime()); killed.setCreateTime(createTime); dynamicQuery.save(killed); //支付 return Result.ok(SeckillStatEnum.SUCCESS); }else{ return Result.error(SeckillStatEnum.END); } }
小明重新审读了代码,一开始小明觉得既然使用了队列,数据库层面就没必要用数据库锁了,然后去掉了 for update
,很显然问题就出在这里。导致超卖的因素只有一个,那就是多线程并发抢占资源,如果业务逻辑没有做相应的措施,很有可能导致超卖。
回到代码来看,虽然秒杀用户进入了队列,但是 RedisConsumer
端有可能是多线程处理队列数据,小明为了验证想法,在消费端加入了以下代码来打印线程名称。
Thread th=Thread.currentThread(); System.out.println("Tread name:"+th.getName());
再次运行任务,果不其然,每个秒杀用户都开启了一个线程处理任务:
Tread name:container-1 Tread name:container-2 Tread name:container-3 Tread name:container-4 Tread name:container-5 Tread name:container-6 ......
各位看官到这里,线索已经很明确了,我们只需要把消费端改造成单线程处理,问题就迎刃而解了。
解决方案
使用 Redis
消息队列,出现超卖问题是因为RedisMessageListenerContainer
的默认使用线程池是SimpleAsyncTaskExecutor
,每次消费都会创建一个线程来处理,这样就会有大量的新线程被创建。有兴趣的小伙伴可以跟进源码,了解更多详细内容。
监听配置 RedisSubListenerConfig
改造为 :
@Bean RedisMessageListenerContainer container(RedisConnectionFactory connectionFactory, MessageListenerAdapter listenerAdapter) { RedisMessageListenerContainer container = new RedisMessageListenerContainer(); container.setConnectionFactory(connectionFactory); container.addMessageListener(listenerAdapter, new PatternTopic("seckill")); /** * 如果不定义线程池,每一次消费都会创建一个线程,如果业务层面不做限制,就会导致秒杀超卖。 * 此处感谢网友 DIscord */ ThreadFactory factory = new ThreadFactoryBuilder() .setNameFormat("redis-listener-pool-%d").build(); Executor executor = new ThreadPoolExecutor( 1, 1, 5L, TimeUnit.SECONDS, new LinkedBlockingQueue<>(1000), factory); container.setTaskExecutor(executor); return container; }
然后测试改造效果:
Tread name:redis-listener-pool-0 Tread name:redis-listener-pool-0 Tread name:redis-listener-pool-0 ......
小结
那么问题来了,这个锅到底谁来背,开发、测试还是产品?这么好的宣传机会,直接上头条"XX 电商系统 bug 超卖,亏损超 10W 仍坚持发货,称不能亏了消费者"然后超的钱相关责任人担一部分, perfect~。本故事纯属虚构,谁也不怪,如有雷同,纯属巧合。
源码
分布式秒杀现场:https://gitee.com/52itstyle/spring-boot-seckill