【每日科技网】
2021年7月13日,bilibili 出现了一次服务不可用的宕机事故。一年以后,bilibili 技术团队以一篇事故复盘的文章刷爆了技术人的朋友圈,这一次典型的技术事故,却成了一个非典型的技术故事。
类似的黑天鹅事件时有发生,有的或出于单体应用的代码规范问题,有的或出于瞬时流量的峰值涌入,有的或因为云厂商的服务抖动受到牵连。可以说,后端研发人员的成长之旅,往往伴随着对黑天鹅事件的防范、处理、教训,互联网服务这么多年发展至今,高可用能力到了什么程度,是否能帮助企业规避黑天鹅事件的发生?上云是否是这个时代保证服务稳定性的有效途径?企业技术管理者又该如何居安思危,调整技术架构?
9月25日,腾讯云 TVP 走进 B 站,畅聊「高可用 VS 黑天鹅」的那些事儿,相信能给你一些不一样的启发。本文为本次活动精华总结。
bilibili云原生架构演进
bilibili 技术委员会主席、腾讯云 TVP 毛剑带来了题为《bilibili 云原生架构演进》的主题分享。
毛剑老师介绍道,bilibili 的云原生演进大体上始于2015年,主要历程涵盖了微服务、容器化和中间件三个关键环节:
微服务: 伴随着业务的发展、DAU 的爆发,2015年开始从单体转向微服务,面对单体架构无法扩展、可靠性低的问题,应对的思路概括为“化繁为简,分而治之。