B站崩了,多大点事儿?


7月13日23时许,B站客户端和网页端均出现访问故障,无法打开,页面提示“正在玩命加载数据”。
难道是各位用户热情太高涨,视频刷太多,把哔哩哔哩整崩了?
 
逐一排查,网络 OK,手机 OK,其他 App 也 OK。
 
速速上微博一看,原来大家都崩了
 
一时间网上猜测、议论不断,#B站崩了#迅速冲上微博热榜,有说是机房着火的,也有担心软件被未知攻击的,当然还有“蒙古上单”说。
部分 IT 工作者看到貌似比较靠谱的“机房着火”说,心中窃喜,连夜爬起来写简历,准备投 B站架构岗。就算是着火停电也不至于中断啊,除非把应用服务器都放在同一个地方,没有任何灾备措施,如果真是这样,那 B站架构师可以思考人生了。
 
随后上海消防也迅速出来辟谣,表示未见火情

“着火说”排除,技术宅、段子手、“B站难民”涌入其他平台,于是就有了如下连锁反应:
 
B站崩了 A站崩,A站崩完豆瓣崩,豆瓣崩完...
 
微博运维:你以为你很幽默?
 
好在微博技术人员够给力,挺住了蜂拥而至的夜间流量。
 
随后,约在 23 时 45 分,B站网页端和 App 才恢复正常。对于此次长时间宕机的原因,B站方面暂无回应。

部分“熬夜冠军”们是早睡了,但是 B站的技术团队还没有睡,四十分钟内恢复运营,也是够拼。哔哩哔哩弹幕网微博评论区也热闹起来:
 
四十分钟太长,建议抽奖。
 
经此一事才意识到,原来 B站平时承受了远超于大家想象的浏览量。
 
这么晚了,还要加班,给小电视的技术人员一键三连!!
 
闹归闹,服务器宕机常见原因要知道,多知道一点,说不定某安全架构岗就是你的了。
 
  • 运行环境问题导致服务器宕机
 
服务器运行环境包括操作系统,数据库,应用程序,应用程序 bug,网络数据等,以上软件系统故障会引起服务器宕机现象。
 
解决办法:查找分析系统、应用程序相关日志来找出真正的原因。
 
  • 服务器性能问题导致服务器宕机
 
服务器性能好坏也是引发宕机的一个因素,因为 IDC 提供商的服务器有些不是品牌服务器,是组装型的服务器,采购的硬件也不是品牌的,多用于杂牌硬件,难免会因硬件兼容性、CPU、内存等性能不好,导致宕机。
 
解决办法:查看服务器硬件信息,使用工具测试相关硬件配件,或更换配件测试服务器硬件问题,在租用或选购时尽量用配置高的服务器。
 
  • 数据丢失或损坏问题导致服务器宕机
 
数据丢失包括人为错删除数据,磁盘坏道导致数据丢失,磁盘写满等原因可导致服务器系统崩溃宕机。
 
解决办法:做好数据备份,对磁盘进行实时监控

当然,流量洪峰下要做好高服务质量的架构是极具挑战的事情。高可用,业务连续性的基础是异地灾备,异地数据备份、灾备机房必须要设计。需要综合考虑地理环境、系统特点、人员配备、现有资源等多方面因素,是一个长期的系统性工程。
 
临时抱佛脚不可取,容灾备份的知识积累也是一个长期的系统性工程。
 

文章来源:云灾备

免责声明:文章有修改,转载仅为传播更多行业信息,如有侵权请与我们联系,24小时内删除。