亚马逊婷婷 发表于 2023-4-27 15:00:02

亚马逊披露AWS故障原因,并计划升级云服务功能


上周亚马逊云计算部门发生大规模中断,导致全球多个网站、应用程序和流媒体平台瘫痪。日前亚马逊发布声明解释了这一中断的原因,并提出了相应的解决方案。

AMZ1234获悉,亚马逊在一份声明中表示,中断问题始于12月7日,起因是一项用于扩展托管在AWS主网络中的AWS服务,其容量的自动化活动引发了内部网络内大量客户的意外行为。

这反过来又导致连接活动激增,使主要AWS网络和内部网络之间的网络设备不堪重负,并导致这些网络之间的通信延迟。结果,网络之间服务通信的延迟和错误增加,导致更多的连接尝试和重试。

该问题甚至使亚马逊无法查看系统究竟出了什么问题。据亚马逊称,运营团队的工程师无法使用他们通常依赖的实时监控系统和内部控制。

亚马逊表示,预计将在2022年初发布新版本的Service Health Dashboard,这将使公司更容易了解服务影响。亚马逊还计划发布一个新的支持系统架构,该架构将积极运行在多个AWS区域,使AWS能够毫不拖延地与其客户进行沟通。

在AWS设法解决问题之前,周二的问题持续了几个小时。成千上万的用户在社交媒体平台上抱怨他们的智能家居设备和其他互联网连接服务已经停止工作。
页: [1]
查看完整版本: 亚马逊披露AWS故障原因,并计划升级云服务功能