Interrupção afetou milhares de sites e aplicativos em todo o mundo, causando grandes prejuízos.
Após uma interrupção global, AWS retorna às operações normais, mas com backlog em alguns serviços.
Amazon Web Services normaliza operações após pane global
Na tarde de segunda-feira (20), o serviço de nuvem da Amazon, AWS, retornou às operações normais após uma interrupção que impactou milhares de sites e aplicativos populares, como Snapchat e Reddit. A empresa informou que alguns serviços ainda enfrentam um backlog de mensagens, o que pode levar algumas horas para ser resolvido.
Impacto global da interrupção
A pane afetou usuários de diversas localidades, resultando em dificuldades no uso de serviços como a carteira digital Venmo e a plataforma de videochamadas Zoom. Tal interrupção foi a maior desde a falha da CrowdStrike no ano passado, que causou problemas em hospitais, bancos e aeroportos, evidenciando a fragilidade das tecnologias interconectadas.
Causas do problema
A AWS relatou que a interrupção teve origem no data center US-EAST-1, que já havia enfrentado problemas similares em anos anteriores. A falha foi atribuída a um problema no Domain Name System (DNS), que impediu que os aplicativos localizassem o endereço correto para o DynamoDB API, um banco de dados crucial para a operação de diversos serviços.
Consequências e recomendações
Especialistas alertam para a necessidade de uma melhor tolerância a falhas por parte dos desenvolvedores. Em um cenário onde muitas empresas dependem exclusivamente de um único provedor de nuvem, a interrupção desta magnitude traz riscos significativos, levando a perdas financeiras e de produtividade. Ken Birman, professor de ciência da computação, destacou a importância de se proteger contra falhas, utilizando ferramentas adequadas para garantir a continuidade dos serviços.
Panorama da dependência da nuvem
A AWS, como o maior provedor de nuvem do mundo, serve empresas, governos e indivíduos. Interrupções em seus servidores podem causar falhas em uma vasta gama de serviços digitais, desde aplicativos de entrega até sistemas de companhias aéreas. A interrupção de segunda-feira evidenciou a dependência crítica que temos dessas infraestruturas, onde uma única falha pode causar grandes danos aos negócios e à vida cotidiana.