Noticias
Caída de Amazon Web Services (AWS) hoy: minuto a minuto de la incidencia en US-EAST-1

Por DesOpinion.com – 20 de octubre de 2025
Durante la madrugada y mañana de este lunes, Amazon Web Services (AWS), el gigante de la nube de Amazon, sufrió una de las interrupciones más grandes del año, afectando a millones de usuarios y empresas en todo el mundo.
Desde las 12:00 a.m. (hora del Pacífico), servicios esenciales como EC2, Lambda, DynamoDB y SQS comenzaron a fallar, dejando fuera de línea a aplicaciones como Snapchat, Ring, Duolingo, Fortnite y Amazon Flex.
🕐 El minuto a minuto del fallo
12:11 a.m. – Todo comienza.
Amazon detecta “aumentos en los errores y la latencia” en múltiples servicios dentro de su región más importante: US-EAST-1 (Virginia del Norte). Esta zona es el corazón de la infraestructura de AWS y aloja gran parte del tráfico de internet global.
1:26 a.m. – Confirmación de un problema grave.
AWS confirma que los errores son significativos y afectan directamente a DynamoDB, uno de sus servicios de base de datos más usados. También se reportan problemas en el Centro de Soporte, lo que impide a los clientes crear casos de ayuda.
2:01 a.m. – Detectan la causa: DNS.
Los ingenieros descubren que el problema está relacionado con el sistema de resolución DNS de DynamoDB, lo que provoca que los servicios no encuentren sus direcciones internas para conectarse entre sí.
2:22 a.m. – Primeras señales de recuperación.
Amazon aplica “mitigaciones iniciales” y algunos servicios comienzan a responder, aunque con mucha lentitud. Se advierte a los usuarios que esperen errores intermitentes mientras se limpia la cola de solicitudes.
3:35 a.m. – El DNS vuelve a la normalidad.
AWS anuncia que el problema de DNS fue totalmente mitigado, y la mayoría de los servicios vuelve a operar. Sin embargo, crear nuevas instancias EC2 (máquinas virtuales) todavía genera errores.
4:00 a.m. – Persisten los problemas en EC2 y Lambda.
Los equipos técnicos siguen trabajando para restaurar el lanzamiento de instancias EC2 y las invocaciones de Lambda, el sistema de funciones automáticas de Amazon.
7:14 a.m. – Confirmación de la magnitud.
Amazon reconoce “errores significativos en las APIs y conectividad” de múltiples servicios. A esta hora, miles de usuarios en todo el mundo reportan fallos en Alexa, Amazon Flex, Ring y servicios de terceros.
8:43 a.m. – Identificada la causa raíz.
El equipo de ingeniería confirma que el origen fue un sub-sistema interno que monitorea la salud de los balanceadores de red (Network Load Balancers).
Este componente falló y generó una reacción en cadena que interrumpió la conectividad entre servicios.
10:38 a.m. – La red comienza a recuperarse.
Las mitigaciones avanzan y se observa recuperación en varias zonas de disponibilidad (Availability Zones). Se reducen los errores de red y los nuevos lanzamientos de instancias comienzan a funcionar.
12:15 p.m. – Recuperación casi total.
AWS anuncia que “la mayoría de los servicios ya opera normalmente”. Solo Lambda presenta errores intermitentes en funciones que hacen peticiones de red.
Amazon ajusta el ritmo de lectura de colas SQS para estabilizar completamente las invocaciones automáticas.
⚙️ ¿Qué causó la caída?
La raíz del problema fue una falla interna en el sistema de salud de los balanceadores de red, que monitorean y distribuyen el tráfico entre servidores.
Al dañarse, los servicios comenzaron a perder comunicación entre sí, lo que generó fallos en cadena en EC2, Lambda, DynamoDB, RDS, SQS y más.
🌎 El impacto global
El apagón afectó a millones de usuarios y decenas de empresas que dependen de AWS.
Entre las más afectadas estuvieron Snapchat, Fortnite, Ring, Duolingo, Slack y Amazon Flex, cuyos conductores reportaron imposibilidad de iniciar sesión o completar entregas.
En redes sociales, el hashtag #AWSDown se volvió tendencia mundial.
✅ Situación actual
Para el mediodía (hora del Pacífico), AWS confirmó que el servicio se había recuperado casi por completo.
Solo algunas funciones de Lambda y nuevas instancias EC2 experimentaban ligeras demoras, pero el sistema global ya estaba operativo.
El equipo de Amazon prometió un informe detallado (“post-mortem”) en las próximas horas para explicar cómo evitarán que un incidente así vuelva a ocurrir.
💬 Conclusión
El incidente de hoy recuerda la enorme dependencia global de la infraestructura de Amazon Web Services.
Una sola falla en una de sus regiones puede afectar desde grandes corporaciones hasta pequeñas apps cotidianas.
Aunque el servicio ya está restablecido, la magnitud del apagón deja una lección clara: incluso la nube más grande del mundo no está exenta de caídas.





