Skip to main content

Live

AWS cae otra vez y tira Slack, Hulu y otros servicios web

La servicios de nube de Amazon sufren otro colapso

Otra vez Amazon
(Image: © ShutterStock)

AWS — el servicio de computación en la nube de Amazon AWS — acaba de sufrir su tercera caída importante en tres semanas.

Esta última interrupción del servicios comenzó alrededor de las 4 am PT/12 pm GMT el 22 de diciembre, con cientos de incidentes registrados en el sitio de seguimiento DownDetector.

Esta vez, el problema parece haber sido causado por la pérdida de energía en un  centro de datos. Este blog en vivo se actualizará con toda la información más reciente en cuanto la tengamos.

Refresh

Miércoles, 15 de diciembre, 2021

Hay ya miles de quejas en DownDetector, con usuarios de todo Estados Unidos, Europa y Asia informando de problemas con AWS.

Esto ha llevado a un efecto en cadena, tirando varios sitios web populares alojados en servicios de AWS. Según DownDetector, entre ellos están Hulu, Intuit QuickBooks y DoorDash, al igual que Amazon.com

Downdetector services hit by AWS outage

(Image credit: Future / DownDetector)

Hay también servicios de gaming caídos: PlayStation Network, Twitch, League of Legends, Valorant, Apex Legends y Halo.

El panel oficial de estado del servicio de AWS aún no muestra ningún problema importante, pero el sitio en sí es muy lento de cargar, lo que posiblemente indique que algo va mal.

Los únicos problemas que se muestran actualmente se refieren a la "Conectividad a Internet de AWS" en sus áreas del norte de California y Oregón, parte de la región AWS US-WEST-1.

AWS dice que está "investigando los problemas de conectividad a Internet en la región US-WEST-1".

See more

Malas noticias en "el lugar más feliz de la Tierra".

Parece que los problemas están afectando tanto a las regiones US-WEST-1 como US-WEST-2 AWS, dos grandes zonas de la compañía y hogar de un gran número de clientes.

Ésta podría ser la razón por la que un gran número de páginas y herramientas están actualmente caídas: Zoom, Okta, Salesforce y Crunchyroll también han sido afectados.

AWS dice que puede estar a punto de solucionar el problema. La última actualización en el Panel de Estado de AWS señala:

"Hemos identificado la causa del fallo de conectividad a Internet a la región US-WEST-1 y hemos tomado medidas para restaurarla. Hemos visto algunas mejoras en la conectividad a Internet en los últimos minutos, pero seguimos trabajando para conseguir la recuperación completa".

Los informes de interrupción de servicio están empezando a decaer en DownDetector. Amazon podría haber resuelto el problema y las cosas podrían haber vuelto a la normalidad.

Downdetector outage reports on AWS services

(Image credit: DownDetector)

Gran actualización:  ¡AWS dice que el problema con la región US-WEST-1 en el norte de California ya está solucionado!

"Hemos resuelto el problema que afecta a la conectividad a Internet a la región US-WEST-1", informa la página de estado de AWS. "La conectividad dentro de la región no se vio afectada por este evento. El problema se ha resuelto y el servicio está funcionando normalmente".

La región US-WEST-2 en Oregón todavía está bajo investigación, pero los informes de DownDetector están cayendo rápidamente. Cruzad los dedos para que se resuelvan pronto.

Los problemas con la región de Oregón también se han resuelto.

"Hemos resuelto el problema que afecta a la conectividad a Internet a la región US-WEST-2 Region", dice AWS. "La conectividad dentro de la región no se vio afectada por este evento. El problema se ha resuelto y el servicio está funcionando normalmente".

Menudo viaje.

En caso de que te acabes de unir a nosotros, dos regiones principales de AWS, US-WEST-1 y US-WEST 2, sufrieron problemas de "conectividad de Internet".

Esto afectó a toda una serie de servicios que se alojan en AWS: Hulu, PlayStation Network e incluso Amazon.com.

AWS dice que los problemas ya se han solucionado, así que mantened los dedos cruzados para que realmente sea el final de nuestras actualizaciones.

Con todos los sistemas funcionando — al menos según el panel AWS — la compañía ha añadido una explicación a la segunda interrupción importante en dos semanas. Las regiones US-WEST-1 y WEST-2 se vieron afectadas por problemas idénticos: "entre las 7:14 AM PST y las 7:59 AM PST, los clientes experimentaron una pérdida elevada de paquetes de red que afectó la conectividad a un subconjunto de destinos de Internet. El tráfico dentro de las regiones de AWS, entre regiones de AWS y hacia otros destinos en Internet no se vio afectado", dice Amazon.

"El problema fue causado por la congestión de la red entre partes de la red troncal de AWS y un subconjunto de proveedores de servicios de Internet, que fue desencadenada por la ingeniería de tráfico de AWS, ejecutada en respuesta a la congestión fuera de nuestra red", añadió. "Esta ingeniería de tráfico movió incorrectamente más tráfico del esperado a partes de la red troncal de AWS que afectaron la conectividad a un subconjunto de destinos de Internet. El problema se ha resuelto y no esperamos que se repita". 

Parece que el problema comenzó con la ingeniería de tráfico de AWS, que vio venir una pesada carga de tráfico, luego hizo la llamada equivocada y trasladó demasiada de esta carga a la red troncal de AWS, lo que interfirió en el camino de la conectividad a Internet de algunos de tus servicios favoritos. A estas alturas, las cosas deberían estar funcionando sin problemas en la mayoría de los sistemas respaldados por AWS. Hemos podido ver un puñado de informes en Twitter sobre interrupciones intermitentes y prolongadas (¿alguien tiene conectividad en sus gafas Oculus VR?). Tal vez todo esté completamente resuelto por la mañana.

Miércoles, 22 de diciembre, 2021

No te lo vas a creer pero AWS ha caído una vez más. A juzgar por el Panel de Estado, el problema tiene que ver con un centro de datos en la región US-EAST-1.

Aquí está lo último de Amazon:

"Seguimos progresando en la restauración de energía al centro de datos afectado dentro de la Zona de Disponibilidad afectada (USE1-AZ4) en la Región US-EAST-1. Hemos restaurado la electricidad en la mayoría de las instancias y dispositivos de red dentro del centro de datos afectado y estamos empezando a ver algunos signos tempranos de recuperación".

En comparación con los dos cortes anteriores, el problema parece ser relativamente menor.

"Los clientes que experimentan problemas de conectividad o disponibilidad de instancias dentro de la Zona de Disponibilidad afectada, deberían comenzar a ver cierta recuperación a medida que se restaura la energía en el centro de datos afectado", describe Amazon.

Aparentemente, la compañía espera que el servicio normal se reanude en las próximas horas.

Así es.

Pero aunque esta interrupción es comparativamente menor, está afectando claramente a varios servicios importantes, especialmente en los Estados Unidos. Los usuarios están informando de problemas con Slack, Hulu, Epic Games Store y más.

Aquí hay una instantánea de la página de inicio de DownDetector:

Downdetector

(Image credit: Downdetector)

El volumen de informes en DownDetector parece estar cayendo ligeramente, desde sy máximo hace aproximadamente una hora. Esto es consistente con los mensajes que salen del mantenimiento de AWS.

Estamos en contacto con AWS para ver si podemos averiguar algo más.

Según Asana, su plataforma de colaboración también se ha visto atrapada en la interrupción pero sólo brevemente.

"Este incidente ya se ha resuelto, y todos los clientes deberían poder acceder una vez más a Asana. Una vez más, nuestras disculpas por las molestias", escribió la compañía en un post.

Malas noticias para los fans de las memes y los GIF: el servicio para compartir imágenes Imgur también está caído.

Aquí hay una captura de pantalla de la página de inicio de Imgur en este momento:

Imgur

(Image credit: Imgur)

La última actualización del Panel de Estado de AWS es que el problema ya se ha resuelto. Esto significa que los servicios afectados deberían comenzar a volver a estar en línea en breve.

"Hemos restaurado la electricidad en todas las instancias y dispositivos de red dentro del centro de datos afectado y estamos viendo recuperación para la mayoría de las instancias de EC2 y los volúmenes de EBS dentro de la Zona de Disponibilidad afectada", afirma AWS.

La compañía continúa diciendo que "todos los servicios están empezando a experimentar una recuperación significativa".

Por separado, AWS nos confirma por correo que el problema ya se ha solucionado y los servicios afectados están comenzando a recuperarse.

En un post en su propia página de estatus, Slack ha confirmado que la mayoría de las funciones afectadas por la interrupción de AWS están ya a pleno rendimiento. Sin embargo, los usuarios siguen encontrando errores al cargar archivos en chats y sus canales de discusión.

Aunque Amazon ya ha restaurado la electricidad de la instalación afectada, la compañía acaba de decir que está experimentando tiempos de recuperación más lentos de lo habitual como resultado de problemas de conectividad de red. 

"Creemos que entendemos por qué está pasando y estamos trabajando en una resolución. Una vez resueltos, esperamos ver una recuperación más rápida", ha dicho Amazon.