Liv McMahon,reportero de tecnología Y

lily jamali,Corresponsal de tecnología en América del Norte

Getty Images Una mujer subiendo escaleras frente a un gran cartel de AWS. Está debajo de una flecha con forma de carita sonriente de Amazon con las tres letras AWS.Imágenes falsas

Amazon Web Services (AWS) dijo el lunes por la noche que había resuelto una interrupción masiva que dejó fuera de línea algunos de los sitios web más grandes del mundo durante días.

Más de 1.000 aplicaciones y sitios web -incluidas plataformas de redes sociales como Snapchat y bancos como Lloyds y Halifax- se vieron afectados por los problemas, que según Amazon estaban en el corazón de las operaciones del gigante de la computación en la nube en Estados Unidos.

El monitor de interrupciones de la plataforma Downdetector dijo que los informes de usuarios sobre problemas en todo el mundo aumentaron a más de 11 millones durante la interrupción del lunes.

Incluso después de que Amazon solucionó el problema subyacente, los expertos dijeron que la interrupción demostró los peligros de que muchas empresas dependan de un único proveedor dominante.

“Este episodio pone de relieve cuán interdependiente es nuestra infraestructura”, afirmó el profesor Alan Woodward de la Universidad de Surrey.

“Muchos servicios en línea dependen de terceros para su infraestructura física, y esto demuestra que pueden ocurrir problemas incluso dentro de esos proveedores externos.

“A menudo, los pequeños errores cometidos por humanos tienen un impacto amplio y significativo”.

Los problemas parecen haber comenzado alrededor de las 07:00 BST del lunes, cuando los usuarios comenzaron a informar problemas para acceder a las plataformas.

Esto incluye una amplia variedad de sitios y servicios diferentes, desde juegos masivos en línea como Fortnite hasta la aplicación de aprendizaje de idiomas Duolingo.

Horas antes, Downdetector le dijo a la BBC que había visto más de cuatro millones de informes de usuarios en 500 sitios en sólo unas pocas horas, más del doble de la cantidad vista en un día laborable típico.

Posteriormente alcanzaron más de 11 millones a medida que más servicios intentaron recuperarse, incluidos Reddit y Lloyds Bank.

Alrededor de las 23:00 BST, Amazon dijo que todos los servicios de AWS habían “vuelto a sus operaciones normales”.

Pero no antes de que la empresa desechara partes de su propio sistema para solucionar el problema de raíz.

Según Mike Chapple, profesor de tecnología de la información en la Universidad de Notre Dame, después del apagón inicial surgió una nueva serie de “fallos en cascada”.

“Es como si hubiera un corte de energía masivo. Las cuadrillas comienzan a trabajar para restablecerlo”, dijo Chapple. “La energía puede parpadear a veces”, explicó, pero Amazon inicialmente “abordó los síntomas” y no la causa.

¿Qué salió mal?

Amazon aún tiene que explicar completamente qué causó la interrupción del lunes ni publicar una declaración oficial al respecto.

El problema “parece estar relacionado con la resolución de DNS para el punto final de la API de DynamoDB en US-EAST-1”, dijo en una actualización en su página web de estado del servicio.

DNS, que significa Sistema de nombres de dominio, a menudo se compara con una guía telefónica de Internet.

Traduce de manera efectiva los nombres de sitios web que la gente usa (como bbc.co.uk) en números que las computadoras pueden leer y entender.

Este proceso sustenta fundamentalmente la forma en que utilizamos Internet, y sus interrupciones significan que los navegadores web no pueden encontrar el contenido que buscan.

Matthew Prince, director ejecutivo de Cloudflare, le dijo a la BBC que la interrupción de AWS puso de relieve el poder que tienen los servicios en la nube sobre el funcionamiento de Internet.

Todo el mundo tiene un mal día, Amazon tuvo un mal día hoy, afirmó.

“Hay cosas maravillosas acerca de la nube, te permite escalar… pero si tienes una interrupción como esta, puedes eliminar muchos de los servicios en los que confiamos”.

Y Cory Crider, director del Future of Technology Institute, dijo a la BBC que era “un poco como el colapso de un puente”.

“Una parte importante de la economía se ha desmoronado”, afirmó.

Y dado que la mayor parte de la computación en la nube depende de Amazon, Microsoft y Google (aproximadamente el 70%), ella dice que el status quo es “estable”.

“Una vez que la oferta se concentra en unos pocos proveedores monopólicos, cuando algo como esto falla, se lleva consigo un enorme porcentaje de la economía”, dijo.

“Realmente deberíamos intentar comprar más servicios locales, en lugar de depender de algunas plataformas monopólicas estadounidenses.

“Esto es un riesgo para nuestra seguridad, nuestra soberanía y nuestra economía y necesitamos ver divisiones estructurales para hacer que nuestros mercados sean más resistentes a este tipo de shocks”.

MIRAR: Lucy Woodham de la BBC pregunta a los estudiantes de Cardiff sobre la interrupción de Snapchat

Un experto en informática dice que las empresas que utilizan AWS tienen cierta responsabilidad.

“Las empresas que utilizan Amazon no están poniendo el suficiente cuidado en incorporar sistemas de protección a sus aplicaciones”, afirma Ken Birman, profesor de informática de la Universidad Cornell de Nueva York.

Los cortes como el del lunes ocurren con frecuencia, aunque no siempre a este nivel.

Birman le dijo a la BBC que los desarrolladores de aplicaciones deberían tener cuidado al invertir en copias de seguridad de aplicaciones de misión crítica que se encuentran en la nube.

“Sabemos cómo fortalecer estos sistemas y sabemos cómo hacerlo de forma segura”, afirmó Birman.

La cuestión de la responsabilidad puede surgir ante los tribunales.

Más de un año después de la huelga masiva, Delta Airlines todavía está luchando contra la compañía para recuperar más de 500 millones de dólares en pérdidas.

Incluso después de que CrowdStrike solucionó el problema, la aerolínea dijo que tuvo que restablecer manualmente 40.000 servidores, lo que provocó importantes retrasos en los vuelos durante varios días.

Información adicional de Asilt Carr.

Un banner de campaña verde que se mueve desde la derecha y forma píxeles con cuadrados y rectángulos negros. El texto dice:

Enlace de origen