Nunca antes hubo un día tan crítico para la tecnología a nivel global como este viernes 19 de julio de 2024.
Un simple programa antivirus causó la mayor hecatombe tecnológica que tengamos memoria. Un error en una actualización de la plataforma de ciberseguridad de la compañía CrowdStrike provocó una caída masiva en los sistemas de Microsoft, y como si fuera una bola de nieve afectó la salida y llegada de vuelos, compañías ferroviarias, bancos, hospitales y empresas de telecomunicaciones.
Le explicamos en video: ¿Qué es y qué hace CrowdStrike, la empresa responsable de la caída global de Microsoft?
Todo empezó el jueves 18 de julio, cuando la empresa registró los primeros fallos en el update de un programa antivirus, lo cual impactó también las operaciones informáticas de los Juegos Olímpicos de París, según dio a conocer el comité organizador del evento, a una semana de la ceremonia de apertura el 26 de julio.
Según George Kurtz, CEO de CrowdStrike, el problema no se debió a un incidente de seguridad ni a un ciberataque, sino a un error en la actualización del sensor Falcon, un componente esencial de su software de protección contra ciberataques.
Asimismo, indicó en su cuenta de X que los clientes se vieron afectados “por un defecto encontrado en una actualización de contenido de los usuarios de Windows”. También detalló que “el problema fue identificado, aislado y se ha aplicado una corrección”, pero el fallo se extendió rápidamente a nivel global, afectando gravemente a cientos y miles de empresas, entre ellas Microsoft.
Puede leer: ¿Le gustan los videojuegos? Aprenda a manejar el estrés y cuidar su salud con estos consejos
En Colombia estamos algo familiarizados con los problemas que puede provocar actualización de programas, como le ha ocurrido en un par de ocasiones a Bancolombia.
El problema de Microsoft
En una notificación publicada en su página web, la propia Microsoft indicó que los problemas para ellos empezaron el jueves a las 19:00 GMT (2:00 p.m. hora Colombia) y que afectaron a los usuarios de Azure, su plataforma en la nube que controla el software de ciberseguridad CrowdStrike Falcon.
Según el portal Downdetector, que monitorea interrupciones en servicios digitales, hubo un aumento en los reportes de fallos durante esa noche, con picos significativos en varias regiones del mundo. Esto llevó a un efecto dominó, impactando a múltiples sectores que dependen de la infraestructura de Microsoft.
Le puede interesar: Tome nota: ¿Cómo saber si fue víctima de hackers y qué hacer para protegerse?
En la práctica, esto se tradujo en interrupciones significativas en servicios esenciales de varios países. En Colombia, la Aerocivil afirmó que monitoreaba “de cerca la afectación en algunos sistemas operativos a nivel global y sus implicaciones en el sistema nacional de transporte aéreo”, pero finalmente las aerolíneas que operan en el país no reportaron fallos, como sí ocurrió en el resto del mundo.
Por ejemplo, en España, la empresa pública que gestiona los aeropuertos, conocida como AENA, reportó alteraciones en sus sistemas informáticos, lo que resultó en retrasos y complicaciones operativas.
Además, la avería provocó perturbaciones en varios aeropuertos internacionales, cuyos sistemas de facturación y registro sufrieron problemas, es decir, empleados de aerolíneas y viajeros no pudieron acceder a los sistemas de agendamiento, check-in, salidas, llegadas, entre otros. Así pasó en el aeropuerto madrileño de Barajas, que resultó afectado al igual que todos los demás de España, por lo que los viajeros tuvieron que armarse de paciencia.
Le puede interesar: Temu responde a las denuncias por robo de datos: “Son infundadas”
Medios de comunicación de todo el mundo registraron las quejas de miles de viajeros. En el aeropuerto parisino de Roissy, un avión de Air France con destino a Berlín tuvo que regresar a su punto de partida tras 45 minutos de vuelo el viernes por la mañana, según constató la agencia de prensa AFP.
“No logramos encontrar otro vuelo o un tren, no nos quedará más remedio que dormir en el aeropuerto”, declaró a ese medio la pasajera Anja Müller, estudiante de 22 años que debía regresar a Alemania tras una semana de vacaciones en Francia.
En el resto de Europa se reportó que los sistemas de pago con tarjeta dejaron de funcionar en numerosos comercios y algunos medios de comunicación enfrentaron dificultades en la distribución de sus servicios.
Las principales aerolíneas estadounidenses, entre ellas Delta, United y American Airlines, también se vieron afectadas, pero en la tarde del viernes comenzaron a retomar sus actividades tras haber suspendido sus vuelos a primera hora debido a “problemas de comunicaciones”. Algo parecido sufrieron los aeropuertos de Australia, el aeródromo neerlandés de Ámsterdam-Schiphol y el de Hong Kong, indicaron los gestores aeroportuarios de esos países.
Puede leer: Samsung Unpacked 2024: Lanzamiento del ‘anillo inteligente’ Galaxy Ring y más novedades tecnológicas
Pero además de compañías aéreas y aeropuertos, el fallo informático afectó a hospitales neerlandeses, a la Bolsa de Londres y al principal operador ferroviario británico.
Las emisiones de la cadena británica Sky News se vieron interrumpidas y en Australia, la cadena nacional ABC declaró que sus sistemas se habían visto afectados por un fallo “importante”. En Nueva Zelanda, los medios locales informaron de problemas en bancos y en los sistemas informáticos del Parlamento.
¿Cómo arreglar el problema?
Ante esa oleda de fallos sin precedentes, desde la madrugada del viernes CrowdStrike reportó estar trabajando activamente para solucionar el error, pero la afectación ha sido de tal magnitud que, tras varias horas, en muchas partes del mundo la interrupción de servicios persiste.
En una carta publicada en su web oficial, la compañía ofreció disculpas y declaró que comprenden la gravedad y el impacto de la situación: “Identificamos rápidamente el problema e implementamos una solución, lo que nos permitió concentrarnos diligentemente en restaurar los sistemas de los clientes como nuestra máxima prioridad”. De igual forma, detallaron que los hosts de sistemas Mac y Linux no se vieron afectados, e insistieron en que “no se trató de un ataque cibernético ni de seguridad”.
“Estamos trabajando en estrecha colaboración con los clientes y socios afectados para garantizar que todos los sistemas se restablezcan, para que pueda brindar los servicios en los que confían sus clientes. CrowdStrike está funcionando con normalidad y este problema no afecta a nuestros sistemas de la plataforma Falcon. No hay impacto en la protección si el sensor Falcon está instalado. Los servicios Falcon Complete y Falcon OverWatch no se ven interrumpidos”, dice la misiva.
Pero el carácter global de este fallo hizo que algunos expertos se fijaran en el problema de fondo: el hecho de que gran parte del mundo depende de un único proveedor para servicios tan diversos.
En declaraciones para EL COLOMBIANO, Alexander Liskin, jefe de Investigación de Amenazas en Kaspersky, empresa rusa de seguridad informática, explicó que en esta situación en específico la dificultad para encontrar soluciones “radica en el hecho de que cuando ocurre el problema, cada dispositivo, sea computadora, portátil o servidor, debe reiniciarse en modo seguro manualmente y esto no se puede hacer utilizando herramientas de gestión”.
Le puede interesar: ¿Por qué consume tanta energía la inteligencia artificial?
Para evitar estas situaciones, según el especialista, los proveedores de seguridad de la información “deben ser altamente responsables con la calidad de las actualizaciones que lanzan, todas deben ir acompañadas de una cantidad significativa de pruebas y verificaciones internas. “Hasta que no se pasan, la actualización no se puede distribuir a los clientes”.
Liskin explicó que, para evitar afectaciones a nivel global, ese tipo de empresas deben “adherirse al principio de una liberación granular de las actualizaciones. Esto significa que no se distribuyan globalmente a todos los clientes de forma simultánea, sino gradual, de modo que, en caso de cualquier fallo imprevisto, sea posible localizarlo y solucionarlo rápido”.
“Además, es necesario monitorear y responder de inmediato a cualquier situación deteniendo urgentemente las actualizaciones. Si surgen problemas inesperados que afectan a los usuarios, siempre se registran con la prioridad adecuada y se analizan qué medidas deben tomarse e implementarse. Resolver el problema se convierte en una prioridad a todos los niveles de la empresa”.
Por su parte, el profesor de ingeniería de software John McDermid, de la Universidad británica de York, dice que “este tipo de software puede ser una causa común de fallo para múltiples sistemas al mismo tiempo”. Este incidente sacó a la luz la enorme influencia de Crowdstrike, que aunque es poco conocida por la opinión pública, en el sector digital es un gigante.
Problemas en Colombia
Asobancaria, el gremio de los bancos en Colombia, reconoció que algunas entidades financieras presentaron problemas a raíz del fallo de Crowdstrike.
“Si bien algunas entidades han presentado dificultades en los canales de atención, se está trabajando para solucionar el incidente lo más pronto posible. Cabe resaltar que es un fallo que afecta a aeropuertos, bancos y empresas en todo el mundo, y que, al ser una tarea de recuperación manual, la demanda operacional es alta”, detallaron en una comunicación el viernes.
De igual forma, Asobancaria dio un parte de tranquilidad a los usuarios y reiteró que la información, el dinero y los ahorros de los colombianos están seguros.