What should you be asking your team after the CrowdStrike outage?  

La reciente interrupción tecnológica causada por una actualización defectuosa en una plataforma de ciberseguridad subraya de manera contundente las vulnerabilidades presentes en las infraestructuras tecnológicas modernas. A medida que las empresas dependen cada vez más de sistemas digitales para gestionar sus operaciones diarias, cualquier fallo en estos sistemas puede desencadenar un efecto dominó que impacte no solo la eficiencia operativa, sino también la confianza de los clientes y, en última instancia, la reputación de la empresa. Este incidente específico, que llevó al colapso de millones de computadoras y servidores en todo el mundo, destaca los riesgos que enfrentan las organizaciones al implementar actualizaciones críticas sin pruebas exhaustivas y rigurosas. Si bien las respuestas rápidas y efectivas de las empresas afectadas fueron cruciales para mitigar los daños, también enfatizan la necesidad de un enfoque proactivo en la gestión de crisis tecnológicas. 

El impacto inmediato de la interrupción fue considerable, con organizaciones de todo el mundo movilizándose rápidamente para contener la situación. Se formaron salas de crisis, se mantuvo una comunicación constante con las partes interesadas y se desarrollaron planes de remediación para restaurar las operaciones normales. Sin embargo, estas medidas reactivas, aunque esenciales, también exponen las limitaciones de depender exclusivamente de estrategias de contención. En lugar de simplemente reaccionar a las crisis, las organizaciones deben anticiparse a ellas mediante la implementación de estrategias preventivas y resilientes. Esto incluye adoptar procesos de prueba más rigurosos para las actualizaciones críticas, que puedan identificar y resolver problemas potenciales antes de que afecten a los sistemas en producción. La participación de los líderes empresariales en la gestión de crisis también es crucial. No se trata solo de proporcionar los recursos necesarios para la recuperación, sino de asegurar que los equipos de tecnología cuenten con el apoyo y la guía necesarios para tomar decisiones rápidas y efectivas en situaciones de alta presión. La importancia de la transparencia y la comunicación durante estos eventos no puede subestimarse. Los líderes deben comunicar de manera clara y efectiva tanto a los empleados como a los clientes, explicando lo que ocurrió, cómo se está resolviendo el problema y qué medidas se están tomando para evitar que algo similar ocurra en el futuro. Esta comunicación abierta no solo ayuda a mantener la confianza de los clientes, sino que también puede ser un factor clave en la motivación y el compromiso del personal durante el proceso de recuperación. 

A medida que las organizaciones navegan por las consecuencias de tales interrupciones, se hace evidente la necesidad de una mayor transparencia en la comprensión de los riesgos tecnológicos. Es esencial que las empresas tengan una visión clara de las dependencias tecnológicas que podrían poner en riesgo la continuidad de las operaciones. Esto implica no solo un análisis económico de los costos asociados con las interrupciones, sino también una comprensión operativa y técnica de cómo interactúan entre sí los diferentes componentes del sistema. Sin esta claridad, las empresas corren el riesgo de subestimar las amenazas y pueden encontrarse desprevenidas ante futuras interrupciones. Los líderes empresariales deben exigir una mayor visibilidad de estos riesgos, impulsando la cuantificación y priorización de las diversas amenazas tecnológicas para poder tomar decisiones informadas sobre dónde invertir en resiliencia. En este contexto, la resiliencia tecnológica no se trata solo de mantener los sistemas en funcionamiento durante una crisis, sino de garantizar que estos sistemas puedan recuperarse rápidamente y continuar operando con mínimas interrupciones. Esto requiere una reevaluación de las arquitecturas tecnológicas existentes y la adopción de cambios que puedan mejorar la capacidad de recuperación. Por ejemplo, la implementación de sistemas basados en la nube, que permiten una recuperación más rápida mediante la reconfiguración automática y el despliegue en múltiples ubicaciones geográficas, puede ser una solución efectiva para muchas organizaciones. De manera similar, las arquitecturas georresilientes, que permiten la conmutación por error entre regiones en caso de una interrupción, pueden garantizar que las aplicaciones críticas sigan disponibles incluso en situaciones de crisis. Estas soluciones, aunque pueden implicar costos adicionales, son inversiones necesarias para asegurar la continuidad operativa en un entorno tecnológico cada vez más incierto. 

La introducción de procesos de pruebas y puesta en escena más rigurosos también es crucial para minimizar las interrupciones causadas por actualizaciones defectuosas. Las organizaciones deben considerar la implementación de un enfoque de despliegue gradual, donde las actualizaciones se implementen inicialmente en un pequeño porcentaje de sistemas antes de ser desplegadas en toda la red. Este enfoque no solo permite identificar y corregir problemas potenciales antes de que afecten a todos los sistemas, sino que también reduce el riesgo de una interrupción generalizada. La inversión en estos procesos puede ser vista como un costo preventivo que, en última instancia, puede ahorrar a la organización millones en pérdidas operativas y daños a la reputación. La planificación de recuperación ante desastres y la continuidad del negocio también deben ser áreas de enfoque crítico. Las organizaciones no solo deben desarrollar planes que cubran una amplia gama de escenarios, sino que también deben asegurarse de que estos planes sean lo suficientemente robustos para soportar las realidades de una crisis real. Esto implica no solo realizar pruebas periódicas de estos planes, sino también involucrar a los altos directivos en simulaciones de crisis que los preparen para tomar decisiones críticas con información limitada. Las simulaciones en vivo, donde se prueba la capacidad de la organización para recuperar aplicaciones en un entorno de recuperación ante desastres, pueden proporcionar una visión valiosa de la eficacia de los planes existentes y destacar las áreas que necesitan mejoras. Además de los desafíos técnicos, las interrupciones tecnológicas como la reciente subrayan la importancia de la resiliencia organizacional. La capacidad de una organización para recuperarse de una crisis no depende únicamente de la tecnología, sino también de su cultura y estructura. Las empresas que fomentan una cultura de resiliencia, donde la flexibilidad, la adaptabilidad y la innovación son valores centrales, están mejor posicionadas para enfrentar y superar las crisis. Esto incluye la capacidad de los empleados para trabajar juntos de manera efectiva bajo presión, la agilidad de la organización para adaptarse a nuevas realidades y la disposición de los líderes para tomar decisiones difíciles en tiempos de incertidumbre. El incidente también destaca la importancia de la colaboración entre organizaciones y proveedores de tecnología. Dado que muchas empresas dependen de proveedores externos para la gestión de sus sistemas críticos, es fundamental que estas relaciones estén basadas en la transparencia y la confianza. Los proveedores deben ser capaces de ofrecer un alto nivel de soporte y comunicación durante las crisis, y las empresas deben asegurarse de que sus proveedores cumplen con los estándares de resiliencia y seguridad necesarios para proteger sus operaciones. Esta colaboración no solo ayuda a mitigar los riesgos, sino que también puede acelerar la recuperación al proporcionar acceso rápido a los recursos y conocimientos necesarios para resolver el problema. 

Finalmente, es crucial que las organizaciones vean los incidentes de interrupción tecnológica no solo como eventos negativos, sino como oportunidades para aprender y mejorar. Cada crisis ofrece lecciones valiosas que pueden ser utilizadas para fortalecer la resiliencia de la organización a largo plazo. Esto incluye la revisión de los procesos y políticas existentes, la implementación de nuevas tecnologías y la mejora de la formación y el desarrollo de los empleados. Al adoptar una mentalidad de mejora continua, las organizaciones pueden transformar las crisis en catalizadores para el crecimiento y la innovación, asegurando que estén mejor preparadas para enfrentar los desafíos futuros. En conclusión, la resiliencia tecnológica y organizacional debe ser una prioridad estratégica para todas las empresas en un mundo cada vez más digital y dependiente de infraestructuras complejas. Las interrupciones tecnológicas, aunque inevitables, no tienen por qué ser devastadoras si las organizaciones están bien preparadas y adoptan un enfoque proactivo para gestionar los riesgos. Mediante la inversión en tecnologías resilientes, la implementación de procesos rigurosos de pruebas y la promoción de una cultura de resiliencia, las empresas pueden no solo sobrevivir a las crisis, sino prosperar en un entorno empresarial cada vez más desafiante. 

Para leer más ingrese a:

https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/what-should-you-be-asking-your-team-after-the-crowdstrike-outage# 

https://cidet.sharepoint.com/sites/Difusin/Shared%20Documents/General/1724082189943.pdf  

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)

Compartir artículo

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Busca los documentos, noticias y tendencias más relevantes del sector eléctrico

Buscador de documentos
Buscador de noticias y tendencias

Banco de Información

Descripción del semáforo tecnológico

Los documentos se clasifican en varios colores tipo semáforo tecnológico que indican el nivel de implementación de la tecnología en el país

Tecnología en investigación que no ha sido estudiado o reglamentado por entidades del sector.

La tecnología se aplica de manera focal y se encuentra en estudio por parte de las entidades del sector.

La tecnología se aplica de manera escalable y se encuentran políticas y regulaciones focales establecidas.

La tecnología se aplica a través de servicios  y se encuentran políticas y regulaciones transversales establecidas.

La tecnología se aplica de manera generalizada  y se tiene un despliegue masivo de esta.

Para acceder a todos los documentos publicados y descargarlos ingresa aquí