Los 7 mandamientos de un buen Plan de Continuidad de negocio

Uno quiere que su compañía sea lo más estable posible en todo lo referente a la operativa. Predecible e incluso monótona, a poder ser. Es esta estabilidad la que permite dedicar toda la atención a evolucionar el negocio, a diferenciarlo del resto y a maximizar beneficios.

Hay tres elementos fundamentales para el funcionamiento de cualquier empresa: personas, lugares de trabajo y sistemas. Si alguna de estas partes deja de estar sincronizada, esa deseada estabilidad puede truncarse y comprometer, por lo pronto, la productividad del negocio. Por eso, para garantizar la operatividad en todo momento, es necesario definir detenidamente cómo este debe reaccionar ante acontecimientos y escenarios inesperados que pueden interrumpir a la gente, a las oficinas o a los sistemas –esto es, un Plan de Continuidad de Negocio.

El Plan de Continuidad de Negocio es un documento vivo, regularmente construido, testeado y, sobretodo, comprendido de forma transversal por todos los stakeholders de una empresa. A modo de síntesis, podríamos establecer siete pasos clave a seguir para construir cualquier Plan de Continuidad de Negocio.

  1. Definir elementos protegidos
  2. Lo primero que uno se debe plantear a la hora de definir un Plan de Continuidad de Negocio es: ¿qué es aquello sin lo cual mi negocio no puede funcionar?

    Los componentes de la lista resultante a esta pregunta son los elementos protegidos de la compañía, y el foco directo del Plan de Continuidad: son aquellos que necesitan una alternativa o una acción concreta en caso de que algo vaya mal.

  3. Revisar los niveles de protección
  4. Hay que establecer a qué nivel de servicio mínimo es necesario llegar cuando un elemento protegido cae, con el fin de mantener la continuidad del negocio.

    Si, por ejemplo, el elemento protegido es tu sede central, que ha quedado inoperativa a causa de una inundación, ¿qué es imprescindible para conseguir que los equipos puedan seguir trabajando: un emplazamiento alternativo totalmente preparado, o simplemente una solución de trabajo remoto para que el staff pueda retomar sus tareas a distancia?

    Y para que los sistemas sigan activos, ¿necesitas simplemente un backup en la nube desde el cuál restaurar archivos clave y bases de datos, o una replicación completa de toda la infraestructura on-premise?

    Además, siguiendo con los sistemas, en este punto es preciso definir un Punto de Recuperación Objetivo –RTO de sus siglas en inglés–, es decir, qué cantidad de pérdida de dato durante un desastre la compañía considera tolerable; y un Tiempo de Recuperación Objetivo o RTO, el tiempo máximo que puede ese desastre mantener el negocio inoperativo.

  5. Identificar los requisitos de protección
  6. Una vez establecido qué se debe proteger y con qué alcance, es preciso definir exactamente qué es necesario para lograr esos niveles de protección, y qué implicación tienen en ello las personas, las sedes y los sistemas relacionados.

    Siguiendo con el ejemplo de la oficina principal inundada. Si, por ejemplo, la necesidad es una segunda oficina, habrá que establecer puntos como: ¿a qué distancia máxima debería estar ubicada la segunda localización? ¿Tendrá que desplazarse allí todo el staff, o solo una parte? ¿A qué sistemas internos deberán tener acceso?

  7. Escenarios de fallo y acciones
  8. Para determinar los requisitos de protección, hay que definir primero qué significa un fallo en cada elemento protegido.

    Cualquier fallo debería ser contemplado en un escenario de fallo, al que se le asocian una serie de acciones. Volviendo al ejemplo de la oficina, cualquier cosa que comprometa la usabilidad del edificio –un fuego o una inundación– debería contemplarse como escenario de fallo. En estos escenarios deben definirse una serie de acciones que serán puestas en marcha para recuperar el nivel de protección necesario (por ejemplo, disponer de una segunda oficina totalmente preparada), que pueden ser tan básicas como llamar el arrendatario de la segunda ubicación para comunicarle la activación del Plan de Continuidad de Negocio.

  9. Roles y responsabilidades
  10. Al planificar las acciones para cada escenario de fallo, es crucial especificar no solo los pasos que deben seguirse, sino también los roles y las responsabilidades de las personas que deberán ejecutar esos pasos. En el caso del ejemplo que hemos utilizado, estos roles podrían ser lo siguientes:
    - Responsable de instalaciones: informa al arrendatario de la oficina secundaria que se activa el Plan de Continuidad de Negocio.
    - Equipo de TI: transporta y configura los equipos y sistemas en la ubicación secundaria para que el staff pueda trabajar.
    - Recursos Humanos: coordina las comunicaciones internas para asegurar que todos los empleados saben qué está ocurriendo y pueden regresar al trabajo lo más rápido posible.

  11. Rollback
  12. Tras producirse un escenario de fallo, el objetivo es devolver al negocio a la operatividad completa. Sin embargo, la necesidad de volver tan rápido como sea posible a un nivel mínimo de operación es a menudo algo más crítico para las compañías.

    Para ello, es necesario contar con un sistema de rollback que permita regresar todos los sistemas y procesos al último punto funcional y recuperar desde allí la operatividad mínima. Este planteamiento es a menudo más eficiente en costes que mantener una réplica completa del modelo operativo principal preparada para ponerse en marcha en caso de fallo, aunque esta última es, evidentemente, la opción con mayores garantías.

  13. Testing
  14. Este es el elemento más crítico de cualquier Plan de Continuidad de Negocio. Es aquí donde se debe demostrar que el plan es comprensible, fiable y efectivo. Normalmente los planes de Continuidad de Negocio se prueban bianualmente, aunque es recomendable realizar tests sobre cada elemento protegido como mínimo una vez al año.

    El concepto Activo/Activo va un paso más allá del Plan de Continuidad de Negocio estándar: se trata de utilizar de forma recurrente los requisitos de protección en paralelo a los elementos protegidos, cada parte a la mitad de capacidad. En el ejemplo que hemos ido comentando, una configuración así consistiría en usar en todo momento una oficina satélite complementaria a la oficina principal, ambas con capacidad para asumir más recursos en caso de fallo de una de ellas.

Contenidos relacionados: