La continuidad de negocio depende considerablemente de la IT. Así que, para estar preparado para cualquier contingencia, es indispensable preparar un plan de Disaster Recovery (DRP), cuanto antes mejor.
Un plan de recuperación ante desastres permite a las empresas recuperar los datos y aplicaciones de misión crítica en el menor tiempo posible. Por lo tanto, es esencial adaptarlo a las necesidades concretas de cada proyecto.
¡Pero empecemos por el principio!
Antes de entrar en detalles sobre cómo preparar un plan de Disaster Recovery, vamos a empezar por definir qué es.
¿Qué es un plan de recuperación ante desastres?
Un plan de Disaster Recovery o plan de recuperación ante desastres es un método para recuperar datos y funcionalidades cuando un desastre —ya sea natural o provocado por un error humano— interrumpe un sistema. Es un plan de contingencia que recopila el protocolo de acción y las metodologías que deben utilizarse cuando uno o más sistemas IT de una empresa fallen.
El objetivo principal de un DRP es minimizar el impacto de una interrupción, consiguiendo que las aplicaciones de misión crítica vuelvan a funcionar en el menor tiempo posible. Lo cual permite a la organización y sus trabajadores volver a operar, con casi total normalidad, hasta que el incidente se haya solucionado definitivamente.
Modalidades principales de Disaster Recovery
- Disaster Recovery a nivel de hipervisor.
- Disaster Recovery a nivel de almacenamiento.
- Disaster Recovery a nivel de aplicaciones.
¿Por qué es imprescindible disponer de un plan de Disaster Recovery?
¡Empecemos con una comparación!
¿Por qué aseguramos una casa o un coche? Efectivamente, porque queremos estar protegidos ante cualquier accidente o desastre. Esta misma razón se aplica a los sistemas IT de una empresa.
Un plan de recuperación ante desastres es esencial para proteger los datos y funcionalidades de un negocio ante cualquier contingencia que pueda producirse.
Si los datos e IT de un negocio son críticos para su continuidad, una interrupción en los sistemas informáticos puede tener un impacto altamente negativo si no se está preparado para actuar correctamente. De modo que un plan de Disaster Recovery permite reducir el tiempo de interrupción y proteger los datos críticos del negocio; y como consecuencia, minimizar el impacto de la contingencia.
¿Ante qué protege un plan de Disaster Recovery?
Un plan de recuperación ante desastres permite proteger a cualquier negocio frente a escenarios como:
- Errores humanos
- Apagones energéticos
- Fallos del sistema
- Actualizaciones defectuosas
- Desastres naturales como inundaciones o terremotos
- Incendios en centros de datos
- Robos
- Ciberataques, virus y otras corrupciones (ransomware, por ejemplo)
En resumen, cualquier circunstancia que pueda afectar negativamente a los procedimientos tecnológicos que son críticos para el negocio y sus beneficios.
Cómo preparar un plan de Disaster Recovery
El cloud ha hecho que la recuperación ante desastres o Disaster Recovery sea accesible para negocios de cualquier tamaño. Tradicionalmente, crear un plan de recuperación ante desastres era caro y requería mucho tiempo; porque las empresas tenían que configurar y mantener un sitio secundario en el que replicar su infraestructura —un sitio que, además, estaría infrautilizado la mayor parte del tiempo—.
Hoy en día, gracias a las soluciones de cloud hosting, diseñar una estrategía de Disaster Recovery es mucho más fácil, eficiente y económico.
Sin embargo, no hay una solución que sirva para todo el mundo. El plan de Disaster Recovery perfecto es uno que esté cuidadosamente personalizado según las necesidades de cada empresa. Así que, aunque no podemos proporcionar una respuesta universal en un artículo, queremos compartir los elementos clave en los que poner el foco para preparar un plan de recuperación ante desastres de una empresa.
Enumerar y priorizar los recursos
Haz una lista de los recursos de software y hardware y ordénalos según su impacto en el negocio. Esto es muy importante porque no será posible recuperar todo al mismo tiempo. De modo que una buena planificación permitirá garantizar que las aplicaciones y datos más críticos se recuperen primero.
Evaluar el impacto y los riesgos
Analiza los potenciales desastres a los que el negocio se podría enfrentar y su impacto. El análisis del impacto y los riesgos es de gran ayuda para evaluar cuál es el nivel de seguridad de los datos y aplicaciones críticas. Lo cual ayuda a definir la estrategia de continuidad del negocio/disaster recovery (BCDR, «business continuity/disaster recovery»).
Definir los objetivos del DRP
¿Cuál es el tiempo límite de interrupción admisible para el negocio?
¿Cuántos datos se puede permitir perder la empresa?
¿Qué nivel de degradación en el servicio estamos dispuestos a soportar?
¿Qué impacto podría tener una contingencia en la continuidad del negocio?
Definir los objetivos y expectativas correctamente es esencial para elaborar un plan de contingencia y la arquitectura de la solución de Disaster Recovery. El RTO y RPO son los dos indicadores más relevantes de cualquier plan de recuperación ante desastres.
RTO: objetivo de tiempo de recuperación
Por un lado, el objetivo de tiempo de recuperación o RTO (Recovery Time Objetive, en inglés) es el tiempo máximo durante el cual es aceptable que se interrumpa la actividad empresarial. Es decir, el tiempo que podemos soportar que dure una interrupción antes de que empiece a perturbar la actividad normal del negocio.
RPO: objetivo de punto de recuperación
Por otro lado, el objetivo de punto de recuperación o RPO (Recovery Point Objetive, en inglés) es el punto previo en el tiempo al que podemos permitirnos volver para recuperar los datos y funcionalidades de la empresa. Es decir, representa la cantidad de datos que la empresa está dispuesta a perder entre la última copia de seguridad y una contingencia.
Nuestro equipo ayuda a cada cliente a conseguir un RPO adaptado a las necesidades de su proyecto.
Optimizar el consumo de recursos
Los costes de un plan de Disaster Recovery aumentan al mismo ritmo que disminuye su tolerancia. Por eso es muy importante analizar las necesidades concretas de cada empresa, para poder optimizar el ratio precio-eficiencia del plan de Disaster Recovery.
Como comentamos más arriba, algunos datos y aplicaciones pueden soportar interrupciones más prolongadas que otros, según lo críticos que sean para el negocio.
Una arquitectura de copias de seguridad moderna y una automatización controlada también pueden ayudar a aumentar la eficiencia y a optimizar los costes del plan de Disaster Recovery. La automatización controlada y las arquitecturas de backup modernas, entre otras características, reducen el consumo de recursos y garantizan un coste mensual predecible.
Asimismo, para calcular el retorno sobre la inversión (RSI o ROI, del inglés «return on investment») real del plan de recuperación ante desastres, es importante comparar el coste del DR con las pérdidas del negocio estimadas que podría acarrear un desastre.
Elegir la tecnología adecuada
Siempre que sea posible, es recomendable utilizar las funcionalidades nativas para Disaster Recovery del hipervisor, ya que facilita mucho el proceso.
Garantizar que el Disaster Recovery sea autosuficiente
Elegir una solución de Disaster Recovery adecuada para cada negocio también es importante.
Una solución de Disaster Recovery debe ser completamente independiente de la plataforma principal del negocio. Por ejemplo, contar con una infraestructura remota e independiente reservada para Disaster Recovery (también conocida como cold spare), puede ser realmente útil para restaurar backups y réplicas tan pronto como sea posible durante un fallo de hardware, un ciberataque o cualquier otra emergencia.
Georeplicar siempre que sea posible
No hay que pasar por alto la georeplicación, ya que proporciona una capa adicional de seguridad frente a la corrupción y pérdida de datos.
Los backups y la replicación de datos geográficamente distribuidos son esenciales para la continuidad del negocio, tanto on-premise como en la nube. Así que es necesario asegurarse de que los datos empresariales cuentan con copias de seguridad adecuadas. Ya sea asumiendo de forma proactiva la responsabilidad de realizarlas o contando con sistemas de almacenamiento completamente georeplicados que garanticen la durabilidad de los datos.
Definir un protocolo de acción
Es importante definir cuidadosamente un claro protocolo de acción en el que se especifique quién es responsable de qué y cuáles son las razones para aplicar el plan de recuperación ante desastres. Además, es recomendable crear una lista de contactos de emergencia con aquellos a los que podría ser necesario contactar durante una recuperación. Por ejemplo: el proveedor de servicio de Internet o el proveedor de servicios gestionados.
Crear un equipo de Disaster Recovery
Junto con el protocolo de acción, también es importante componer un equipo de Disaster Recovery con roles y responsabilidades bien definidos. De este modo, ante una contingencia, cada miembro del equipo sabrá qué hacer, cómo y cuándo.
Establecer una estrategia de comunicación efectiva
Asimismo, para mantener a los trabajadores, proveedores, partners y clientes bien informados, también hay que establecer una estrategia de comunicación.
Definir protocolos y canales de comunicación claros es crítico. Habilita un modo sencillo de informar a todas las partes interesadas del impacto de una interrupción en el servicio y de las medidas adoptadas para recuperarlo.
Probar el plan de contingencia periódicamente
Subestimar la importancia de probar el DR puede impedir la restauración efectiva de los servicios en caso de incidente. Así que, probar el plan de Disaster Recovery de forma periódica (una vez cada dos meses, por ejemplo) es imprescindible para comprobar que todos los procedimientos funcionan correctamente. Por no hablar de mantener el DRP actualizado.
Los tests periódicos son clave para validar que los mecanismos implementados funcionan como está previsto y que los objetivos de recuperación se pueden alcanzar con éxito. En lugar de simplemente darlo por sentado.
Disaster Recovery en la nube
Por último, pero no menos importante, no hay que olvidarse de la importancia de planificar la recuperación ante desastres en la nube. Ya que el hecho de migrar una infraestructura y cargas de trabajo al cloud no tiene por qué garantizar la continuidad del negocio por defecto.
Al estar basada en un modelo de responsabilidad compartida, tanto el proveedor de servicios en la nube como la empresa deben ocuparse de la continuidad del negocio y el disaster recovery. Mientras que los proveedores de servicio son responsables de garantizar que su infraestructura, almacenamiento y redes son completamente seguras, las empresas siguen siendo responsables de otros aspectos de seguridad, gobernanza y DR, como la durabilidad de los datos, la gestión de accesos o la protección del tráfico de red.
No dudes en contactarnos para saber más sobre cómo nuestro equipo de expertos en cloud puede ayudarte a definir un plan de recuperación ante desastres.