Elegir una solución de Disaster Recovery (o recuperación ante desastres) en lugar de otra es una decisión importante para cualquier empresa, teniendo en cuenta el fuerte impacto que un ataque o desastre puede tener en los beneficios de un negocio.
A medida que cada vez más organizaciones y servicios se digitalizan, y que el número de ciberataques a nivel mundial sigue creciendo, la planificación de la recuperación ante desastres se ha convertido en algo indispensable para garantizar la continuidad del negocio. Así que, entre tantas soluciones de DR, es útil tener algunos aspectos clave en mente para decantarse por la más adecuada para cada negocio.
Pero lo primero es lo primero.
¿Por qué es importante contar con una solución de DR?
El aumento del número de desastres y ciberataques, así como la aceleración de los procesos de transformación digital entre las organizaciones ha puesto el foco en las soluciones de Disaster Recovery, ya que son esenciales para garantizar las operaciones de negocio normales en todo momento independientemente de que un incidente o ataque pueda afectar al sitio principal de la empresa. Sin embargo, la mayoría de las organizaciones suelen prestarle atención cuando ya es demasiado tarde.
Las siguientes cifras subrayan la importancia de las soluciones de DR. Los ciberataques a redes corporativas por semana aumentaron un 38 % a nivel global en 2022, en comparación con 2021 —según datos de Check Point Research—. Además, si nos fijamos en los datos a nivel regional, Norteamérica, Latinoamérica y Europa fueron las regiones que experimentaron el mayor aumento en 2022 —+52 %, +29 % y +26 % respectivamente—.
Aspectos clave a tener en cuenta al elegir una solución de Disaster Recovery
Elegir una solución de Disaster Recovery adaptada a las necesidades del negocio, es esencial para construir una estrategia de DR. Aquí van algunos aspectos importantes a tener en cuenta para que sea un éxito.
Sitio de recuperación
Empecemos por algo tan simple como contar con un sitio en el que recuperar servicios en caso de incidente. Es decir, un entorno o centro de datos secundario en el que mantener las operaciones en marcha en caso de fallo.
Al elegir un sitio de recuperación ante desastres, las organizaciones suelen tener que decidir entre optar por un sitio caliente, un sitio templado o un sitio frío, según sus objetivos de recuperación, presupuesto, etc.
Cold sites o sitios fríos
En primer lugar, un cold site consiste en un espacio alquilado en el que poder restaurar las operaciones en caso de desastre en el entorno principal de la empresa. Sin embargo, esta opción no incluye ni hardware ni software.
La configuración de los sitios fríos para restaurar las operaciones desde el entorno productivo al de respaldo conlleva más tiempo. No solo es necesario restaurar los backups sino que también hay que instalar hardware. De modo que también requiere de más personal técnico disponible para poner en funcionamiento la infraestructura en caso de emergencia.
Esta es la opción más barata pero también la más limitada de las tres, ya que su puesta en marcha podría llevar días o incluso semanas. Puede ser una opción básica de DR para empresas que mantengan su entorno de TI on-premise y deseen contar con una solución de Disaster Recovery en remoto a modo de housing.
Warm sites o sitios templados
En segundo lugar, un warm site consiste en tener un entorno de respaldo disponible y configurado en el que conmutar las aplicaciones y sistemas en caso de fallo en el CPD principal. Por lo tanto, es una solución intermedia entre un cold site y un hot site. Este entorno de respaldo preconfigurado puede estar tanto encendido como apagado.
En este caso, sigue siendo necesario restaurar los backups y réplicas en la infraestructura reservada para Disaster Recovery. Sin embargo, requiere de menos personal técnico para hacerlo.
Los sitios templados ofrecen un equilibrio entre tolerancia y costes razonables. Además, los negocios pueden mejorar aún más sus objetivos de recuperación combinándolos con snapshots de almacenamiento georeplicado automáticamente.
Hot sites o sitios calientes
Por último, un hot site es una copia del entorno productivo en una infraestructura diferente y que funciona de forma simultánea. Esta opción proporciona el mayor grado de alta disponibilidad y tolerancia a fallos, ya que los sistemas están replicados para que el entorno de respaldo empiece a funcionar sin interrupciones en caso de fallo en el sistema principal. Esta configuración también se conoce como «clúster activo-activo».
Esta es la opción óptima para la continuidad del negocio pero también la más costosa, porque requiere de redundancia completa en el hardware y el software. Por el contrario, cuando los sistemas conmutan por error al datacenter de recuperación, solo es necesario verificar que todo funciona correctamente.
Los sitios calientes son ideales para aplicaciones de misión crítica que no permiten ningún tiempo de inactividad para recuperar datos. Son especialmente recomendables para aquellas compañías que necesiten un RTO por debajo de 1 hora.
En resumen, en lo que concierne a los sitios de recuperación, los costes son inversamente proporcionales a la tolerancia. A medida que la tolerancia disminuye, los costes aumentan. De modo que la mejor opción para cada empresa dependerá de la evaluación de riesgos y objetivos definidos en su plan de Disaster Recovery.
Cold site | Warm site | Hot site |
Entorno activo en la infraestructura principal y espacio reservado en una infraestructura secundaria. | Entorno activo en la infraestructura principal y entorno de respaldo preconfigurado en una infraestructura secundaria. | Entorno activo en la infraestructura principal y entorno de respaldo preconfigurado encendido en una infraestructura secundaria, con datos sincronizados. |
Coste bajo | Coste medio | Coste alto |
RTO alto | RTO medio | RTO bajo |
Georedundancia
Asimismo, a la hora de elegir la solución más adecuada en cuanto al sitio de recuperación, la georedundancia es otro aspecto clave a tener en cuenta para mejorar la disponibilidad, la resiliencia y la tolerancia a fallos. Optar por un entorno de respaldo remoto, en un datacenter cruzado, mejora considerablemente el RTO en caso de contingencia grave en el datacenter principal.
Contar con centros de datos distribuidos geográficamente contribuye a construir una estrategia de continuidad del negocio más sólida. Ya que proporciona protección adicional frente a desastres que afecten al centro de datos principal.
Asimismo, en lo que respecta a las soluciones de DR a nivel de almacenamiento, la redundancia geográfica tampoco debe pasarse por alto. Tener backups en una ubicación remota es recomendable para evitar perder datos y mejorar el RPO del negocio. La georeplicación de datos proporciona una capa extra de seguridad. Por eso los volúmenes de almacenamiento en red de Stackscale —Flash Premium, Hybrid Plus y Hybrid— se georeplican por defecto en un datacenter diferente.
Replicación síncrona o asíncrona
Según los requisitos del negocio, otro aspecto a considerar al elegir una solución de Disaster Recovery es la necesidad de replicar los datos de forma síncrona o asíncrona a una ubicación remota.
Por un lado, la replicación síncrona escribe los datos de forma simultánea en el almacenamiento principal y en la réplica. Es decir, la replicación tiene lugar en tiempo real y, por lo tanto, el RPO es igual a 0. Esta configuración permite disponer de failover a la solución de Disaster Recovery con prácticamente ningún tiempo de inactividad. Por eso se usa principalmente para aplicaciones transaccionales de gama alta que requieren una tolerancia a fallos instantánea.
Es más cara que la replicación asíncrona porque requiere mayor ancho de banda e incluso hardware especializado.
Por otro lado, la replicación asíncrona escribe los datos en la réplica en base a una programación; por ejemplo, cada hora, cada 6 horas o diaria. Por lo tanto, aunque puede hacerse casi en tiempo real, no es simultáneo. Esta configuración está diseñada especialmente para funcionar en largas distancias, ya que puede tolerar cierta degradación en la conectividad. Se suele usar para copias de seguridad y snapshots de datos, y en máquinas virtuales.
No suele necesitar hardware especializado y requiere considerablemente menos ancho de banda. Así que su coste es menor que el de la replicación síncrona. No obstante, existe el riesgo de pérdida de datos entre la última réplica programada y un posible incidente.
Escalabilidad
También es sensato pensar en la escalabilidad para garantizar que la solución de Disaster Recovery de la empresa pueda crecer junto con las necesidades del negocio. Las organizaciones nunca deberían encontrarse en la posición de elegir entre qué datos pueden respaldar y cuáles no, por cuestiones de capacidad.
En Stackscale ayudamos a las empresas a elegir una solución de Disaster Recovery adaptada a sus objetivos y necesidades. No dudes en contactar con nuestro equipo para más información.