¿Qué es la recuperación ante fallos (DR)?

Recuperación ante desastres

Para entender mejor qué es Disaster Recovery (DR), primero debemos definir el concepto de fallo en términos de continuidad empresarial. Un fallo, en pocas palabras, es cualquier acontecimiento que ponga en riesgo las operaciones de una organización. Puede ser un ciberataque, una filtración de datos, un fallo en un equipo, un desastre natural o incluso ratas mordiendo cables. Desde luego, cualquiera de los siguientes hechos puede producir un fallo informático:

  • Pérdida de datos 
  • Error humano
  • Malware y virus 
  • Redes de trabajo e internet 
  • Fallo de hardware y/o software 
  • Desastres climáticos
  • Inundación natural o por rotura de tuberías
  • Vandalismo o daños en la oficina
Protección de datos y recuperación ante desastres

Cuando se produce un fallo del sistema, el objetivo de cualquier plan de DR es garantizar que las operaciones funcionan con la mayor normalidad posible. Si bien la empresa estará al tanto de la crisis, sus clientes y usuarios finales no deben verse afectados en absoluto.

En términos de TI, la recuperación ante fallos es una estrategia de seguridad de primera línea que protege a un centro de datos de los efectos de una catástrofe natural o artificial. En caso de que esto ocurra, un plan de DR garantiza que una empresa pueda reanudar rápidamente las operaciones o mantener funciones críticas durante o después del fallo. El proceso de recuperación ante fallos debe incluir la planificación y las pruebas y suele implicar un sitio físico independiente para restaurar las operaciones.

Muchas empresas también optan por una estrategia de recuperación ante fallos como servicio (DRaaS), un modelo que permite duplicar y alojar servidores en un centro de datos independiente mediante un proveedor externo. Algunos proveedores de nube ofrecen una solución nativa de DRaaS, la cual simplifica el proceso de instalación. Una vez incorporada, las empresas disfrutan de los beneficios inmediatos de la recuperación ante fallos. Y como este servicio está basado en la nube, es flexible, capaz de adaptarse a las necesidades crecientes o decrecientes del cliente.

Los riesgos de no implementar un plan de recuperación ante fallos

Independientemente del tamaño de una empresa, el departamento de TI constituye una parte esencial de la actividad de la empresa; de hecho, cada vez más es el bote salvavidas del negocio. La protección de sus activos de TI y de las operaciones críticas debe encabezar su lista de prioridades. Una buena solución de DR es mucho más que proteger su hardware; hoy en día, los ataques de software son más comunes, lo cual puede afectar a su(s) sitio(s) web, a su capacidad para cumplir con proyectos y a la realización de otras tareas decisivas para la empresa.
 
Sin una estrategia de recuperación de fallos, una empresa puede enfrentarse a diversos riesgos operacionales, financieros y de reputación. Desde un punto de vista operativo, cuando un fallo impide a una empresa funcionar eficazmente, los empleados no pueden trabajar bien, de modo que sus clientes podrían verse afectados e incluso optar por acudir a los servicios de un competidor.
Los riesgos de no implementar un plan de recuperación ante fallos
Tal vez el riesgo más evidente e inmediato que puede derivar de un fallo es la pérdida masiva de ingresos. Y, aunque casi todos los fallos ocasionan algún tipo de pérdida económica, si el tiempo de respuesta y recuperación es lento, es probable que su empresa pierda mucho más dinero. Y, por desgracia, está aumentando el coste de estas respuestas de recuperación lentas. De hecho, el coste medio del tiempo de inactividad de TI puede ser de hasta 17.000 dólares por minuto. No todas las empresas están suficientemente preparadas para permitirse ese gasto, por lo que muchas no se recuperarán después de haber sufrido un fallo significativo.
 
Por último, las empresas que no pueden recuperarse rápida y eficazmente después de un fallo del sistema corren el riesgo de perder su reputación de empresa segura y digna de confianza. Las buenas empresas saben que sus clientes son el motor que las mantiene, y que una reputación dañada puede obstaculizar las inversiones futuras, alejar a empleados valiosos y, en algunos casos, eliminar cualquier posibilidad de volver al mercado. Esta es una de las razones principales por las que muchos negocios fracasan en su intento de superar un evento así.

Ventajas de implementar la recuperación ante fallos

Garantizar que su empresa tenga implementada una estrategia de recuperación ante fallos sólida y fácil de ejecutar presenta ventajas importantes, aparte de eliminar los riesgos que conllevaría una estrategia deficiente.

RTO y RPO

Establecer una solución de recuperación ante fallos asegura la restauración predecible de sistemas, servicios y aplicaciones. Las métricas de los acuerdos de nivel de servicio (SLA) estándar del sector son el objetivo de tiempo de recuperación (RTO, una medida de cuánto tiempo puede tolerar una empresa un parón de operaciones de negocio) y el objetivo de punto de recuperación (RPO, una medida de cuántos datos pueden permitirse perder).

Limite las pérdidas

Dado que una solución de recuperación ante fallos ayudará a su empresa a recuperarse más rápidamente, podrá minimizar sus pérdidas de ingresos y los costes asociados a los daños causados por un tiempo de inactividad prolongado.

Proteja sus operaciones

No todas las aplicaciones empresariales se crean de la misma manera; por lo tanto, un plan de recuperación ante fallos bien diseñado aplicará los SLA según cada una. Esto garantiza que las aplicaciones críticas para la empresa queden bien protegidas.

Proteja su reputación

Una buena estrategia de DR es un diferenciador competitivo. Si los clientes de una empresa ven la capacidad de recuperación de la misma durante una catástrofe, es probable que aumente su confianza general en la empresa.

Mejoras de rendimiento

La capacidad de disponer de operaciones de conmutación por error de DR en un centro de datos físicamente separado (posiblemente varios centros de datos remotos o proveedores de servicios) significa evitar la degradación del rendimiento debido a fallos localizados.

¿Cómo pueden las empresas establecer un plan de DR o recuperación ante fallos?

No existe un plan universal de recuperación ante fallos que pueda adaptarse a las necesidades concretas de todas las empresas. Y, aunque los siguientes criterios están diseñados para ser pautas que le permitan establecer una estrategia de recuperación, se espera una aplicación personalizada.

Infraestructura de inventario

En primer lugar, es importante disponer de un inventario de su hardware y software al iniciar la elaboración de un plan de DR. A las empresas que operan principalmente con software, esta tarea les resultará más sencilla, ya que no necesitarán tener en cuenta los componentes físicos de su centro de datos. Este proceso incluye recoger la información de contacto del soporte técnico de cada proveedor para todo el hardware y las aplicaciones.

Realizar la evaluación de riesgos

Determine cuánto tiempo de inactividad y pérdida de datos puede permitirse su negocio. Aunque un tiempo de inactividad nulo y una pérdida de datos nula serían lo ideal, no todas las empresas disponen de un sistema de recuperación ante fallos que pueda cumplir ese objetivo. Las empresas que dependen en gran medida de un sistema de TI, como las web de comercio electrónico, no pueden soportar mucho tiempo de inactividad (si es que pueden soportar alguno). Este ejercicio también es una oportunidad importante para determinar un RPO y RTO aceptables para todas sus aplicaciones.

Establecer un plan de comunicación

Un plan de comunicación eficaz mantiene a los empleados informados durante un fallo, lo cual garantiza que comprendan cómo acceder a los sistemas necesarios para continuar con las operaciones de negocio durante un evento de DR. Este plan también incluye una base de operaciones establecida como ubicación durante el fallo.

Establecer SLA

Asegúrese de que los acuerdos de nivel de servicio (SLA) contratados incluyan los fallos. Muchas empresas subcontratan tecnologías a proveedores de servicios o almacenan sus sistemas en un centro de datos o en instalaciones independientes.

Pruebas regulares de recuperación ante fallos

Las empresas deben probar regularmente la disponibilidad de su solución de recuperación ante fallos. Hay que probar incluso los planes de DR más sólidos para satisfacer a los auditores, ya sean internos o externos.

Estudio de casos de recuperación ante fallo

Total Gas & Power recurre a Nutanix para la consolidación de su TI

Empire Life pasa de la computadora central a la web-scale

Regina Catholic School Division elige la infraestructura hiperconvergente de Nutanix

Avon Grove School District

Great Expressions proporciona sonrisas a los pacientes con una atención mejor y más rápida

Recursos relacionados

Guía de prácticas recomendadas: protección de datos y recuperación ante fallos

Guía definitiva para la protección de datos y la recuperación ante fallos

De ratones y hombres y la Madre Naturaleza: preparándose para el desastre

Nutanix Xi Leap: Recuperación ante fallos sin instalación

Introdúzcase en la infraestructura hiperconvergente (HCI)

¡Empecemos!

Programe una demostración personalizada con un consultor de soluciones y descubra cómo Nutanix Enterprise Cloud puede transformar su negocio.