¿Cuales son las consideraciones que debo tener a la hora de hacer respaldos?

Hace unos días tuve la oportunidad de dar una ponencia en un evento y les comparto en un formato, un tanto diferente, de los que hablé en ese evento.

A principios de enero de este año, un hospital pago $55.000 para poder rescatar la los sistemas y la información de los pacientes para poder operar nuevamente, lo que más me generó interés de esta noticia fue que Steve Long, CEO de ese hospital, dijo

“Los archivos afectados fueron respaldados y podrían haberse recuperado, pero restaurarlos llevaría días -quizás incluso semanas- y sería costoso».

Entonces mi pregunta es ¿para qué diablos se tienen respaldos si no se usan? un patrón que he visto repetirse en varias organizaciones, es que en el momento de una crisis donde se vió envuelta pérdida de datos, se busca tomar miles de acciones, cualquier acción menos restaurar los datos (sin hablar del centro alterno, que es materia para otro artículo), porque la respuesta es similar a la que dice nuestro amigo Steve, vamos a tardar más restaurando que tomar cualquier otra acción.

Nuestro sobrestimado amigo el respaldo.

No quiero caer en batalla con los puristas y empencen a querer lincharme, pero, tenemos en muy alta estima a los respaldos, usualmente escuchas a alguien decir «nosotros estamos bien, tenemos eso respaldado» ¿de verdad estás bien? desafortunadamente uno lo termina sabiendo muy tarde (que es cuando los necesitamos).

Haciendo un repaso fugaz de lo que son los respaldos, podemos decir que son de tres tipos:

  • Respaldos completos: como su propio nombre indica, este tipo de respaldo copia la totalidad de los datos en otro juego de soportes. La ventaja principal de la realización de un backup completo en cada operación es que se dispone de la totalidad de los datos en un único juego de soportes.
  • Respaldos incrementales: sólo copia los datos que han variado desde la última operación de backup de cualquier tipo. La ventaja de un respaldo incremental es que copia una menor cantidad de datos que un respaldo completo. Por ello, esas operaciones se realizan más deprisa y exigen menos espacio para almacenar el respaldo.
  • Respaldos diferenciales: es similar a un respaldo incremental la primera vez que se lleva a cabo, pues copiará todos los datos que hayan cambiado desde el respaldo completo anterior. Sin embargo, cada vez que se vuelva a ejecutar, seguirá copiando todos los datos que hayan cambiado desde el anterior completo. Por lo tanto, en las operaciones subsiguientes almacenará más datos que un respaldo incremental, aunque normalmente muchos menos que un respaldo completo.

A partir de estos tres tipos de backup principales, se puede definir una estrategia propia para la protección de datos. Normalmente se utiliza uno de los enfoques siguientes:

  • Completo diario
  • Completo semanal + Diferencial diario
  • Completo semanal + Incremental diario
  • Completo mensual + Incremental semanal + Direrencial diario

En la elección de la estrategia de backup óptima hay que sopesar numerosas consideraciones. Normalmente, cada alternativa y opción estratégica tiene sus ventajas e inconvenientes en términos de rendimiento, niveles de protección de los datos, cantidad total de datos conservados y costo.

Las consideraciones olvidadas del respaldo

Como estuvimos viendo hace unas líneas y como seguramente habrás escuchado por otros lados, normalmente, se habla de respaldo completo, diferencial e incremental, sin embargo hay dos consideraciones que usualmente se olvidan y son:

  • Medio o soporte de almacenamiento: no es igual almacenar en una cinta que almacenar en un HDD de 7.200 rpm, o que en un disco HDD de 5.000 rpm, un SDD; o en un volumen dentro de la misma NAS. Cada uno de estos medios tienen sus ventajas y desventajas. Pero, para mi un factor a tener muy en cuenta es el tiempo que tarda en copiarse en cada uno de estos soportes.
  • Medio de transmisión: Al igual que nuestro amigo anterior, el medio de trasmisión es muy importante por el factor tiempo, no es igual conectar un soporte de respaldo por USB 1.0, USB 3.0, Firewire, Thunderbold, UTP (de 100Mbits o 1Gbits) o por fibra; porque como sabrán los más entendidos (y los no tanto también) la velocidad con que se transmite la información es vital para determinar el tiempo de respaldo y restauración.

A lo largo de las historia y algunas «buenas practicas» que se tienen implementada, desafortunadamente, solo estamos pendientes de hacer los respaldos, sea como sea y muy pocas veces no sentamos a pensar, meditar y reflexionar de cual es la forma ideal de hacer los respaldos y muchos menos queremos concientizar de lo verdaderamente importante, la restauración; porque como vimos a lo largo de este artículo, cada medida, cada estrategia que se plantee para los respaldos serán clave para poder tener una restauración en el tiempo esperado.

Pero ¿cual es el tiempo esperado?

En el siguiente artículo, veremos que se debe hacer para dar con el tiempo esperado de restauración y así terminar de cubrir todo de los que hablé en es conferencia.

Puedes seguirme en Twitter o en LinkedIn, donde comparto mis proyectos, experiencias y próximos eventos en los que estaré participando.

Gracias por leerme y hasta la próxima.