Explicación de la política de retención de backups de GFS

Idealmente, el objetivo de hacer backups es la capacidad de recuperar datos desde cualquier punto atrás en el tiempo. La forma más sencilla de hacerlo es hacer backups periódicos, normalmente diarios. Sin embargo, incluso con técnicas de ahorro de espacio como los backups incrementales permanentes, los backups sintéticos, la compresión de datos y la deduplicación, este enfoque requiere capacidades de almacenamiento ilimitadas, y casi ninguna empresa puede permitírselo. Por eso existe la política de retención de backups, o el esquema de rotación de backups.

¿Qué es la política de retención de backups de GFS?

La política de retención de backups GFS (Abuelo-Padre-Hijo) persigue dos objetivos: la minimización del espacio de almacenamiento y la maximización de los puntos de recuperación. En pocas palabras, nuestra tarea consiste en obtener el mayor número de puntos de recuperación utilizando el menor espacio de almacenamiento.

Hay algunos esquemas de rotación de backups con diferente complejidad y diferente eficiencia. El más sencillo es el «primero en entrar, primero en salir» (FIFO). Es sencillo: cuando el soporte de backups se queda sin espacio, se borra el backup más antiguo y se escribe el nuevo en su lugar. El mérito del FIFO es su simplicidad, y su mayor inconveniente son sus límites espaciales, por lo que con el FIFO se puede almacenar un número finito de backups. Dependiendo de la frecuencia con la que hagas backups de tus máquinas virtuales y de lo grande que sea tu repositorio de backups, puedes cubrir con backups un intervalo de tiempo relativamente pequeño. Sin embargo, este intervalo de tiempo está cubierto en su totalidad.

¿Necesitan todas las empresas una cobertura de backups tan literal? Por supuesto, hay algunas, como las instituciones financieras o gubernamentales, en las que incluso una pequeña pérdida de datos puede resultar extremadamente costosa. A nadie le gustaría que su cuenta bancaria o su seguridad social quedaran anuladas por un fallo de hardware en el centro de datos. Por eso estas organizaciones gastan mucho dinero en backups de almacenamiento, archivos de cinta, etc.

Sin embargo, la mayoría de las empresas no son tan extremadamente sensibles a la pérdida de datos, por lo que pueden aplicar un esquema de rotación de backups que no implique el almacenamiento de backups diarios durante un año. Esta política de conservación de backups permite encontrar un equilibrio sensato entre la recuperabilidad de los datos y los costes invertidos en la infraestructura de backups. Uno de los más utilizados es el esquema de rotación Abuelo-Padre-Hijo (GFS).

¿Cómo funciona el esquema de backups de GFS?

Como en una familia humana, un hijo es el más joven, un padre es mayor y un abuelo es el más viejo. En el mundo de los backups, un hijo es el backup más reciente de un momento dado, y un abuelo es el más lejano. Normalmente, un hijo hace backups diarios, un padre semanales y un abuelo mensuales. Sin embargo, puedes añadir más «parientes» intermedios, como backups cada hora, cada trimestre o cada año. Por ejemplo, macOS de Apple tiene una utilidad de backup integrada Time Machine que utiliza un esquema de rotación GFS, y un hijo es un backup del sistema operativo cada hora, y un abuelo es uno mensual.

Política de conservación de GFS

El esquema clásico de GFS implica backups diarios como «hijos», semanales como «padres» y mensuales como «abuelos». El backup completo inicial realizado el lunes se convierte en el primer «padre», y los siguientes backups diarios incrementales son «hijos». El último backup de la semana se convierte en el siguiente «padre».

Los «hijos» se rotan según el esquema de rotación FIFO, de modo que el «hijo» más antiguo se sustituye por el nuevo backup incremental, y el ciclo se repite. El último backup del mes se convierte en un «abuelo». Después, los «padres» empiezan a rotar según el esquema FIFO.

En la siguiente figura, puedes ver qué backups están disponibles a finales de junio si empezamos a hacer backups de una máquina virtual en abril: los elementos azules representan los backups disponibles y los grises los que no lo están.

GFS: Backups disponibles

Una de las desventajas del esquema GFS es que los backups más antiguos son menos granulares. Por ejemplo, si creaste un archivo, digamos, el lunes de la segunda semana de junio, y lo borraste al día siguiente, se perderá irremediablemente.

Conclusión

Dependiendo de la política de protección de datos de su organización, puede añadir backups cada hora, cada trimestre o cada año al esquema de rotación de GFS. Con otras técnicas de ahorro de espacio como los backups incrementales permanentes, los backups sintéticos y la compresión y deduplicación de repositorios de backup, proporciona una protección de datos razonable sin gastar toneladas de dinero en infraestructuras de almacenamiento de backups.

1 Year of Free Data Protection: NAKIVO Backup & Replication

1 Year of Free Data Protection: NAKIVO Backup & Replication

Deploy in 2 minutes and protect virtual, cloud, physical and SaaS data. Backup, replication, instant recovery options.

Artículos recomendados