NAKIVO > Blog > Hyper-V

Las 10 funciones principales de Windows Server 2019 Conmutación por clúster de recuperación: Descripción general completa

Actualizado: mayo 6, 2024

Written by: NAKIVO Team

A medida que crece la demanda de rendimiento ininterrumpido, las empresas modernas han comenzado a buscar nuevas formas de garantizar una disponibilidad del 99,999% de sus servicios. La realidad es que la mayoría de las organizaciones no pueden tolerar ni siquiera un tiempo de inactividad mínimo, ya que lo que está en juego con la pérdida de productividad es demasiado alto. Las consecuencias potenciales de un fallo inesperado del sistema pueden incluir la pérdida de ingresos, oportunidades de negocio, productividad y confianza de los clientes. Incluso si consigue recuperarse de repercusiones tan graves, el tiempo de inactividad puede afectar al crecimiento de su empresa y condicionar negativamente el futuro de su organización.

Para mitigar los riesgos del tiempo de inactividad, debe asegurarse de que su empresa pueda seguir prestando sus servicios una vez que el sistema o cualquiera de sus componentes deje de funcionar. El planteamiento definitivo es crear un entorno de alta disponibilidad, lo que puede hacerse garantizando la redundancia de todos los componentes del sistema. Existen varias formas de proporcionar Alta Disponibilidad a su entorno, por ejemplo, con la ayuda de backups de servidores Windows. Otra opción popular es la conmutación por recuperación.

En esta entrada de blog, describiremos cómo funciona la conmutación por recuperación en servidores Windows. Además, analizaremos cómo se han transformado las funciones de conmutación por recuperación con la versión de Windows Server 2019. En particular, proporcionaremos una descripción general de las 10 funciones principales de Windows Server 2019 Failover Clustering.

NAKIVO for Hyper-V Replication

Business continuity in any failure scenario with robust replication for Hyper-V VMs. Verify replicas in seconds and automate VM failover to minimize downtime.

DISCOVER SOLUTION

Aspectos básicos de la conmutación por recuperación de Windows Server

Un clúster de conmutación por recuperación es un grupo de 2 o más servidores (nodos) que trabajan juntos para garantizar que los roles y servicios agrupados permanezcan altamente disponibles y escalables en cualquier circunstancia. Estos nodos agrupados comparten recursos de red y almacenamiento, ya que pueden estar conectados por cables físicos, software o a nivel de aplicación. En caso de fallo de un nodo del clúster, los servicios de los nodos averiados son asumidos por los nodos secundarios. Este proceso se conoce como conmutación por recuperación, que puede ayudar a minimizar la interrupción del servicio, reducir el tiempo de inactividad y responder al fallo del host de forma rápida y eficaz.

Además, es fundamental que pueda controlar el estado de los nodos en cada clúster de conmutación por recuperación. Mediante la herramienta de supervisión interna, puede verificar que todos los nodos del clúster de conmutación por error funcionan y pueden realizar todas las funciones requeridas. De esta forma, puede identificar cualquier nodo no saludable en el clúster y reducir el riesgo de fallo de los nodos del clúster.

Con Windows Server conmutación por recuperación, puede crear varios clústeres de conmutación por recuperación para garantizar una alta disponibilidad de sus aplicaciones y servicios. Para que esta funcionalidad funcione, es necesario disponer de dos servidores (activo y pasivo) que compartan el mismo almacenamiento, así como las redes, además de cumplir unos requisitos de hardware específicos.

Las dos máquinas pueden comunicarse mediante las funciones de latido, que les permiten enviarse señales de latido a través de una red dedicada. Se diferencian dos tipos de señales: latidos de empuje y latidos de tracción. Un latido push se envía de un servidor activo a otro pasivo, mientras que un latido pull se envía de un servidor pasivo a otro activo. Estas señales de comunicación se envían/reciben a intervalos regulares. Así, si un «latido» no llega a un servidor en el momento esperado, se identifica el fallo del servidor y las cargas de trabajo de la máquina que ha fallado son asumidas por el servidor de reserva.

Para saber cómo hacer que su entorno tenga una alta disponibilidad y resiliencia ante fallos del sistema, puede leer nuestra entrada de blog sobre cómo activar la alta disponibilidad de Hyper-V mediante la agrupación en clústeres de conmutación por recuperación. Para obtener una visión más detallada de esta tecnología, puede descargar nuestro eBook que describe cómo implementar un clúster de conmutación por error, qué requisitos deben cumplirse para crear un clúster de conmutación por error y cómo NAKIVO Backup & Replication puede garantizar la protección continua de los clústeres Hyper-V.

Principales funciones nuevas de conmutación por recuperación para Windows Server 2019

Los desarrolladores de Microsoft han trabajado sin descanso en cada una de sus versiones añadiendo nuevas funciones y mejorando las existentes. La versión de Windows Server 2019 no es una excepción. Entre otras muchas mejoras como la integración de nubes híbridas, las capas avanzadas de seguridad o la hiperconvergencia, este sistema operativo también lleva a otro nivel las funciones de conmutación por recuperación. A continuación, puede ver una lista completa de las nuevas funciones de Windows Server 2019 y cómo han transformado la función de conmutación por recuperación.

Migración de clústeres entre dominios

El proceso de migración de clústeres entre dominios solía ser una tarea compleja y lenta. Los nodos y clústeres no podían trasladarse fácilmente entre distintos dominios. Este proceso requería una reconfiguración completa de los clústeres de conmutación por recuperación, lo que provocaba interrupciones no deseadas del servicio y un tiempo de inactividad considerable. Con Windows Server 2019, finalmente puede migrar clústeres de conmutación por recuperación de un dominio de Active Directory a otro. Al garantizar una consolidación de dominios rápida y sencilla, puede ahorrar tiempo, esfuerzo y recursos.

Mejoras en los volúmenes compartidos en clúster

La caché de volumen compartido en clúster (CSV) permite la asignación de la memoria del sistema como caché de escritura, lo que permite el almacenamiento en caché de E/S de sólo lectura sin búfer. Con estas funciones, puede mejorar el rendimiento de las máquinas virtuales Hyper-V, que aprovechan la E/S sin búfer al acceder a los discos duros virtuales. La caché CSV está disponible en Windows Server 2019 de forma predeterminada, lo que garantiza una mejor productividad y un rendimiento más rápido de las máquinas virtuales que se ejecutan en la parte superior de los volúmenes compartidos en clúster. Otras mejoras de CSV incluyen una lógica mejorada para detectar cualquier problema en el clúster, así como su pronta reparación. Estas funciones funcionan gracias a la detección de rutas de la red de clústeres y a los nodos particionados.

Clústeres compatibles con Azure

Windows Server 2019 se diseñó para una integración perfecta de las capacidades híbridas en su centro de datos. Además, los clústeres de conmutación por recuperación de Windows son conscientes de Azure, lo que significa que pueden identificar automáticamente cuándo se están ejecutando dentro de Azure. Como resultado, los clústeres de conmutación por recuperación de Windows pueden optimizarse automáticamente, garantizando una conmutación por error proactiva y el registro de los eventos de mantenimiento planificado de Azure. Para empezar, ya no tendrá que pasar por el mundano proceso de reconfigurar el equilibrador de carga con nombre de red dinámico.

Testigo de recurso compartido USB para quórum

Las funciones de heartbeat mencionadas anteriormente permiten comprobar el estado de cada nodo del clúster. Sin embargo, en caso de fallo inesperado de la red, los nodos del clúster no podrán comunicarse entre sí. Esto da lugar al escenario de cerebro dividido, en el que cada uno de los nodos asume que es la única instancia que funciona en el clúster y comienzan a ejecutarse al mismo tiempo. Desgraciadamente, esto puede causar la corrupción de datos o varios tipos de conflictos de datos.

La tecnología de quórum se ha diseñado para resolver este problema. El clúster obligará a uno de los nodos a dejar de funcionar en función de la mayoría de votos. Sin embargo, si hay un número par de nodos en el clúster (por ejemplo, un clúster de dos nodos), los miembros del clúster podrían no alcanzar el quórum y determinar cuál de los nodos debe seguir funcionando. Como resultado, el clúster deja de funcionar por completo.

Con Windows Server 2019, puede utilizar una unidad USB conectada a un dispositivo de red básico como testigo para el quórum del clúster de conmutación por recuperación. En este caso, el testigo USB también tiene voto y puede proporcionar un voto de calidad para evitar el escenario de cerebro dividido.

Mejora del testigo de recurso compartido para situaciones de quórum

Con la versión de Windows Server 2019, el mecanismo de votación de quórum se ha vuelto aún más tolerante a fallos. El Testigo de recurso compartido actualizado puede beneficiarle en los siguientes casos:

Cuando no se puede acceder a un testigo en la nube debido a una conexión a Internet lenta o ausente.
Cuando no hay unidades compartidas disponibles para un testigo de disco.
Cuando el clúster de conmutación por recuperación se ejecuta en una zona desmilitarizada (DMZ), donde la conexión del controlador de dominio no está disponible.
Cuando se tiene un grupo de trabajo o un clúster de dominio mixto sin un objeto de nombre de clúster de Active Directory (CNO).

En todos estos escenarios, el procedimiento de votación de quórum puede fallar, provocando el cierre del clúster de conmutación por error. Con Windows Server 2019, estos riesgos potenciales se han abordado, lo que le permite utilizar el testigo de recurso compartido de archivos en casi cualquier escenario.

Conjuntos de grupos

Otra de las funciones recién añadidas de Windows Server 2019 son los conjuntos de clústeres. Un conjunto de clústeres implica la agrupación de varios hosts de clúster de conmutación por recuperación de Windows Server (computación, almacenamiento e hiperconvergente) en un conjunto lógico de clústeres. Los conjuntos de clústeres pueden simplificar significativamente la gestión de clústeres de conmutación por recuperación en su infraestructura de varias maneras. De este modo, puede migrar fácilmente máquinas virtuales entre clústeres de conmutación por recuperación que se ejecuten en un único conjunto de clústeres. Además, esta función puede hacer que sus clústeres sean más resistentes a los fallos, ya que ahora puede conmutar por error entre clústeres, garantizando una interrupción mínima del servicio.

Actualización basada en clústeres para Storage Spaces Direct

La función Cluster-Aware Updating se introdujo por primera vez con Windows Server 2012. ¿Qué puede hacer esta función? Con Cluster-Aware Updating, puede actualizar automáticamente los servidores en clúster con la mínima pérdida de disponibilidad. Con la versión de Windows Server 2019, estas funciones se pueden integrar con Storage Spaces Direct (S2D), lo que permite la resincronización automatizada de datos en cada nodo durante el proceso de actualización. Además, Cluster-Aware Updating puede detectar tras qué actualizaciones es necesario reiniciar el sistema. Así, los reinicios se realizarán sólo cuando sea necesario, lo que reducirá significativamente el tiempo de inactividad de la empresa.

Autenticación de clúster de conmutación por recuperación de Windows Server 2019

Los clústeres de conmutación por recuperación también están expuestos a diversas amenazas de seguridad. En versiones anteriores de Windows Server, la autenticación NTLM le pedía que solucionara este problema. Con la versión de Windows Server 2019, el equipo de Microsoft ha mejorado una vez más su enfoque de la seguridad. En lugar de la autenticación NTLM, los nodos del clúster pueden comunicarse entre sí mediante autenticación basada en certificados y Kerberos. De este modo, puede evitar que el tráfico de red se acumule y hacer que los clústeres de conmutación por recuperación sean más resilientes a ataques de seguridad repentinos.

Clústeres de conmutación por recuperación autónomos

Windows Server 2019 refuerza la resiliencia y la disponibilidad de la red de clústeres añadiendo las funciones de autorreparación. Un clúster autorreparable puede comprobar periódicamente el estado de sus nodos y repararlos rápidamente si detecta algún problema. Por ejemplo, si un nodo falla y no puede comunicarse con el resto del clúster, éste detectará automáticamente el problema, intentará reparar el nodo que ha fallado y lo volverá a conectar con el clúster. Esta funcionalidad puede reducir significativamente la sobrecarga de gestión que experimentan los administradores del sistema, además de aumentar las capacidades de alta disponibilidad.

Endurecimiento de los racimos

Otra función de seguridad disponible en Windows Server 2019 es сluster Hardening. Los nodos del clúster pueden comunicarse a través de Server Message Block (SMB) para Cluster Shared Volumes y Storage Spaces Direct utilizando autenticación basada en certificados. Esto permite mayores niveles de seguridad en la comunicación intracluster.

Protección de datos con NAKIVO Backup & Replication

El principal objetivo de los clústeres de conmutación por recuperación es garantizar el máximo nivel de disponibilidad de la infraestructura. Windows conmutación por recuperación puede considerarse, con razón, una tecnología esencial para los centros de datos modernos, de los que se espera una prestación de servicios continua. Con estas funciones, puede evitar tiempos de inactividad imprevistos y mantener el mismo nivel de productividad empresarial en casi cualquier circunstancia.

Sin embargo, sigue siendo necesario crear una estrategia integral de protección de datos capaz de responder a los riesgos de seguridad y evitar que se produzcan posibles catástrofes. NAKIVO Backup & Replication es una solución fiable y asequible que puede garantizar una sólida protección de los datos de varias maneras.

Con la solución de backups NAKIVO, puede hacer backups nativos, basados en imágenes y coherentes con las aplicaciones de VMware, Hyper-V, Nutanix AHV VMs, instancias de AWS EC2 y servidores físicos Windows y Linux.
La función de copia de backups puede añadir un nivel adicional de protección contra la corrupción inesperada de datos, fallos del sistema o desastres. Puede crear copias de backups existentes y enviarlas externamente o a nubes públicas. Además, puede crear una copia duplicada de su repositorio de backups o agilizar todo el proceso de copia de backups.
Ponga sus actividades de protección de datos en piloto automático mediante la protección de datos basada en políticas. Puede crear varias reglas de protección de datos basadas en el nombre de la máquina virtual, el tamaño, la ubicación, la configuración, el estado de energía, la etiqueta o una combinación de estos parámetros. Estas reglas de política pueden escanear periódicamente su infraestructura, identificar las máquinas virtuales que cumplan las reglas establecidas y añadirlas automáticamente a los correspondientes jobs de protección de datos.
Automatice y orqueste el proceso de recuperación ante desastres de principio a fin con los flujos de trabajo de recuperación del entorno. Combinando diversas acciones y condiciones en un algoritmo automatizado, puede crear varios jobs de restauración del entorno para hacer frente a diversos escenarios de desastre. Es más, puede probar y actualizar sus jobs de recuperación del entorno cuando sea necesario sin interrumpir su entorno de producción.
NAKIVO Backup & Replication ofrece múltiples opciones de recuperación, permitiéndole restaurar instantáneamente VMs, ficheros y objetos de aplicaciones directamente desde backups comprimidos y deduplicados. También puede recuperar máquinas virtuales VMware en un entorno Hyper-V y viceversa mediante la recuperación entre plataformas. Es más, NAKIVO Backup & Replication le permite recuperar máquinas físicas a VMware o Hyper-V VMs, permitiéndole recuperar en casi cualquier circunstancia.

1 Year of Free Data Protection: NAKIVO Backup & Replication

Deploy in 2 minutes and protect virtual, cloud, physical and SaaS data. Backup, replication, instant recovery options.

Get the Free Edition

Artículos recomendados