Alta disponibilidad con LinuxHA

CDA 2022/23

1 Descripción

Ejemplo de cluster de alta disponibilidad en modo activo-pasivo utilizando LinuxHA.

Gestión de los nodos del cluster con Corosync
Gestión de los recursos (servicios) del cluster con Pacemaker

Recursos complementarios

WEB LinuxHA: http://www.linux-ha.org/
Alternativas de configuración: http://clusterlabs.org/wiki/ClusterTypes
Manuales Corosync: http://corosync.github.io/corosync/
Manuales Pacemaker: http://clusterlabs.org/wiki/Main_Page

2 Entorno de prácticas

2.1 Software de virtualización VIRTUALBOX

En estas prácticas se empleará el software de virtualización VIRTUALBOX para simular los equipos GNU/Linux sobre los que se realizarán las pruebas.

Página principal: http://virtualbox.org
Más información: http://es.wikipedia.org/wiki/Virtualbox

2.2 Imágenes a utilizar

Scripts de instalación
- para GNU/Linux: ejercicio-linuxha.sh
  alumno@pc: $ sh ejercicio-linuxha.sh
- para MS windows: ejercicio-linuxha.ps1
  Powershell.exe -executionpolicy bypass -file ejercicio-linuxha.ps1
Notas:
- Se pedirá un identificador (sin espacios) para poder reutilizar las versiones personalizadas de las imágenes creadas (usad por ejemplo el nombre del grupo de prácticas o el login LDAP)
- En ambos scripts la variable $DIR_BASE especifica donde se descargarán las imágenes y se crearán las MVs.
  Por defecto en GNU/Linux será en $HOME/CDA2223 y en Windows en C:/CDA2223.
  Puede modificarse antes de lanzar los scripts para hacer la instalación en otro directorio más conveniente (disco externo, etc)
- Es posible descargar las imágenes comprimidas manualmente (o intercambiarlas con USB), basta descargar los archivos con extensión .vdi.zip de http://ccia.esei.uvigo.es/docencia/CDA/2223/practicas/ y copiarlos en el directorio anterior ($DIR_BASE) para que el script haga el resto.
- Si no lo hacen desde el script anterior, se pueden arrancar las instancias VIRTUALBOX desde el interfaz gráfico de VirtualBOX o desde la línea de comandos con VBoxManage startvm <nombre MV>_<id>
Imágenes descargadas
- base_cda.vdi (1,3 GB comprimida, 4,5 GB descomprimida): Imagen genérica (común a todas las MVs) que contiene las herramientas a utilizar
  Contiene un sistema Debian 11 con herramientas gráficas y un entorno gráfico ligero LXDE (Lighweight X11 Desktop Environment) [LXDE].
- swap1GB.vdi: Disco de 1 GB formateado como espacio de intercambio (SWAP)
Usuarios configurados e inicio en el sistema
- Usuarios disponibles
  
  login password
  
  root purple
  
  usuario usuario
  
  (con permisos para sudo)
- Acceso al entorno gráfico una vez logueado (necesario para poder copiar y pegar desde/hacia el anfitrión)
```
	root@datos:~# startx
```
- Habilitar copiar y pegar desde/hacia el anfitrión en el menú Dispositivos -> Portapapeles compartido -> bidireccional de la ventana de la máquina virtual.

login	password
root	purple
usuario	usuario
(con permisos para `sudo`)

2.3 Máquinas virtuales y redes creadas

Máquinas virtuales
- cliente (193.147.87.33)
- servidor1 (10.10.10.11)
- servidor2 (10.10.10.22)
Red externa (193.147.87.0 ... 193.147.87.255): máquina cliente (enp0s3) + interfaz enp0s3 de servidor1 y servidor2
Red heartbeat (10.10.10.0 ... 10.10.10.255): máquina servidor1 (enp0s8) + máquina servidor2 (enp0s8)

3 Clusters Linux-HA

Linux-HA (High-Availability Linux) ofrece una colección de herramientas para desplegar cluster de alta disponibilidad en GNU/Linux, FreeBSD y otros entornos UNIX-like.

Detalles en https://clusterlabs.org/

Gestor de nodos: componente responsable de monitorizar y gestionar los nodos que forman parte del cluster HA

En Linux-HA se usa el proyecto Corosync (reemplazo del antiguo proyecto Heartbeat), que hace uso del protocolo Totem (Totem Single Ring Ordering and Membership) para la comunicación sobre la red heartbeat
Web: http://corosync.github.io/corosync/
Toma la forma de un ”demonio” en ejecución en todos los nodos del cluster, responsable de monitorizar y gestionar la red heartbeat (red de pulsos) dedicada a la comunicación entre los nodos del cluster
- El ”demonio” Corosync envía sobre la ”red heartbeat” los ”pulsos” que notifican el estado del nodo donde se está ejecutando.
  - En Corosync esos ”pulsos” se envíam sobre UDP como mensajes autenticados (y opcionalmente cifrados) mediante una clave secreta exclusiva de los nodos pertenecientes al cluster
- Periodicamente, el gestor de nodos inspecciona los ”pulsos” transmitidos por los demás nodos del cluster HA para llevar control de los nodos pertenecientes al cluster HA y detectar los nodos que dejan de latir.
- En Corosync la comunicación sobre la red de pulsos puede configurarse:
  - en modo multicast/broadcast, enviando los pulsos a las direcciones de red de multicast/broadcast de modo que cualquier nodo con acceso a la red heartbeat y que disponga de las claves secretas de autenticación para emitir pulso válidos se considera miembro del cluster (pertenencia ”automática”)
  - en modo ”directo”, enumerando explícitamente en el fichero de configuración las direcciones de los nodos pertenientes al cluster de modo que los mensajes con los ”pulsos” se envían directamente a las direcciones IP de los demás nodos

Gestor de recursos: componente responsable de asignar ”recursos” a los nodos del cluster HA

Los ”recursos” son los elementos que el cluster HA hace disponibles (servidores, direcciones IP, dispositivos de bloque, etc)
En Linux-HA se usa el proyecto Pacemaker (que se ejecuta como ”demonio” en cada uno de los nodos del cluster)
Web: https://clusterlabs.org/pacemaker/
- Los demonios Pacemaker de los nodos del cluster mantienen sincronizada la configuración (fichero CIB, Cluster Information Base) usando la red heartbeat para notificar los cambios
- Estos demonios Pacemaker deciden de forma coordinada y en función de la configuración del CIB la asignación de los ”recusos” gestionados a los nodos del cluster.
- Adicionalmente, Pacemaker gestiona los fallos de los nodos del cluster, mediante mecanismos de Quorum y scripts STONITH.

Resource agents: colección de scripts shell responsables de controlar los ”recursos” gestionados por el cluster HA

Pacemaker soporta distintos tipos de ”agentes de recursos”
- Agentes OCF (Open Cluster Framework).
  Colección de scripts para el control de ”recursos” o servicios (evolución de los agentes LSB).
  Estandariza las acciones (start, stop, status, monitor, ..) sobre los ”recursos”, el paso de parámetros y los códigos de salida de los scripts.
  Agentes de recursos disponibles: https://github.com/ClusterLabs/resource-agents/
- Agentes LSB (Linux Standard Base).
  Se corresponden con los scripts de arranque de los servicios del sistema (disponibles en /etc/init.d)
  Suelen ser proporcionados por la distribución del sistema operativo utilizado.
- Otros: Scripts STONITH, adaptador para Systemd, etc
En Debian/Ubuntu, incluidos en el paquete resource-agents, instalados en /usr/lib/ocf/resource.d/heartbeat

4 EJERCICIO ENTREGABLE: Servidor Apache en alta disponibilidad con Linux-HA

4.1 Configuración previa

Instalación de LinuxHA en las máquinas del cluster (ya hecho)

apt-get install corosync cluster-glue
apt-get install pacemaker resource-agents crmsh

Asegurar un fichero /etc/hosts con las direcciones correctas (ya hecho)
```
------Contenido-----
127.0.0.1   localhost
10.10.10.11 servidor1
10.10.10.22 servidor2
------Contenido-----
```
Asegurar también que los hostnames son los correctos
```
servidor1:~# hostname
servidor2:~# hostname
```
(si es necesario asignar los correctos con los comandos 1”hostname servidor1” ó ”hostname servidor2”)

Diferenciar las webs por defecto de Apache (sólo para depuración y pruebas)

servidor1:~# nano /var/www/html/index.html
servidor2:~# nano /var/www/html/index.html

IMPORTANTE: Detener el demonio de Apache en ambas máquinas (Pacemaker se encargará de iniciar los servidores cuando ”toque”)
```
servidor1:~# systemctl stop apache2
servidor2:~# systemctl stop apache2
```

4.2 Configuración de Corosync

Corosync se encarga de gestionar los nodos del cluster y su estado (up/down)

Eliminar la configuración previa y detener los servicios Corosync y Pacemaker (en ambos nodos)

servidor1:~# crm configure erase servidor1:~# systemctl stop pacemaker servidor1:~# systemctl stop corosync

servidor2:~# crm configure erase servidor2:~# systemctl stop pacemaker servidor2:~# systemctl stop corosync

Crear la clave compartida de autenticación de mensajes con el comando corosync-keygen(en cualquier nodo)
```
servidor1:~# corosync-keygen 
Corosync Cluster Engine Authentication key generator.
Gathering 2048 bits for key from /dev/urandom.
Writing corosync key to /etc/corosync/authkey.
```
- Todos los nodos del cluster deben de disponer de esta clave compartida
- Por razones de seguridad, este fichero sólo debe de tener permiso de lectura para el usuario root (corosync-keygen ya lo crea con los permisos 400)

Editar la configuración de Corosync(en cualquier nodo)

servidor1:~# cd /etc/corosync
servidor1:/etc/corosync/# mv corosync.conf corosync.conf.orig
servidor1:/etc/corosync/# nano corosync.conf
------ Contenido a incluir -----

## Configuración de la comunicación entre nodos (knet sobre udp con pulsos/mensajes cifrados y autenticados)
totem {
    version: 2
    cluster_name: clustercda
    transport: knet
    knet_transport: udp
    crypto_cipher: aes256
    crypto_hash: sha256
    interface {
        linknumber: 0
        bindnetaddr: 10.10.10.0
        mcastport: 5405
    }
}

## Esquema de quorum (con 2 nodos no tiene sentido y la opción two_node:1 lo deshabilita)
quorum {
    provider: corosync_votequorum
    expected_votes: 2
    two_node: 1
}

## Lista explicita de nodos que forman el cluster HA
nodelist {
    node {
        nodeid: 1
        name: servidor1
        ring0_addr: 10.10.10.11
    }
    node {
        nodeid: 2
        name: servidor2
        ring0_addr: 10.10.10.22
   }
}


logging {
    to_logfile: yes
    logfile: /var/log/corosync/corosync.log
    to_syslog: yes
    timestamp: on
}

------ Contenido a incluir -----

Nota: Más información en http://corosync.github.io/corosync/. Lista completa de parámetros en ayuda en línea (man)

servidor1:~/# man corosync_overview
servidor1:~/# man corosync.conf
servidor1:~/# man votequorum

Copiar la configuración a los demás nodos del cluster (se hace mediante SSH)
```
servidor1:/etc/corosyncs/# scp {corosync.conf,authkey} root@servidor2:/etc/corosync

(pedirá la contraseña de root de cada máquina del cluster [purple])
```
Comprobar en el directorio /etc/corosync de la máquina servidor2 que realmente se han copia los 2 ficheros (corosync.conf, authkeys) con los permisos correctos.
Arrancar los servicios Corosyn y Pacemaker en todas las máquinas del cluster
servidor1:~# systemctl start corosync servidor1:~# systemctl start pacemaker

servidor2:~# systemctl start corosync servidor2:~# systemctl start pacemaker
Se puede ver como se ”suman” nodos al cluster con el comando crm_mon (desde cualquier nodo)
```
servidor1:~/# crm_mon        (también crm_mon --show-detail)
servidor2:~/# crm_mon

    (finalizar con CONTROL+C)
```
Al finalizar el ”arranque” del cluster (tardará un tiempo) mostrará que hay configurados 2 nodos y 0 recursos, indicando los nodos que están online (Online: [servidor1 servidor2])
```
    
servidor1:~# crm status
```
NOTA 1: Es posible que se muestren nodos adicionales en estado offline. Se trata de ”restos” de la configuración inicial de corosync existente en la imagen base de las máquinas virtuales.
NOTA 2: Para el desarrollo de la práctica lo más cómodo es dejar el comando crm_mon ejecuándose en una ventana propia y así poder comprobar la evolución y el estado del cluster en cualquier momento.
$\to$ A INCUIR EN EL ENTREGABLE: ¿Qué ha pasado en los nodos del cluster al iniciar el demonio corosync en todos ellos?

4.3 Configuración de Pacemaker

Pacemaker gestiona los recursos (servicios del cluster) y su asignación a los nodos.

Más información en: https://clusterlabs.org/pacemaker/
Comando crm: man crm

En este ejemplo Pacemaker gestionará 2 recursos en modo activo-pasivo:

la dirección IP pública 193.147.87.47 [recurso DIR_PUBLICA]
- este tipo de direcciones IP compartidas entre nodos de un cluster HA se denominan ”IPs flotantes” (floating IP)
un servidor web Apache [recurso APACHE]

La consola de administración de Pacemaker (comando crm) tiene dos modos de uso (ambos equivalentes)

Modo comando: especificando la secuencia opciones en una única orden de línea de comandos (útil para escribir scripts de automatización)
Modo interactivo: navegando a través de los contextos del crm shell (con la misma secuencia de opciones que el modo comando)

Entrar en la consola de configuración de Pacemaker [crm shell] (permite TAB para autocompletar)
```
    
servidor1:# crm configure

crm(live) configure# show
crm(live) configure# show xml
```
Nota: En ”modo comando” se ejecutaría desde el intérprete de comandos del sistema el comando crm configure show.
- La configuración de Pacemaker reside en un documento XML, el CIB (Cluster Information Base) [ubicado en /var/lib/pacemaker/cib/cib.xml]
- La consola crm shell permite editar las entradas de ese fichero (se confirma la escritura de las modificaciones de parámetros con el comando commit).
- Más información y ejemplos: http://clusterlabs.org/wiki/Example_configurations
Ajustar parámetros (deshabilitar STONITH y ajustar QUORUM)
```
    
crm(live) configure# property stonith-enabled=false
crm(live) configure# property no-quorum-policy=ignore
crm(live) configure# commit
crm(live) configure# show
```
- STONITH: mecanismo para ”matar” nodos fallidos para que no entren en competencia con los nodos que los reemplazan (evita inconsistencia de datos cuando dos componentes del cluster pretenden realizar las mismas tareas)
- QUORUM: mecanismo de ”votación” para determinar las acciones a realizar cuando hay conflicto entre varios nodos (”gana” la mayoría). En nuestro caso con sólo 2 nodos, nunca habrá quorum (por eso se deshabilita, para que se ignoren esos ”no acuerdos”)
Añadir el recurso DIR_PUBLICA
Se definirá un ”recurso” que se corresponde con la asignación de una dirección IP pública (193.147.87.47) a uno de los equipos del cluster.
- Es lo que se denomina IP flotante ó IP virtual
- Pacemaker asignará (y establecerá) esa dirección a uno de los nodos, hacinéndolo accesible desde el exterior
- Si el nodo ”portador” de la dirección IP flotante falla, Pacemaker la asignará al nodo superviviente, que desde ese momento será el ”portador” de la direccióon publica, siendo accesible desde el exterior.
1. PREVIO: Desde la máquina cliente lanzar el comando ping a la dirección IP 193.147.87.47 (fallará hasta que el cluster la habilite)
```
    
   cliente:~/# ping 193.147.87.47
```
2. Revisar los parámetros del ”resource agent” IPaddr
```
    
crm(live) configure# ra
crm(live) configure ra# list ocf
     (muestra los ”agentes de recurso” Heartbeat/Pacemaker de tipo OCF disponibles [los scripts fueron instalados con 'apt-get install resource-agentes en /usr/lib/ocf/resource.d/heartbeat/])
 
crm(live) configure ra# list lsb       
     (muestra los ”agentes de recurso” correspondientes a scripts de arranque de tipo init [scripts en /etc/init.d, controlados con 'service <script> start|stop|restart ]')

crm(live) configure ra# list systemd       
     (muestra los ”agentes de recurso” correspondiente a servicos del systema gestionados por systemd [controlados con 'systemctl start|stop|restart <servico>)

crm(live) configure ra# info ocf:heartbeat:IPaddr               (regreso al terminal con letra Q)
crm(live) configure ra# up
```
  - Los ”agentes de recurso” gestionan el arranque/parada y monitorización de los recursos.
  - Ubicación: /usr/lib/ocf/resource.d/heartbeat (recursos Open Cluster Framework (OCF) de Heartbeat/Pacemaker)
  - Más información: http://linux-ha.org/wiki/Resource_Agents y http://www.linux-ha.org/wiki/OCF_Resource_Agents
3. Darlo de alta y configurarlo con la IP pública del servidor web y el interfaz de red a usar
  (ojo con el separador de líneas \)
  SINTAXIS: primitive <nombre-recurso> <class>:<provider>:<nombre> [params <atributo>=<valor>]
```
    
crm(live) configure# help primitive                                     (regreso al terminal con letra Q)
crm(live) configure# primitive DIR_PUBLICA ocf:heartbeat:IPaddr \
                               params ip=193.147.87.47  cidr_netmask=255.255.255.0 nic=enp0s3
crm(live) configure# commit
crm(live) configure# show
```
  (comprobar el ping desde cliente [en algún momento empezará a responder])
  - Comprobar con ”crm status” o ”crm_mon” a qué nodo se le ha asignado el recurso DIR_PUBLICA
  - En esa máquina ver la configuración de las tarjetas de red con ”ip address” (habrá vinculado a la tarjeta enp0s3 la dirección 193.147.87.47)
$\to$ A INCUIR EN EL ENTREGABLE: ¿Qué ha pasado en los nodos del cluster al hacer commit y declarar el recurso DIR_PUBLICA?
Añadir el recurso APACHE
Se definirá un ”recurso” que se corresponde con la ejecución de un servidor HTTP Apache.
- Este recurso se vinculará con la dirección IP flotante definida en el paso anterior
- De modo que ambos recursos se asignen al mismo nodo, responsable de ser el ”portador” de la dirección flotante accesible desde el exterior y de iniciar el servicio Apache.
1. Revisar los parámetros del ”resource agent APACHE
```
   
crm(live) configure# ra list ocf
crm(live) configure# ra info ocf:heartbeat:apache
```
2. Darlo de alta y configurarlo
```
    
crm(live) configure# primitive APACHE ocf:heartbeat:apache \
                               params configfile=/etc/apache2/apache2.conf
crm(live) configure# commit
crm(live) configure# show
```
  - Desde otro terminal o desde el otro nodo: comprobar cómo evoluciona el estado del cluster [comando ”crm_mon” ó ”crm status”]
  - Puede suceder que el recurso DIR_PUBLICA se asigne a un nodo y el recurso APACHE al otro
3. Vincular los recursos DIR_PUBLICA y APACHE (”co-localizar” ambos recursos)
  SINTAXIS: colocation <nombre> <score>: <nombre-recurso> <nombre-recurso> !
```
    
crm(live) configure# help colocation
crm(live) configure# colocation APACHE_SOBRE_DIRPUBLICA inf: DIR_PUBLICA APACHE
crm(live) configure# commit
crm(live) configure# show
```
  - Comprobar cómo evoluciona el estado del cluster con el comando ”crm_mon” hasta que se estabilice y los dos recursos se asignen al mismo nodo.
  - Cuando los dos recursos migren al mismo nodo, comprobar que ahora es posible el acceso al servidor web desde la máquina cliente con lynx o Falkon (empleando la dirección 193.147.87.47)
$\to$ A INCUIR EN EL ENTREGABLE: ¿Qué ha pasado en los nodos del cluster al hacer commit e incluir la restricción de ”colocalización” APACHE_SOBRE_DIRPUBLICA?
Forzar la migración de los recursos a otra máquina
Desde el contexto resource del ”modo interactivo”
SINTAXIS: move <nombre-recurso> <nodo>
```
    
crm(live)configure# up
crm(live)# resource
crm(live)resource# help move
crm(live)resource# move APACHE servidorX
```
Directamente con el ”modo comando” de crm desde línea de comandos
```
    
servidor1:~# crm resource move APACHE servidorX   
servidor1:~# crm status
```
$\to$ A INCUIR EN EL ENTREGABLE: ¿Qué ha pasado en los nodos del cluster al ejecutar el comando move del contexto resource?
Detener la máquina donde se esté ejecutando (servidorX) [apagándola directamente] y comprobar que el otro servidor ocupa su lugar
```
    
servidorX:~/# shutdown -h now   # MEJOR: apagar la MV desde el boton "Cerrar"


servidorY:~/# crm_mon   (o crm --show-detail) 
                        [esperar hasta que detecte  el fallo y migre recursos]
ó
servidorY:~/# crm status
```
Cuando termine la migración, comprobar el acceso al servidor web desde la máquina cliente con lynx o Falkon.
$\to$ A INCUIR EN EL ENTREGABLE: ¿Qué ha pasado en los nodos del cluster al apagar la máquina con los recursos DIR_PUBLICA y APACHE?
Volver a ”encender” la máquina apagada y comprobar que sucede.

NOTA: En el fichero de LOG /var/log/corosync/corosync.log (disponible en los dos nodos) se puede ver la evolución del cluster, los eventos y las decisiones tomadas por los nodos del cluster.

5 Documentación a entregar

Detallar los pasos seguidos y los resultados obtenidos en los siguientes puntos del ejemplo (señalados con $\to$ A INCLUIR EN EL ENTREGABLE):

Configuración del gestor de nodos Corosync (punto 5 en la sección 4.2)
Declaración del recurso DIR_PUBLICA (punto 3 en la sección 4.3)
Declaración del recurso APACHE y establecimiento de la restricción de ”co-localización” (punto 4 en la sección 4.3)
Migración del recurso APACHE a otro nodo (punto 5 en la sección 4.3)
Apagado/caída de un nodo (punto 6 en la sección 4.3)

En cada uno de esos puntos a explicar:

Indicar los comandos empleados
Explicar las acciones que tienen lugar en los nodos del cluster (tráfico en la red, scripts ejecutados en los nodos implicados, etc) como consecuencia de dichos comandos, indicando su resultado.
Detallar el estado final del cluster (bastará con aportar la salida de crm status o crm_mon)

Entrega: MOOVI

Fecha límite: hasta el domingo 27/11/2022