Comandos utiles VMware

Todos estos comandos son a nivel Shell de Esxi:

dcui, este comando nos dará acceso al server como si estuvieramos delante de el. Normalmente utilizamos este acceso para reiniciar los servicios del agente de los servidores. Para reiniciar nos tendremos que ir a Troubleshooting Options, Restart Management Agents
esxcli vm process list, este comando muestra un listado de los procesos del servidor sobre las vm, este proceso nos indica el World ID, que es el que tendremos que killear ante posibles bloqueos, nota, la máquina debe de estar apagada, ya que sino la tirará.
esxcli vm process kill –type=soft –world-id=2799512, con este comando eliminaremos el proceso asociado a la máquina.
lsof | grep «*flat.vmdk» nos devuelve el VMX Cartel ID: 2799511 y mas información referente a la maquina, es mas práctico usar los anteriores.

Restaurar una VM desde los punteros de la cabina NetApp

Ojo, esta documentación es para casos críticos de perdida total de una VM, esta restauración se hace directamente desde la cabina y no desde el software de Backup.
Una vez hemos llegado a la situación en que la máquina por cualquier razón no funciona, no arranca, ha perdido datos, tiraremos teóricamente del software de backup, pero este método también es válido y funciona bastante rápido.
Lo primero que tenemos que hacer es irnos a la cabina y buscar el volumen donde esta instalado o ubicada la virtual machine que ha muerto.
La teoría, en este entorno y por buenas prácticas, nos encontraremos volúmenes por proyectos, y esto segmenta mucho el proceso a la hora de restaurar. 

Los volúmenes están todos clonados, el volumen name_mirror es una copia del volumen principal que se guarda en la segunda cabina, todos los volúmenes están agregados en todos los servidores, esto es importante ya que para crear un HA es necesario que todos los nodos tengan accesibles todos los datastores.
Una vez localizado el volumen ya nos podemos ir a la cabina, a través de la dirección web de la cabina principal del cluster,
Dentro de la cabina Storage nos iremos a la sección de Storage, y dentro de Storage buscaremos volúmenes

En esta página le daremos al + del volumen en cuestión que queremos usar para recuperar la virtual machine, dentro de las especificaciones buscaremos abajo a la derecha «Show more details»

En la siguiente pantalla nos saldrá de manera detallada toda la información del volumen, arriba a la derecha tenemos el botón «Actions», le daremos ahí, seguidamente clone>create>volumen, con esta operación lo que hacemos es coger todo el volumen entero y prepararlo para restaurarlo con un snapshot concreto.

Nos saldrá una pantalla con las configuraciones básicas que queremos aplicar a la clonación del volumen, aqui definiremos 3 parametros esenciales:

  • El nombre, pondremos el nombre del volumen_clone, ej. si el volumen se llama gestión, el clonado lo podemos llamar gestión_clone
  • Thin Provisioning chequeado, esto hará que aun que el volumen tenga asignado 2tb solo ocupe lo que tenga usado en ese momento
  • Use an existing Snapshot copy, esto nos permite elegir (dependemos de la programación que tenga dicho volumen) el puntero que necesitamos de ese volumen, por norma dependiendo de que volumen sea, encontraremos por horas, cada 8 horas y algún día

Una vez clonado, tenemos que prepara el volumen para ofrecérselo a VMware por NFS (red), en este caso nos iremos debajo de volúmenes a NameSpace, cuando se monta un volumen nuevo la Netapp detecta que no esta montado y al darle a mount montaré directamente este nuevo volumen.
Una vez llegados a este paso nos iremos a Vmware, seleccionaremos un servidor y le montaremos el volumen, para esto es conveniente mirar los datos del volumen «origen» que hemos clonado, ya que tienen una ip asignada para ser localizados por la red. Estas ips las podemos encontrar dentro de la web de la cabina en Network Interfaces

No obstante, también lo podemos ver en VMware, ya que el volumen que clonemos se asignará automáticamente al mismo SVM en el que está el volumen original, véase esta foto de los volúmenes en VMware

Para agregar el nuevo volumen le daremos a Add Storage, seleccionaremos Network File System (NFS), todo esto dentro de Home, Inventory, Datastores, nota, esto en el web client puede cambiar pero mas menos será así.

Una vez realizada la selección de NFS, pondremos los datos básicos, leer mas arriba de este documento para saber de donde sacarlos.

El proceso final de restauración requiere que la máquina virtual estropeada se pare por completo, y poder finalizar el proceso. (En el ejemplo que he realizado por primera vez, sucedió que el Servidor Installation Server de Data Protector explotó y se restauró de la siguiente manera)
Paso de restauración una vez se tiene disponible el volumen con las máquinas:

  • Lo primero de todo es eliminar la virtual machine actual del inventario (ojo no la eliminaremos aun del Datastore, solo del listado de máquinas virtuales)
  • Seguidamente hacemos un relocate, para realizar un relocate nos iremos a la carpeta de la virtual machine restaurada y navegaremos dentro de ella en busca del archivo vmx, le daremos al botón de la derecha y seguidamente Add to Inventory
  • Con este paso lo que habremos conseguido es que nuestro Vcenter vea la máquina restaurada y pueda levantar en un estado anterior, una vez agregada, directamente le daremos al play para que levante. (Recordar que la máquina rota o a restaurar tiene que estar apagada)
  • Una vez levantada la máquina, verificamos que todo esta ok, nota, en servicios críticos donde hay perdidas de datos estas intervenciones son mas complicadas, hay que tener muy en cuenta cuando se produce el error y a finar con los horarios.
  • Después de realizar todas las verificaciones pertinentes y si vemos que todo funciona correctamente y que la máquina rota no esta interactuando con nada, eliminaremos desde el Datastore la máquina averiada, el objetivo de esto es liberar del volumen en cuestión el problema y poder mover la máquina que funciona a este datastore para poder desmontar el clonado .
  • Una vez eliminado, nuestra licencia nos permite mover en caliente la máquina entre datastores, procedemos a mover la máquina restaurada del datastore clonado, al datastore de producción, con este paso ya tenemos liberado el volumen clonado para poder desmontarlo. (Es muy importante tener claro que no hay dependencias y que hacemos bien estos pasos, ya que un error aquí puede producir la pérdida de la máquina y nos tocaría realizar otra vez todo el proceso)
  • En este punto, tenemos acabado el trabajo de recuperación, a partir de ahora realizaremos los pasos a la inversa para realizar la segunda fase, se trata de desmontar y eliminar el volumen clonado.

Para proceder a desmontar el volumen, tendremos que estar en la sección de Home, Inventory, Datastores. Una vez aquí buscaremos el datastore clonado y con el botón de la derecha encima le daremos a unmount, con esto desvincularemos Vmware del volumen que aun sigue existiendo en la Netapp.

Ahora iremos a la página de configuración de nuestra cabina de Netapp, en concreto a la parte de NameSpaces, donde procederemos a desmontar la conexión creada en particular para el volumen creado, recordemos que se crea en el mismo SVM que el original.
Seleccionamos el Path que queremos desmontar, y seguidamente le damos a desmontar.

Después de esto nos vamos a la sección de volúmenes dentro de la cabina, en la cual es conveniente seleccionar el SVM correspondiente o le podremos dar a ver todos los volúmenes, una vez allí seleccionamos el volumen clonado que queremos desmontar, y seguidamente le daremos a Action->Change Status to->Offline.

Cuando el volumen pasa a estado Offline, se pondrá rojo en vez de verde, esto significa que ya podemos proceder a su eliminación total de la cabina

Le damos clic con el botón principal y seguidamente arriba veremos que ya tenemos disponible el botón de delete, le damos a borrar y confirmamos borrado, con esto habremos completado el proceso completo de restauración de un Snapshot desde la cabina.