Arquivo do mês: maio 2015

VMCP – el vSphere HA ahora protege en caso de fallas de storage

Sorpresa? Así es: HA, hasta la versión 6.0 no protege las VMs por fallas de conectividad de storage. Un failover de HA (VM reinicializando en otro host) antes solamente ocurria por:

  • Cuelgue de um ESX (prendió fuego, congeló, lo apagaron, etc)
  • Aislamento de red de un ESX
  • VM congelada (BSOD, Kernel panic), por el VM monitoring. La VM es reinicializada en el mismo host, no migra.

Si un ESX específico pierde acceso alstorage, hasta la versión 5.5 las VMs de este ESX que estaban adentro de este storage iban a fallar (porsupuesto) pero el HA no tenía la capacidad de percibir esto como un problema – de hecho, el ESX esta funcionando, quien tuvo problema fue la conectividad de storage. Hasta es posible hacer con que eso funcione en el vSphere 5.5, pero exige un engorroso proceso de scripting y configuraciones por línea de comando.

El vSphere 6 ahora tiene la funcionalidad VMCP, o VM Component Protection, que detecta cuando una VM o un grupo de VMs no tiene acceso a su datastore por una falla de conectividad.

HA-VMCP01

Esta opción esta deshabilitada, por default, y solo funciona con vSphere 6y ESXi 6. Pero se le puede configurar el HA para que actúe apagando las VMs y reiniciandolas en otros ESX en caso de falla.

HA_VMCP02

Sugiero una lectura atenta dela documentación de Availability de vSphere 6 para compreender mejor este nuevo feature.

Un abrazo!

VMCP – agora o vSphere HA protege contra falhas de acesso a storage

Surpresos? Isso mesmo: o HA até a versão 6.0 não protegia contra falhas de conectividade de storage. Um failover de HA (VM reiniciando em outro host) ocorria antes somente nas seguintes situações:

  • Travamento de um ESX (pegou fogo, congelou, chutaram, desligou, etc)
  • Isolamento de rede de um ESX
  • VM congelada (BSOD, Kernel panic) através do VM monitoring. A VM é reiniciada no mesmo host, e não migra.

Se um ESX específico perdesse acesso ao storage, até a versão 5.5 as VMs deste ESX que estavam nesse storage iam ter problemas (obviamente) mas o HA não tinha a capacidade de detectar que isso era um problema – afinal, o ESX está funcionando, o que falhou foi o acesso iSCSI, ou FC. É possível realizar uma série de alterações no HA, linha de comando, para que ele detecte isso, mas é uma operação delicada.

O vSphere 6 introduziu a funcionalidade VMCP (VM Component Protection) que detecta justamente as falhas de storage e toma uma atitude frente a este problema:

HA-VMCP01

Esta opção não está habilitada por padrão, e só funciona com vCenter 6.0 e ESXi 6.0. As ações que podem ser tomadas são as mesmas quanto a isolamento – Desligar as VMs afetadas pela falha de storage (pode ocorrer por LUN, ou pra todas as LUNs que um ESX enxerga).

HA_VMCP02

Sugiro uma boa lida nos documentos de Availability do vSphere 6 para compreender melhor este feature.

Um abraço!