Proactive HA est l’une de mes
fonctionnalités préférées depuis vSphere 6.5.
En cas de défaillance, le serveur tombe en panne et HA redémarre les ordinateurs virtuels.
Cependant, Proactive HA interroge le vCenter pour connaitre l’état des hôtes présent dans le cluster HA et vous permet de configurer des actions proactives pour réagir face aux événements et alertes qui peuvent causer un arrêt et/ou isolation des VMs.
Il vous permettra d’évacuer les VMs avant que le problème provoque un impact business.
Pour
utiliser cette fonctionnalité et comme prérequis, il faut avoir DRS activé.
Proactive
HA fait en réalité partie de vSphere DRS.
Proactive HA peut réagir à différents types de pannes, tels que :
Alimentation
électrique (Power Supply).
Mémoire.
Ventilation
(Fan).
Stockage.
Réseau.
Par exemple :
Votre serveur physique (Host ESXI) dispose d’une
redondance au niveau de l’alimentation, et l’un des bloc d’alimentation est en
panne.
Le serveur est toujours opérationnel, mais son
fonctionnement est en mode dégradé à cause d’un SPOF (point de défaillance unique)
au niveau de l’alimentation.
Dans ce cas, Proactive HA sera déclenchée et les actions ci-après seront exécutées :
Les machines virtuelles seront déplacées de façon manuel ou automatisé vers un autre Host.
L’host défaillant seront placé dans l’un des modes : Quarantine, Mixed ou Maintenance.
VMware vSAN est la solution de stockage à définition logicielle SDS (Software Defined Storage) de VMware qui élimine le besoin d’avoir une baie de stockage dédié.
vSAN est dédiée aux nouvelles
générations des infrastructures : hyperconverged infrastructure (HCI).
Cette solution permet d’agréger des disques locaux d’hôtes
physiques membres d’un cluster vSphere, afin de créer une solution de stockage
partagée et distribuée.
VSAN utilise des groupes de disques au lieu de disques
individuels pour former un magasin de données.
En dissociant la partie logicielle de stockage de la couche
matérielle, les clients bénéficient de plus de flexibilité, performances
élevées, facilité d’administration et une réduction des coûts.
Il existe certaines limitations sur les groupes de disques Vsan,
Vous pouvez créer un maximum de 5 groupes de disques par hôte ESXi et chaque
groupe de disques doit contenir au moins un disque SSD + un ou plusieurs
disques durs (HDD ou SSD).
Mode hybride :
Cache tier :
1 SSD pour le cache.
Capacity tier :
Un ou plusieurs disques durs HDD pour la partie capacité.
Mode All Flash :
Cache
tier : 1 SSD pour le cache.
Capacity
tier : Un ou plusieurs disques SSD pour
la partie capacité.
Lorsque vous activez des fonctionnalités telles que la
déduplication et la compression, elles sont activées au niveau du groupe de
disques.
Lorsque vous déployez une machine virtuelle, les disques de
cette machine virtuelle sont répartis sur les différents groupes de disques de
différents hôtes, de sorte que vous puissiez tolérer la défaillance d’un hôte ou
plus (selon votre configuration).
C’est la solution qui vous permet de garder une vue en temps réel sur l’état de santé de la plateforme VMware, en se basant sur les indicateurs clés de performance (KPI) et cela à travers un tableau de bord (dashboard) personnalisé.
Avec vRealize Operations Manager, il est faisable de garantir un niveau optimale d’utilisation des ressources et une qualité de service améliorée.
C’est une gestion intelligente avec une grande visibilité et proactivité, à l’aide des fonctionnalités :
Supervision des VMs.
Détection des anomalies.
Analyse de performance.
Anticipation des besoins en ressources.
Planification de la capacité (capacity
planning).
Automatisation basée sur des stratégies.
Lorsque DRS et vROps travaillent ensemble, des possibilités
intéressantes s’ouvrent.
En combinant l’automatisation de DRS avec l’intelligence de vROps et grâce au mode d’apprentissage du produit, qui étudie et analyse le comportement de l’infrastructure (par exemple : consommation abusive de la RAM et CPU par un serveur X chaque dernier samedi du mois), vous pourrez vous libérer des tâches d’administration et gestion de ressources imprévu et vous concentrer sur des tâches plus importantes.
L’objectif de cet article est de mieux comprendre les mécanismes de gestion de la mémoire au niveau VMware.
Afin d’optimiser la gestion de la mémoire (RAM), VMware
opte pour 4 méthodes qui s’exécutent séquentiellement et par ordre
décroissant de performance :
Transparent Page Sharing (TPS)
Ballooning
Compression
Swap
Transparent Page Sharing (TPS)
Cela concerne généralement les VMs tournent sur le même Host est qu’ont un système d’exploitation similaire, dans ce cas de figure nous avons plusieurs éléments identiques en mémoire.
La fonctionnalité Transparent Page Sharing consiste à faire des scans toutes les 60 secondes pour identifier les pages mémoires identiques/multiplier et fait la dé-duplication de mémoire pour ne garder qu’une seule page mémoire pour chaque élément.
Cela permet donc d’économiser de la RAM en mutualisant les pages mémoire communs aux différentes VMs.
Il n’y a donc pas de perte de performance autre que celle induite par la virtualisation (temps de la consultation de la table des correspondances pour accéder à la page mémoire demandée).
L’efficacité dépend de deux facteurs :
Plus il y aura des éléments communs, plus les pages mémoire peuvent être mutualisées.
Plus la taille mémoire par page est élevée, moins il sera possible de mutualiser les pages mémoires.
Ballooning
Le ballooning est un mécanisme gérée par VMware Tools (précisément le pilote vmmemctl) et qui permet à l’ESXi de fournir de la mémoire aux VMs en cas de besoin suite au sur-utilisation de RAM (Overcommitting).
En général, plus un système d’exploitation a de la mémoire
à sa disposition, plus il en utilise et pas forcément de manière la plus
efficace.
Pour éviter le gaspillage de la mémoire, VMware crée un processus consomme de plus en plus de mémoire et pousse le système à libérer de l’espace.
La mémoire consommée par ce processus pourra être utilisée par d’autres VMs, ceci est possible grâce à l’installation de VMware Tools qui peut agir sur le système d’exploitation à l’aide du balloon driver (vmmemctl).
Compression
Lorsque les méthodes TPS et ballooning sont utilisées et le
host a toujours besoin de la mémoire supplémentaire, l’ESX utilise la
compression de la mémoire.
Cela consiste scanner les pages mémoire via VMkernel et compresser les pages mémoire qui peuvent être compressées à plus de 50%.
La compression cause une perte de performance suite à la compression et décompression des pages mémoire, cependant il reste plus performant que le swapping.
SWAP
C’est le dernier recours par VMWare, au cas où les
mécanismes précédents n’ont pas libérer assez de mémoire.
Le swap consiste à copier sur disque les pages mémoires afin
de libérer de la RAM.
Cette méthode est coûteuse en termes de performance et quand le host ESXi commence à utiliser le swap, là c’est la catastrophe côté performance.
A ce stade, il faut commencer à prendre les mesures nécessaires
pour augmenter/libérer les ressources mémoires.
Durant mes interventions pour différents clients notamment en Afrique et les sites distants , souvent des pannes de courants cause l’arrêt de tous les équipements y compris la plateforme VMware-Hosts ESXI (notamment là ou le courant est instable et l’investissement au niveau d’un groupe électrogène n’est pas faisable).
Pour éviter :
Administrateurs : les interventions sur site en HNO surtout durant les week-end et vos vacances.
Manager : les problèmes de disponibilité de votre ressource compétente qui maîtrise les spécifications de votre environnement (le héros à qui vos faite confiance).
Il vaut mieux anticiper, surtout que VMware a déjà pensé à vous :).
Je vous recommande d’utiliser la fonctionnalité du démarrage/Arrêt automatique des VMs au niveau VMware, cela vous permet de configurer des machines virtuelles pour qu’elles démarrent et s’arrêtent dés la mise sous ou hors tension de l’hôte (c’est faisable de configurer aussi un délai).
Information utiles :
L’ordre de démarrage est un élément essentiel pour la disponibilité de votre infrastructure, il faut prendre en considération tous les dépendances en considération et il doit être préparé en impliquant les ressources qui maîtrisent les spécifications de votre environnement et les enjeux business .
Se référer aux bonnes pratiques.
Le démarrage automatique n’est pas pris en charge lorsqu’il est utilisé avec vSphere HA.
Procédure de configuration :
Dans vSphere Client, accédez à l’hôte dans lequel se trouve la machine virtuelle et cliquez sur l’onglet Configurer.
Sous Machines virtuelles, sélectionnez Démarrage/Arrêt de la VM et cliquez sur Modifier (la boîte de dialogue Modifier la configuration Démarrage/Arrêt de la VM s’ouvre).
Sélectionnez Démarrer et arrêter automatiquement les machines virtuelles avec le système.
(Facultatif) Dans le panneau Paramètres par défaut de machine virtuelle, configurez le comportement du démarrage et de l’arrêt par défaut de toutes les machines virtuelles sur l’hôte.
Facultatif) Vous pouvez également configurer l’ordre de démarrage et le comportement des machines virtuelles.Utilisez cette option lorsque vous avez besoin que le délai de la machine virtuelle soit différent du délai par défaut de toutes les machines.
Pour configurer l’ordre de démarrage des machines virtuelles, sélectionnez une machine virtuelle dans la catégorie Démarrage manuel et servez-vous de la flèche haut pour la déplacer vers la catégorie Automatique.Utilisez les flèches vers le haut et vers le bas pour modifier l’ordre de démarrage des machines virtuelles dans les catégories Automatique et Manuel. Lors de l’arrêt, les machines virtuelles sont arrêtées dans l’ordre inverse.
Pour modifier le comportement au démarrage et à l’arrêt d’une machine virtuelle, sélectionnez une machine virtuelle et cliquez sur l’icône Modifier.
Dans la boîte de dialogue Paramètres de démarrage/d’arrêt de machine virtuelle, configurez le comportement au démarrage de la machine virtuelle.Vous pouvez choisir d’utiliser le délai de démarrage par défaut ou vous pouvez en spécifier un nouveau. Si vous sélectionnez Continuer si VMware Tools démarre, l’hôte ESXi lance la prochaine machine virtuelle sans attendre que le délai soit écoulé.
Dans la boîte de dialogue Paramètres de démarrage/d’arrêt de machine virtuelle, configurez le comportement à l’arrêt de la machine virtuelle.Vous pouvez choisir d’utiliser le délai d’arrêt par défaut ou vous pouvez en spécifier un nouveau.
Enhanced vMotion Compatibility (EVC) est l’une des fonctionnalités
vSphere les plus connues.
Comme vous le savez déjà, EVC est une fonctionnalité qui élimine
les problèmes d’hétérogénéité CPU et l’exécution vMotion au sein du cluster.
vSphere 6.7 a amené EVC au niveau supérieur, cette dernière
version a introduit une des fonctionnalités intéressantes autour d’EVC, c’est l’EVC
par machine virtuelle (Per-VM EVC).
Comme son nom l’indique, Per-VM EVC peut être activé sur une
machine virtuelle spécifique.
Le grand avantage est que cela fonctionne non seulement sur
les VM à l’intérieur du cluster, mais aussi sur les VM à l’extérieur du
cluster.
Avec Per-VM EVC, vous pouvez garantir que votre VM peut être
migrée sans erreur dans les cas suivants:
Entre clusters (across clusters).
Hosts autonomes (standalone hosts).
Entre vCenters (cross vCenters).
Environnements Cloud hybrides (tels que
le cloud VMware sur AWS).
Notes et spécifications :
Il faut avoir au minimum la version vSphere 6.7.
La version matérielle de la machine virtuelle
doit être vmx-14.
Il faut mettre la machine virtuelle hors tension
avant de configurer Per-VM EVC.
L’activation de cette fonctionnalité est
disponible à partir de l’interface graphique GUI (Client vSphere html 5) et
aussi à travers Power-CLI.
Per-VM EVC est compatible avec vSphere DRS.
Si l’hôte ne prend pas en charge le mode EVC
configuré sur la VM, celle-ci ne peut pas être mise sous tension.
Le mode EVC d’une machine virtuelle est
indépendant du mode EVC défini au niveau du cluster.
Procédure d’activation :
Connectez-vous à travers l’interface utilisaterus GUI (html 5) :
Puis : sélectionnez la VM==> Configure ==> VMware EVC ==> Enable
VMware vSphere Fault Tolerance fournit un temps d’arrêt égal à zéro en créant une copie en double (secondaire) de la machine virtuelle sur un hôte différent et en maintenant la synchronisation des deux machines.
La machine virtuelle secondaire prend immédiatement le relais si la machine virtuelle principale est indisponible à l’aide de la technologie VMware vLockstep.
VMware vLockstep est une technologie qui capture les entrées
et les événements qui se produisent sur un ordinateur virtuel principal et les
envoie à un ordinateur virtuel secondaire.
Cela fonctionne en plaçant une machine virtuelle
(principale) à l’état actif, cette machine virtuelle reçoit des données, répond
aux demandes et exécute des applications.
Une autre machine virtuelle (secondaire) agit en tant que
partenaire silencieux.
Étant donné que la machine virtuelle secondaire est toujours
synchronisée avec la machine virtuelle principale, elle prend immédiatement le
relais (devient principale) sans interruption de service si la machine
virtuelle principale échoue.
Lorsque la machine virtuelle secondaire prend le relais, VMware FT crée automatiquement une nouvelle machine virtuelle secondaire.
VMware vLockstep doit être configuré sur une carte réseau
dédiée d’au moins 1 Go, les données sont synchronisées entre les machines
virtuelles couplées.
Les sorties (Output) sont supprimées dans la machine virtuelle
secondaire, donc VMware FT garantit que
seule la machine virtuelle principale lance les opérations d’écriture sur le
stockage.
VMware vLockstep doit être configuré sur une carte réseau
dédiée d’au moins 1 Go.
D’autre part, les sorties sont supprimées dans la machine virtuelle secondaire. VMware FT garantit que seule la machine virtuelle principale exécute les opérations d’écriture sur le stockage.
Badr Eddine CHAFIQ
En tant qu'Architecte et Expert Systèmes et Virtualisation, ce blog fait partie d'une approche de partage de connaissances «giving back» autour des technologies de virtualisation "en particulier VMware", Cloud et Hyper-convergence.Le but principal de ce blog est de partager les nouveautés, Tutoriels , conseils et apporter des solutions techniques.