• Note pour les visiteurs de Tutoriaux-Excalibur

    Vous trouvez Tutoriaux-Excalibur intéressant ?

    Nous espérons que vous avez trouvé les tutoriels sur Tutoriaux-Excalibur utiles et instructifs. Votre avis est très important pour nous !

    Si vous avez apprécié votre expérience, nous vous invitons à partager vos commentaires sur notre page Trustpilot.

    Cliquez ici pour partager votre expérience sur Trustpilot.

    Merci de votre soutien !

Tutoriel 📝 Résoudre l’échec du basculement automatique en haute disponibilité

Sylvain*

Administrateur
Membre VIP
Membre présenté
Membre
📝 Résoudre l’échec du basculement automatique en haute disponibilité

🔦 Introduction

Les configurations de haute disponibilité (HA) sont essentielles pour garantir la continuité des services critiques dans un environnement Windows Server. Cependant, il peut arriver que le basculement automatique échoue lors d’une panne d’un nœud ou d’une ressource, compromettant ainsi la fiabilité des applications hébergées. Ce guide propose plusieurs méthodes pour diagnostiquer et corriger les problèmes de basculement dans un cluster de haute disponibilité.



🔬 Prérequis

• Compréhension des clusters de basculement Windows Server

• Familiarité avec la console Gestion du Cluster de basculement

• Accès administrateur sur tous les nœuds du cluster



📋 Différentes Approches

Approche #1 : Vérification réseau et quorum via CMD

Approche #2 : Vérification des ressources et logs du cluster via PowerShell

Approche #3 : Script PS1 pour test et redémarrage automatique des rôles HA



📈 Niveau de difficulté

Approche #1 : Intermédiaire

Approche #2 : Avancé

Approche #3 : Avancé (automatisation)



👍 Les Avantages

Approche #1 : Permet de vérifier rapidement les connexions critiques

Approche #2 : Aide à identifier la cause précise dans les journaux

Approche #3 : Automatisation du redémarrage et du test de basculement



👎 Les Inconvénients

Approche #1 : Ne détecte pas les erreurs internes au cluster

Approche #2 : Analyse plus longue des logs

Approche #3 : Risque d’exécuter le basculement en production sans vérification



⚙️ Approche #1

1️⃣ Ouvrir CMD sur chaque nœud

2️⃣ Vérifier la connectivité entre les nœuds

Code:
ping NomNoeud2

3️⃣ Vérifier le statut du cluster

Code:
cluster /status

4️⃣ Vérifier le quorum

Code:
cluster /quorum

5️⃣ Redémarrer manuellement une ressource pour tester le basculement

Code:
cluster resource "NomRessource" /move



⚙️ Approche #2

1️⃣ Ouvrir PowerShell en administrateur

2️⃣ Vérifier l’état de chaque nœud

Code:
Get-ClusterNode

3️⃣ Vérifier les ressources en échec

Code:
Get-ClusterResource | Where-Object { $_.State -ne "Online" }

4️⃣ Vérifier l’état du quorum et du témoin

Code:
Get-ClusterQuorum

5️⃣ Afficher les événements du cluster pour les derniers échecs

Code:
Get-WinEvent -LogName "Microsoft-Windows-FailoverClustering/Operational" | Select-Object TimeCreated, Message | Sort-Object TimeCreated -Descending | Select-Object -First 10



⚙️ Approche #3

1️⃣ Créer un fichier TestFailover.ps1

2️⃣ Insérer le script suivant pour vérifier et relancer une ressource

Code:
$cluster = Get-Cluster
$resource = Get-ClusterResource -Name "NomRessourceCritique"
if ($resource.State -ne "Online") {
Write-Output "Ressource hors ligne, tentative de redémarrage..."
Start-ClusterResource -Name $resource.Name
} else {
Write-Output "La ressource est déjà en ligne."
}

3️⃣ Planifier l’exécution périodique via le Planificateur de tâches

4️⃣ Paramétrer des alertes par mail via un script complémentaire si erreur détectée



💡 Astuce

Utilisez des scripts de test planifiés pour simuler un basculement mensuel et ainsi valider la stabilité de votre cluster.



🚨 Mise en garde

Ne jamais exécuter de basculement automatique en environnement de production sans test préalable en environnement de préproduction.



🔖 Conseil

Consignez toutes les modifications apportées au cluster dans un journal partagé pour faciliter les audits et les diagnostics futurs.



🔎 Solution alternative

Voici quelques outils et solutions HA tiers permettant d’améliorer ou remplacer le basculement natif Windows Server :

Veeam Availability Suite Cluster Failover

StarWind Virtual SAN high availability

DoubleTake Availability HA failover Windows



🔗 Références

Support Microsoft

Microsoft Learn

Recherche Github



💬 Conclusion

Le basculement automatique est un pilier de la haute disponibilité. Un simple problème de connectivité, de configuration de quorum, ou une ressource mal configurée peut compromettre l’intégrité du système. En combinant la vérification manuelle, l’analyse des logs via PowerShell et l’automatisation par script, vous garantissez une supervision proactive et efficace du cluster. N’oubliez pas de documenter tous les comportements anormaux et de tester régulièrement le basculement dans un environnement contrôlé.
 

Campagne de dons

Dons pour T-E

Campagne de dons pour T-E
Objectif
300.00 $
Reçu
125.81 $
Cette collecte de dons se termine dans
0 heures, 0 minutes, 0 seconds
  41.9%

En ligne

Statistiques des forums

Discussions
18 048
Messages
29 315
Membres
359
Dernier inscrit
JuanDivinoTesoro

Nouveaux membres

Anniversaires

Retour
Haut Bas