Par Jean-Luc
• Aide
• Mercredi 06/02/2008
• 6 commentaires
• Lu 2970 fois
•
Voici maintenant plus d'une heure que le serveur des gros sites est inaccessible. La procédure automatique de redémarrage après un certain temps d'inactivité ne fonctionne donc pas, ou n'a pas été réactivée. Ou c'est plus sérieux. S'il faut s'attendre à tout après l'épisode du remplacement des cartes serveur des nouveaux serveurs, je penche tout de même plutôt pour un des nouveaux process nocturnes qui s'est mal déroulé. J'en profite d'ailleurs pour m'élever contre cette pratique : entre les services qui lancent leurs opérations de maintenance tout le weekend (sur tout le spectre des fuseaux horaires) et la plateforme qui lance je ne sais quoi la nuit (GMT+2), j'administre quand moi ? Assez du diktat des heures de bureau ! EDIT : il vient de repartir. C'est donc plus d'1h30 d'interruption de service. Un rapport d'incident ? Et comment est-il reparti ? Pour info, il y avait eu plusieurs alertes dans la journée mais de courtes durées. Commentaires
Re: Rapport d'incident pour grognon
par Jean-Luc
le Mercredi 06/02/2008 à 06:00
Ce n'est pas moi qui vais t'accabler à ce sujet (que je connais bien). Je pensais aussi que c'était géré et que ce risque avait été ou réglé ou écarté. Ce ne semble pas le cas en effet. Quant à mon évocation de nouveaux process nocturnes, c'est ce que javais cru lire dans un de tes derniers posts : Mais j'ai probablement mal interprété ta parenthèse. Bonne galère en attendant ces histoires de serveurs à problèmes. Il y a eu encore un reboot depuis :-(
Re: Rapport d'incident pour grognon
par Stephane
le Mercredi 06/02/2008 à 09:26
J'ai remplacé "plus d'indisponibilité la nuit" par "résolution du problème d'indisponibilités la nuit" dans l'article. Si je change l'architecture, c'est pour résoudre les problèmes, pas en créer des nouveaux. ;-)
Re: Rapport d'incident pour grognon
par Jean-Luc
le Mercredi 06/02/2008 à 21:45
LES GROS A NOUVEAU AU CHOMAGE TECHNIQUE !!!
Re: Rapport d'incident pour grognon
par Stephane
le Jeudi 07/02/2008 à 11:24
OVH est intervenu sur le serveur pour reflasher le bios. Bonjour,
Re: Rapport d'incident pour grognon
par Stephane
le Jeudi 07/02/2008 à 11:28
Ce qui semble avoir résolu le problème du reboot toutes les heures, le serveur n'a pas rebooté depuis. :-) |
Recherche d'articlesSessionPour participer plus facilement, ouvrez une session : Si vous avez déjà un blog sur ViaBloga ou si vous avez ouvert un compte sur l'un d'entre eux, vous pouvez vous identifier avec votre nom d'utilisateur et mot de passe en précisant d'abord l'identifiant de votre blog. S'inscrireDiscussions actives (+ commentaire)
Derniers commentaires
Ailleurs sur ViaBlogaDerniers weblogs mis à jour :19:31 - Les Amis de Kervoyal21:40 - Photos Promenade Numérique 08:57 - Voleur d'âme 08:47 - Everitouthèque 17:00 - Défendre et Promouvoir les Valeurs de la République Sociale 19:10 - P'tit truc 15:47 - 10:30 - Le blog de Jean-Michel Cornu 10:49 - Les Amis de la Butte de Biez 15:54 - Université Populaire d'Évreux Toutes les mises à jour |
ActualitésArchives par mois
|
Le serveur numéro 2 a des problèmes hardware, que je suis en train de régler avec OVH. Ils étaient intervenus il y a une dizaine de jours, ce qui a résolu visiblement seulement temporairement le problème, puisque il recommence aujourd'hui. En gros : le serveur reboote pour une raison inconnue à peu près toutes les heures. Lors d'un de ces reboots, il s'est bloqué sur un écran noir. Ca n'a rien à voir avec la procédure de relance automatique (qui est logicielle) ou l'un des "nouveaux process nocturnes". Il n'y a pas de nouveau process nocturne.
Il y a une dizaine de jours :Le serveur est reparti parce que j'ai contacté le support d'OVH et qu'un de leur technicien est intervenu. Voilà ce qu'il en a dit :
Plus de détails sur le problèmes des cartes mères : http://travaux.ovh.net/?do=details&id=1902
Conclusion : ce n'est pas encore réglé, c'est en cours de résolution, c'est probablement cette série de carte mère qui cause plein de problèmes, je n'y peux rien de plus que ce que je fais déjà, ça devrait être réglé bientôt avec un changement de carte mère.
Il n'y a plus que 3 sites sur ce serveur pour l'instant. Si les problèmes se prolongeaient avec le serveur 2, je les mettrai tous sur le serveur 1 qui a l'air de bien tenir depuis qu'il a une nouvelle carte mère. Le serveur 2 a toujours une ancienne carte, mais d'une autre série.