www.sousmarinmarsouinperledelatlantique.com

www.sousmarinmarsouinperledelatlantique.com

Panne des fichiers : le récapitulatif détaillé et les actions prévues ...( suite N°2 ) par KingLouis, webmaster de Blog4ever


Chers blogueurs,

Comme promis voici un récapitulatif plus détaillé des évènements liés à la coupure du Dimanche 14 Février 2016 ainsi que des solutions techniques en train d'être mises en place. 

Le récapitulatif jour par jour

Quelques mots sur l’infrastructure de Blog4ever

La plateforme tourne avec 4 serveurs :
- un serveur « web » qui contient tout le code de l'application
- un serveur de base de données qui contient les articles, commentaires, messages de forum, réglages, … et de nombreuses autres données
- un serveur de fichiers qui contient principalement les images des blogs mais aussi les autres fichiers, les fichiers des designs (CSS), les flux RSS, les avatars, ...
- un serveur de backup qui contient une copie de tous ces serveurs

L’ensemble est infogéré par notre hébergeur, Digital Network, qui administre et surveille ces serveurs 24h/24, 7 jours sur 7. Ce sont eux qui ont géré toute cette coupure car ils ont la main directe sur les serveurs.
Nous avons surtout été un relais de communication.

Dimanche

Dans l’après-midi, un des disques dur du serveur de fichiers se montre HS (erreurs de type CRC).
Cela arrive parfois et ce n’est pas grave car il y a plusieurs disques durs qui se copient les données entre eux, donc si on en remplace un automatiquement il va récupérer les données des autres.

Cependant juste après ce remplacement des erreurs sur un autre disque apparaissent, empêchant la copie sur le nouveau disque ajouté et présentant donc un risque de perte de fichier.
Cette situation a une probabilité très faible d’arriver.

L’hébergeur décide alors d’utiliser le serveur de backup comme serveur de fichiers en lecture pour que les fichiers des blogs restent disponibles.
L’ajout de fichier est nécessairement coupé.

Là, une erreur encore différente survient sur le serveur de backup (erreurs d’entrée-sortie).

Nous repassons donc sur le serveur static mais en lecture seulement.

Lundi

Le serveur static tombe et sa charge remonte dès qu’on le rallume. Il faut donc le couper.

L’hébergeur met en place un nouveau serveur de fichiers pour y copier les données depuis le serveur de backup et permettre les ajouts de fichiers.

Il lance alors deux copies :
- une copie depuis le serveur de backup vers ce nouveau serveur, qui se fait fichier par fichier et rend donc les fichiers accessibles progressivement
- une copie depuis l’ancien serveur de fichiers vers un autre nouveau serveur, qui se fait en mode bloc et prend donc du temps. Ce mode de copie est long car il copie toute l’image du disque, même les parties vides.

Mardi / Mercredi / Jeudi

Les copies continuent.

La copie depuis le serveur de backup se termine jeudi. Certains fichiers sont encore absents et doivent être récupérés depuis l’ancien serveur de fichiers qui est toujours en copie.

Vendredi / Samedi / Dimanche

La copie de l’ancien serveur de fichiers continue, elle termine Dimanche

On peut maintenant accéder aux fichiers qui sont sur ce serveur mais n’étaient pas sur le serveur de backup, notamment ceux des blogs créés en 2015.
Les restaurations sont lancées.

Lundi

Les restaurations continuent progressivement sur les fichiers manquants.

En parallèle, l’hébergeur met immédiatement en place un second serveurs de fichiers en miroir du premier, pour éviter une nouvelle coupure.

Les prochaines étapes

Globalement on va jouer sur 2 aspects :
- limiter le risque de coupure en répliquant les fichiers sur plusieurs serveurs. Cela implique des couts supplémentaires pour louer ces autres serveurs.
- répartir les fichiers sur plusieurs serveurs plus petits, pour limiter l’étendue des problèmes et accélérer la restauration en cas de problème. Cela implique des modifications dans notre application.

Pour le premier point, il existe des systèmes pour copier en temps réel les fichiers. Nous pouvons aussi faire en sorte qu’à l’ajout d’un fichier il soit copié en même temps sur 2 serveurs différents.

Pour le second point, il y a plusieurs façons de répartir : cela peut être par année de création des blogs, par année d’ajout des fichiers…

Dans tous les cas cela n’aura pas d’incidence sur l’affichage de vos blogs.

Nous restons à votre écoute si vous avez des questions sur les événements ou sur les évolutions prévues.

Bonne Journée ...

 

Fernand vers King :

 

905668smiley.jpg



26/02/2016
2 Poster un commentaire

A découvrir aussi


Inscrivez-vous au blog

Soyez prévenu par email des prochaines mises à jour

Rejoignez les 145 autres membres