Déménagement de notre infrastructure serveurs

Afin d'améliorer la qualité de service, l'ensemble de notre infrastructure serveur va être renouvelée


Vous l'avez peut être remarqué, ces dernières semaines nous avons rencontré différentes indisponibilités ou ralentissements, tant sur SityTrail classic que dans la nouvelle version beta. Différents facteurs que nous vous expliquerons ici ont causé ces problèmes et nous avons décidé de prendre la mesure de ceux-ci afin de déployer une solution.

Publié le 26/09/18 - Mis à jour le 03/10/18

Passez directement en bas de l'article pour les informations concrètes sur les mises à jour serveur à venir.


Petite rétrospective des différents problèmes rencontrés


Au cours de ces dernières semaines, notre équipe de gestion de l'infrastructure, commune en partie avec l'équipe de développement a eu énormément de travail, jour et nuit pour vous permettre d'utiliser SityTrail. 


SityTrail, c'est avant tout près de 400.000 membres, qui dans l'ensemble, se connectent à nos solutions au travers des sites web et aussi des applications mobiles. Cette quantité impressionnantes d'utilisateurs demande des serveurs dimensionnés pour supporter la charge et stocker toutes ces données. 


Au fil des années, l'infrastructure serveur a été améliorée pour suivre notre croissance, en augmentant la quantité de serveurs, les points d'interconnexion au réseau,  en ajoutant des systèmes de répartition de charge, de protection contre les attaques, etc. 


Lorsque nous vous avons proposé la nouvelle version SityTrail Beta, nous avons pris la décision d'utiliser des systèmes indépendants de nos solutions historiques, tant d'un point de vue logiciel, que matériel, permettant ainsi de scinder complètement les deux plateformes en prévoyant le fait d'augmenter au fur et à mesure la capacité serveur pour les nouvelles solutions tout en réduisant celle de l'ancienne solution. 


Malheureusement, au cours des mois de juillet-aout, en pleine haute saison, les serveurs abritant l'ancienne plateforme SityTrail classique, ont commencé l'un après l'autre à rencontrer des problèmes matériels. Les machines étant toutes du même modèle et de la même marque, les problèmes ont été similaires et parfois simultanés. 


Nous étions bien sur équipés de systèmes permettant de mitiger les pannes matérielles en transférant la charge vers d'autres serveurs en cas d'incident, cependant le cumul de pannes simultanées nous a finalement amené à un point critique ou nous ne disposions plus d'assez de serveurs pour tenir la charge, tout en conservant le risque d'une panne matérielle sur les serveurs qui continuaient à fonctionner. 


Début août, la décision a donc été finalement prise dans l'urgence de transférer l'ensemble des composants de l'ancienne plateforme vers nos nouveaux serveurs, déjà en charge de l'hébergement de la nouvelle version beta. L'idée qui était bonne au départ est rapidement devenue toxique pour les deux solutions, qui ont eu quelques soucis de cohabitation : d'une part l'ancienne solution a subi quelques incidents lors de son déménagement et d'autre part la nouvelle solution s'est sentie "à l'étroit", sans compter les différents conflits au niveau du réseau qui ont été provoqués. 


À aucun moment, nous n'aurions pu prévoir ces différents problèmes, qui se sont posés malgré les mille précautions et la plus fine des planifications de notre équipe technique, qui a travaillé d'arrache-pied pour conserver un service fonctionnel et sans perdre à un seul moment une seule de vos données. 


Actuellement, nous sommes revenus à une situation stable, sur une infrastructure hybride mêlant des anciens et nouveaux-serveurs, sur lesquels cohabitent les deux versions 


Quelles sont les solutions prévues ?


Afin d'apporter une solution à la hauteur du problème, nous avons décidé de remplacer la totalité de notre parc serveur par de nouvelles machines, plus récentes, plus performantes, et dimensionnées de manière et de multiplier par 10 la capacité réseau.


En outre, un second data center, sur un site distinct sera en parallèle mis en place afin de palier à d'éventuelles pannes qui pourraient affecter notre data center principal.


Dès réception du nouveau matériel et installation de celui-ci, nous allons progressivement déplacer, service par service les différents organes des solutions SityTrail sur les nouveaux serveurs. Une planification très précise des migrations a été effectuée en interne afin de minimiser les interruptions de service. 


La transition va se passer sur une période de deux semaines, débutant le 03 octobre 2018. Durant cette période, il est donc possible que certains services soient momentanément indisponibles pendant de courtes périodes. Nous serons également amenés à tester différents scénarios de panne et d'attaque informatique afin de nous assurer du bon fonctionnement de tous les systèmes de sécurité et de redondance mis en place, pouvant provoquer certaines micro-coupures ou déconnexions.  


A aucun moment vos données ou la confidentialité de celles-ci ne seront impactées par ces changements et ces tests. 


Afin de vous tenir informé de l'évolution des travaux, nous vous rappelons qu'un compte Twitter spécifique a été mis en place pour toutes les problématiques relatives à nos solutions. Vous pouvez consulter les différentes informations de ce flux même si vous n'êtes pas membre ou utilisateur de Twitter.


Le flux est accessible sur la page suivante : https://twitter.com/geolives_status

À propos de la pub

D'autres articles à lire

Beaucoup de belles surprises sont au rendez-vous. Ceci aussi bien sur le site Web que dans l'application pour iPhone !  

Les cartes de SityTrail World vous sont offertes jusqu'au dimanche 29 juillet 

Les cartes topographiques du Monde sont offertes jusqu'au mercredi 18 juillet pour un abonnement à SityTrail France 

Les beaux jours et les vacances sont là... Il n'y a pas meilleure occasion pour se dégourdir les jambes et partir à la découverte de so... 


Fermer

Fonds de plan