By Philidia on jeudi 4 juin 2015
Category: État des serveurs

Uptimeter #1 (Mai 2015)

 
Il s'agit d'un article expérimental. Vos retours sont les bienvenus !
 
Chaque début de mois est l’occasion de faire un récapitulatif des performances serveur le mois précédent. C’est le but de l’uptimeter !
 

 
Le mois de mai a été un mois tourmenté, mais pas par des problèmes serveurs graves. En conséquence, on retrouve de bons uptimes, affectés par les deux maintenances pour la mise en place des patchs 5.9 et 5.10, qui se sont toutes les deux déroulées sans problèmes particulier.
 

 

 
Mais l'uptime ne suffit pas à faire d'un serveur un serveur stable, et c'est pour cela que nous surveillons aussi les incident mineurs !
 
Dans le monde entier
 
Bonus de skin en ARAM :
Les bonus de skin sont restés désactivés pendant un petit moment, à cause d'un bug remonté par les joueurs au support, qui faisait que les skins obtenus par le bonus n'étaient pas reçus. Il était dû à une mauvaise communication entre plusieurs éléments de la plateforme, et il a fallu attendre le patch 5.9 pour le correctif.
 
Skins Samsung White :
Tout juste après qu'ils aient été mis dans la boutique, ces skins étaient impossibles à acheter. Riot les a donc désactivés le temps de les résoudre
 
Icônes des LCS en boutique :
Problème similaire aux skins des Samsung White. Les icônes ont eu des problèmes à l'achat dans la boutique, et les joueurs qui les avaient achetées ne les recevaient pas. Il a donc fallu attendre le patch 5.10 pour ceux qui les avaient achetées avant que Riot ne les désactive en boutique.
 

 
Et malheureusement, le pire peut parfois arriver. Il faut donc aussi relever les incidents majeurs !
 
Dans le monde entier
 
Drophack/Parties fantômes
 
Pendant le mois de mai, Riot a posté un communiqué concernant les problèmes de drophacks et de parties fantômes, en augmentation. Bien que le phénomène puisse encore se produire, Riot a commencé à bannir les comptes de ceux qui usaient de cette pratique, et on y apprend même que Riot a mis en place pour certaines personnes des interdictions légales d'accéder à leurs services, sous peine de poursuites judiciaires. Le phénomène devrait donc déjà s'être calmé un peu, et devrait arriver plus rarement dans les semaines à venir.
 
Sur les serveurs NA
 
05/05 : Problèmes de ping
 
Le 05 mai vers 04h00, les files classées sont désactivées par Riot sur les serveurs NA, pendant que Riot investigue sur des problèmes de ping qui impactent les parties. Une heure et demi plus tard, après investigation, Riot décide de procéder à une maintenance d'urgence, pour une durée d'une heure. La maintenance a finalement lieu de 07h30 jusqu'à 08h30. Bien que ce ne soit pas arrivé pendant une période d'affluence, les services ont été totalement indisponible.
 
09/05 : Problèmes de connexion au système de messagerie
 
Quelques jours plus tard, le 09 mai, un nouveau problème se produit vers 03h00 du matin. Les joueurs ne peuvent plus se connecter au système de messagerie, ce qui rend impossible le lancement de parties à plusieurs. Riot viendra à bout du problème environ 4h plus tard, vers 07h00 du matin. Là encore, ce n'était pas une période d'affluence, mais cela a considérablement affecté l'expérience de jeu !
 
09/05 : Problèmes de ping
 
Tout se serait alors bien passé si juste après avoir résolu ce problème, il n'avait pas fallu désactiver les parties classées suite à un nouveau problème, cette fois relatif au ping. Elles resteront désactivées pendant environ une heure.
 
26/05 : Problèmes de connexion au jeu
 
Le 26 mai, vers 01h00 du matin, les joueurs rencontrent des problèmes pour se connecter. Tous les joueurs ne sont pas concernés, mais ceux qui le sont ne peuvent simplement plus se connecter au jeu normalement. L'erreur étant assez aléatoire, il arrive qu'ils réussissent, mas ce n'est clairement pas optimal. Un problème grave qui a même provoqué la création d'un thread sur les forums par Riot. Notez que le problème n'est toujours pas résolu au moment où cet article est écrit, et qu'il apparaîtra donc par conséquent dans l'uptimeter du mois de juin. 
 

  
On termine avec le classement. Puisque c'est le premier article, il ne va pas être très étoffé, toutefois, cela vous donne un bon aperçu de ce à quoi ressemblera l'article chaque mois. Quoiqu'il en soit pour ce mois, et avec tous les incidents sur les serveurs NA, la qualité de service n'a pas été franchement excellente. Partout ailleurs, ce sont des incidents qui étaient globaux, donc, pas de classement à faire. Pour finir, et même avec ces problèmes sur les serveurs NA, l'uptime reste au-dessus de la barre des 99%
 
Incidents
 

 
Uptime
 

 

 
Dans les coulisses : Présentation de l’uptimeter
 
Quand une plateforme tombe, les réactions des joueurs arrivent souvent très vite sur les forums. On assiste alors souvent à un débat entre ceux qui pensent que les serveurs ne sont pas infaillibles, et que les crash peuvent arriver, et ceux qui pensent que Riot ne devrait pas avoir ce genre de problème avec tout l'argent qu'ils gagnent. La proportion des deux camps est en général régie par la durée des instabilités, et leur récurrence. Et le débat prend fin dès que les serveurs reviennent en ligne, et que chacun peut recommencer à jouer.
 
C'est une vision clichée et un peu péjorative, mais si on se limite aux forums, c'est réellement ça qu'on voit. Quoiqu'il en soit, nous avons décidé de mettre en place un nouveau type d'article pour mettre les choses au clair sur le sujet.
 
L'uptimeter : La mesure de l'uptime chaque mois
 
L'uptimeter consiste simplement en un article qui vous donnera chaque mois le récapitulatif des instabilités, et des statistiques sur les uptimes des serveurs, afin que vous puissiez voir qui a eu le plus de stabilité.
 
Ces statistiques incluent toutes les plateformes dont les données nous sont accessibles (EUW, EUNE, NA, BR, OCE, etc...), ce qui fait que les plateformes Asiatiques, gérées par Garena, ne font pas partie de ces statistiques.
 
Comment sont enregistrées les données ?
 
Pour enregistrer nos données, nous nous basons sur les pages officielles de statut des serveurs. Toutes les 15min, notre algorithme récupère les données affichées sur la page, et les enregistre, ce qui nous permet de conserver pendant une durée théoriquement illimitée toutes les données dont nous avons besoin, et de réaliser des statistiques détaillées tous les jours, semaines, mois, années, etc...
 
Les données sont stockées sur notre 2ème serveur, qui abrite toutes nos interfaces de tests et sites en développement. Ainsi, même si un incident se produisait sur le serveur de LoLTracker (Nous subissons des attaques par déni de service assez régulièrement, et il nous arrive d'avoir à effectuer des maintenances), les données continueront à être collectées, puisque le type d'incident que nous cherchons à éviter ne se produit pas sur notre 2ème serveur.
 
Une fois stockées, les informations sont récupérées et traitées par Sonia (D'où son apparition dans l'article). Il n'est pas dit qu'elle les traite à la perfection, mais on espère que tout va bien. Nous avons fait une relecture manuelle pour la première fois, et... C'était très pénible.
 
Qu'est-ce qui est enregistré ?
 
Tout ce qui est disponible ! Cela comprend le statut des serveurs, mais aussi les messages informatifs, comme les champions ou les fonctionnalités désactivées, les horaires prévus des maintenances pour une installation de patch, etc...
 
Les informations additionnelles nous permettront de déterminer dans nos statistiques la cause de l'indisponibilité des serveurs, la durée des incidents, et les éventuels désagréments rencontrés par les joueurs pendant la période ciblée.
 
Les limites de la technique d'enregistrement
 
Cette technique d'enregistrement a toutefois ses limites. Tout d'abord, nous ne nous basons que sur les pages officielles de statut des serveurs. Ce qui signifie que si un incident se produit et n'est pas signalé à cet endroit, notre algorithme n'en tiendra pas compte. Et si vous vous demandez pourquoi nous ne nous adressons pas directement aux serveurs en envoyant un simple ping pour vérifier le fait qu'il soit en ligne, c'est pour plusieurs raisons :
 
 
En clair, cet outil permet surtout d'avoir une vision des incidents généraux, et non pas de ceux qui affecteraient un serveur en particulier (Drophack, plantage, etc...), ou qui seraient liés à un opérateur, ou à des conditions particulières, sauf s'il y a un message informatif. Par exemple, dans cet article, nous aurions pu enfoncer un peu plus le clou sur les serveurs NA en citant les problèmes rencontrés par les joueurs clients du FAI Verizon, qui ont eu des problèmes à la fin du mois de mai. Mais comme il n'était pas signalé sur le statut des serveurs, nous nous en tenons à ce qui y est signalé.
 
À quelle fréquence vont sortir ces rapports ?
 
Si les tests de Sonia sont concluants, tous les mois ! On peut faire un point ponctuel en cas d'instabilités prolongées, mais globalement, un article par mois semble être une fréquence correcte.
 
Nous espérons que cet article suscitera votre intérêt ! Et si vous avez des suggestions d'améliorations, de présentation, de mise en forme, etc... N'hésitez pas à nous le dire dans les commentaires :)
 
Leave Comments