By Philidia on mardi 29 octobre 2013
Category: État des serveurs

28/10 : Message post-incident

 
Hier soir, deux incidents sont survenus sur la plateforme EUW, mais aussi sur les serveurs EUNE, Russes, et Turcs. Les deux incidents ont été rapidement corrigés, mais Tmx a tout de même donné des explications vis à vis des problèmes :
 
Invocateurs,

Nous avons eu une après-midi assez mouvementée en Europe hier, et je tiens à expliquer les problèmes que nous avons rencontré cet après-midi là. Il y a eu 2 problèmes réseaux similaires qui étaient liés à la bande passante de notre fournisseur du centre de données, ce qui a touchés les 4 serveurs de notre plate-forme européenne : EUW, EUNE, TR et RU.

Le premier incident a commencé vers 17 heures GMT, et a entraîné des déconnections du jeu et de la plateforme. Nous avons été informés par notre fournisseur qu'ils éprouvaient des problèmes de sursaturation sur l'un de leur principal réseau hôte et travaillaient activement à redémarrer le trafic. Cela a été réalisé dans les 10 minutes qui ont suivi, la panne générale a donc été réparé au bout de 20 minutes.

Le second incident est survenu 3 heures plus tard et était lié au matériel réseau de notre fournisseur. Les joueurs ont expérimentés des déconnections et des lags en jeu. La première série de reconnexions s'est produite lorsque notre partenaire a travaillé sur le réacheminement du trafic vers d'autres fournisseurs, puis la deuxième série de déconnections/reconnexions a été causé par la reconvergence du routeur et également à cause du fait que la liaison principale a finalement été rétabli.

Ce que Riot compte faire à ce sujet ? Notre plan à long terme est de gérer notre trafic réseau par nous-mêmes et ce sera possible lorsque nos plateformes seront déplacés à Amsterdam. Ceci a été communiqué il y a quelques semaines et nous sommes en bonne voie sur ce projet. Nous travaillons également sur ​​des solutions à court terme et sommes activement en communication avec les ingénieurs de notre fournisseur d'accès pour s'assurer que leurs itinéraires soient plus stables.

En outre, je tiens à préciser les raisons pour lesquelles certaines de vos parties n'ont pas été annulées. Le système de défaites annulées est actuellement une fonction manuelle qui doit être utilisée avec précaution en raison de son énorme impact sur l'ensemble du service en ligne. Ce système n'annule pas seulement vos défaites en cas de bug, il accorde aussi la moitié des points d'IP / XP pour les victoires, désactive également les files d'attente pour les parties classés et le Leaverbuster. C'est pourquoi nous l'activons avec prudence, et que nous réalisons toujours une enquête initiale de l'impact du bug sur les joueurs avant de prendre une quelconque décisions à ce sujet.


Le problème est lié au fonctionnement du système de défaites annulées : il ne concerne que les parties qui ont abouti pendant le temps de la prévention. Nous gardons généralement ce mode pour au moins une heure voire même plus pour nous assurer de toucher un maximum de parties existantes. Malheureusement, nous activons parfois ce mode trop tard, car 3, 5 ou même 8 minutes sont nécessaires afin de l'activer, et il est très probable que cela se produise au moment où certaines parties se finissent (exactement pendant le laps de temps d'activation du système de prévention des défaites). Vos scores ne sont donc pas touchés. Je suis sûr que nous parlons d'un petit pourcentage de parties prenant fin juste après que l'incident ait commencé, mais c'est toujours frustrant. Oui, nous avons remarqué de nombreuses plaintes sur ​​les forums, mais je vous assure que les 95% restant des parties durant le bug ont été annulées avec succès.

Nous sommes désolé des désagréments causés, et nous savons que nous avons du travail à faire pour améliorer cette fonctionnalité. Nous avons récemment effectué quelques changements qui seront opérationnels pour la mise à jour 3.13, qui nous permettra d'enclencher ce mode sur un seul serveur de jeu défectueux. De cette façon, nous serons en mesure d'aider les joueurs sur ce serveur particulier, sans affecter l'ensemble de la population. L'étape suivante consiste à réviser l'impact global du système de défaites annulées.

Encore une fois, ce n'était pas un autre problème spécifique au serveur EUW. C'était un problème qui a touché toutes les plateformes de l'Europe, indépendamment de la région ou de la taille. Ce n'était pas de notre côté, bien que nous en sommes tout de même responsable.

salutations,
TMX
 
 
 
Leave Comments