[Statistiques]Déterminer le pourcentage de toxiques grâce aux sujets qui s'en plaignent

Bonjour à tous. Parfois, il y a des threads sur les forums qui disent « Je viens de faire 3/4/5 parties et j'ai eu un flamer dans chacune d'entre elles, donc la communauté est toxique ». Ca ne va presque jamais au dela de 5 et dans tous les cas jamais au dessus de 6. Parfois, il y a des threads sur les forums qui disent « Dans mes parties, j'ai 80% de flamers, donc la communauté est toxique ». 80 étant généralement le pire des cas. On ne dirait pas, mais ces deux types de threads sont en totale contradiction. Je vais par conséquent vous démontrer que le premier type de thread permet de dire que le second n'est basé que sur un ressenti brouillé par divers effets psychologiques dont je ne parlerais pas ici. Non, en fait je vais même faire mieux. Je vais vous prouver, grâce au premier type de thread, que ceux qui disent que la communauté est toxique ont tort, et même que la communauté est composée en très grande majorité de personnes qui sont très loin d'être toxique. Pour ce faire j'ai créé un programme en python, dont vous pouvez retrouver le code [ici](http://textup.fr/162551aP). Il va simuler **15 397 816** joueurs faisant chacun **1000** parties. Lors de chacune de ces parties, le joueur aura une certaine probabilité de passer une mauvaise partie parce que lui ou un autre membre de son équipe s'est fait flame. Il va mesurer trois valeurs : Le nombre total de parties sur les mille où il y a eu au moins un flamer ; le nombre maximum de parties à la suite où il y a eu au moins un flamer, ou IFC (pour Indice de Flame Consécutif), il s'agit de la valeur donnée par ceux qui font le premier type de thread ; et le nombre maximum de parties par groupe de 10 parties où il y a eu un flamer, ou IFQ (Indice de Flame Quotidien, même si ça n'est quotidien que pour ceux qui font 10 parties par jour) (Personnellement, je ne trouve pas cette valeur utile mais je l'ai mise parce que c'est assez drôle de le voir je trouve). Nous allons prendre **5** valeurs pour cette probabilité : La première, c'est celle donnée par ceux qui viennent dire « **80%** des joueurs sont toxiques ». La probabilité d'avoir au moins un flamer parmis les 4 alliés du joueur si 80% des joueurs sont toxiques est de 1 – ((1 – 0,8)^4). Ce qui nous donne 99,84% de chance. Pour les bienfaits du calculs, nous l'arrondirons à 99% (En temps normal j'arrondis dans le sens qui va le moins dans mon sens, mais là si je le fais on passe à 100%, donc bon). Pour les deux suivantes, il s'agit de mes deux « limites basses » personnelles pour dire si une communauté est oui ou non toxique. Pour moi, une communauté est toxique si **20%** des membres de cette communauté le sont dans les cas où rien n'est fait pour empêcher la communauté d'être toxique, ou **10%** dans le cas contraire. Par conséquent, les probabilités d'avoir au moins un flamer dans ces deux cas sont respectivement de 59,04%, que nous arrondirons à 60%, et 34,39% que nous arrondirons donc à 35%. Pour les deux dernières, il s'agit de chiffres officiels. Vous pouvez voir [ici](http://boards.na.leagueoflegends.com/en/c/miscellaneous/l3wHwtIl-rewards-for-positive-play) que fin 2014, **5%** des joueurs actifs de l'année 2014 avaient reçu une sanction du Tribunal (avertissements non inclus). Vous pouvez voir [ici](https://youtu.be/nbYQ0AVVBGU?t=4m41s) (je vous recommande de la regarder en entier d'ailleurs si vous comprenez l'anglais, enfin pas tout de suite finissez de lire d'abord) que, selon les officiels, en 2013, il y avait **1%** de joueurs toxiques. Cela donne respectivement une valeur de 19% et de 4%. Laissons donc tourner les 5 programmes... Commençons donc par les données dans le cas où il y aurait **80%** de flamers. Nous avons dit plus haut que nous avons traduit ça par une probabilité d'en croiser un dans une partie à 99%. Voici le contenu du fichier [stats.txt](http://textup.fr/162761Nl) qui donne le nombre exact de flamers rencontrés sur 1000 parties, celui du fichier [statsconsecutive.txt](http://textup.fr/162762Dg) qui donne le nombre maximum de parties à la suite avec un flamer, et [statsday.txt](http://textup.fr/162763Wy) qui donne le nombre maximum de parties par groupe de 10 ayant un flamer. Du coup, comment allons nous les analyser ? Pour commencer, nous allons regarder si les données correspondent bien à ce que l'on attendrais avec ces valeurs. Pour ce faire, nous avons trois données possibles : La moyenne, la médiane et la modale (Et contrairement à ce que certains pensent, ce ne sont pas des synonymes). La **moyenne** est égale au nombre total de flamers rencontrés sur l'intégralité de l'expérience divisé par le nombre de joueurs. Ici, elle est de **990,000259**. Je ne le ferais que pour ce cas et également pour le dernier, parce que les autres valeurs ont une amplitude plus grande, et du coup elle est plus longue à calculer. Je le ferais si j'ai le temps, mais pas tout de suite. La **médiane** est la valeur « de la personne du milieu ». En gros, pour trouver la médiane, on classe tout le monde, et on prend la valeur de celui qui est à la moitié (ou, en cas de nombre pair, de la moyenne des deux personnes à côté). Dans notre cas, il s'agit de **990**. La **modale** est la valeur contenant le plus de personnes. Dans notre cas, il s'agit de **990**. Vous remarquez que ces trois valeurs sont égales (ou presque, mais la moyenne n'a même pas trois dix-millièmes d'écart), et elles sont également égales au nombre total de parties multiplié par la probabilité (1000 \* 99% = 990). Ce qui veut dire que ces données sont bien ce que nous attendions, il n'y a pas de bug dans le programme. A présent, prenons les stats consécutives, qui sont celles qui nous intéressent, et comparons-les avec la tendance que j'ai évoqué plus haut (à savoir, la plupart des threads qui se plaignent de X flamers à la suite se plaignent de 3, 4, ou 5 flamers à la suite). Je pense que je n'ai pas besoin de dire grand chose, la plupart ont des centaines de mauvaises parties consécutives, et c'est très loin de ce que l'on constate. Autrement dit, cette valeur est fausse, **il y a moins de 80% de flamers dans le jeu**. Puis, continuons avec les données contenant **20%** de flamers (60% de possibilité d'en croiser un dans une game). Voici [stats.txt](http://textup.fr/162685AR), [statsconsecutive.txt](http://textup.fr/162687dL) et [statsday.txt](http://textup.fr/162686Vi). La modale est ici à **600**, comme pour l'autre valeur, je ne vais pas tout ré-expliquer, c'est exactement ce à quoi nous nous attendions. La médiane est également à **600**, ici c'est pareil, c'est exactement ce à quoi nous nous attendions. Dans ce cas, 75% des joueurs constatent un nombre de flamer consécutif compris *entre 10 et 14*. Retournez un peu plus haut pour voir le raisonnement qui est exactement le même, **nous sommes très loin de la réalité**. Maintenant, essayons avec les données avec **10%** de flamers (35% de probabilité d'en croiser un dans une game). Voici [stats.txt](http://textup.fr/162681qz), [statsconsecutive.txt](http://textup.fr/162682Uf) et [statsday.txt](http://textup.fr/162683pK). Comme les deux cas précédents, la modale est à 350, ce qui correspond à notre probabilité de départ, et 350 est bien notre valeur médiane. Ici, 83% des joueurs expérimentent un maximum de flamers consécutifs compris *entre 5 et 7*, et nous sommes encore très loin de la réalité. Nous n'y sommes toujours pas, mais nous en sommes beaucoup moins loin. Autrement dit, cela veut déjà dire que **selon mes critères personnels, la communauté n'est pas toxique**. Mais nous pouvons aller encore plus loin. (Petit fait rigolo, notez le petit malchanceux qui a eu VINGT-HUIT flamers à la suite, alors que le second plus malchanceux n'en a eu que 22) A présent, passons aux données avec **5%** de flamers (19% de probabilité d'en croiser un dans une game). Voici [stats.txt](http://textup.fr/162680Xz), [statsconsecutive.txt](http://textup.fr/162679Rj) et [statsday.txt](http://textup.fr/162678bq). Ici encore, la modale est à **190**, ce qui correspond à notre probabilité de départ. **190** est également notre valeur médiane, ce que l'on s'attendait à avoir avec ces valeurs. Ici, 81% des joueurs expérimentent un maximum de flamer consécutif *de 3 ou de 4*. C'est déjà beaucoup plus proche de la réalité que les trois autres valeurs, cependant, j'ai trouvé (ce n'est qu'une impression malheureusement) qu'il y avait à peu près autant de threads à 3 flamers consécutifs que de threads à 4 flamers consécutifs. Or, une personne ayant 4 flamers à la suite a une plus forte probabilité de se plaindre que si elle en avait 3, ce qui m'indique qu'il devrait y avoir moins de 4 que de 3. Ce qui n'est pas le cas. Mais **nous sommes ici très proche de la vérité.** Essayons à présent de voir les dernières données à **1%** de flamers (4% de probabilité d'en croiser un dans une game) pour voir ce qu'elles pourraient apporter. Voici [stats.txt](http://textup.fr/162558YZ), [statsconsecutives.txt](http://textup.fr/162559qm) et [statsday.txt](http://textup.fr/162560Xd). Comme d'habitude, **40** est notre valeur médiane, modale, et notre moyenne (que j'ai pris la peine de calculer cette fois parce qu'il n'y avait pas trouzmille valeurs) est de 40,0005404, bref, tout ceci correspond bel et bien à ce que l'on attendrais avec une telle valeur. Ici, 93% des joueurs ne vont jamais jusqu'à avoir plus de *2 joueurs négatifs à la suite*. Ce n'est toujours pas ce qui est ressenti, mais dans l'autre sens. Il ne s'agit que d'une estimation, mais il y a bien plus de probabilités d'avoir trois flamers à la suite. Et j'ai déjà vu des threads me disant qu'il y a eu 6 flamers dans une même journée de 10 parties, alors que cela ne concerne qu'un joueur sur dix mille dans cette situation. Donc, ici, **nous nous sommes éloigné de la réalité. ** Autrement dit, le vrai taux de joueurs négatifs doit se trouver quelque part **entre 1% et 5%**, pour un pourcentage de parties se passant mal entre 4% et 19%. Au delà, nous aurions déjà vu apparaître beaucoup moins de sujets pour dénoncer 3 ou 4 parties à la suite et beaucoup plus pour en dénoncer 8 ou 10. (Personnellement, je pense qu'il tourne autour de 3% ou 4%, je ferais peut-être le test avec cette valeur un jour, pour voir ce que cela donne, mais pas tout de suite, le programme est quand même long à faire tourner) Du coup vous pourriez vous demander, « Mais, vu que ça t'a aidé pour ton étude, au final QQ c'est bien, non ? », et la réponse est non. La raison tient en trois mots : « Biais de confirmation ». Je m'étais promis de ne pas faire de psychologie de comptoir dans ce thread, aussi je vais faire court : Plus quelqu'un va voir une information, plus ce quelqu'un va se dire qu'elle est vrai. Si un joueur voit souvent quelqu'un dire que la communauté est toxique, il finira par le croire et ignorer le reste. Vous pourriez également me répondre « Ce que tu oublies de préciser, c'est que les joueurs toxiques ne flament pas dans toutes leurs parties et qu'il n'y a pas qu'eux qui flament ! ». Effectivement. Et les deux se contrebalancent. Si vous allez très légèrement plus loin dans la vidéo que je vous ai montré, il est dit que, en réalité, la vaste majorité du flame vient de personnes qui sont positives ou neutres. Ce qui veut dire que toutes ces personnes, qui sont en temps normal positives ou neutres, ne font pas parties des personnes toxiques. Elles vous paraissent cependant toxiques, mais ne le sont pas. Le truc, c'est que ces personnes sont inclues dans les probabilités de passer une mauvaise partie à cause d'un méchant. C'est à dire qu'elles y sont déjà de base. Certains me reprocheront également d'avoir pris un nombre bien plus grand que l'intégralité de la communauté de LoL, ce qui fait que certains nombres de flamers consécutifs existent là où ils n'existeraient pas réellement, même si le chiffre était exact. A ceux là, relisez ce que j'ai écris, et remarquez que je ne parle qu'en proportions, et uniquement des tendances. Parce que ce sont les tendances qui m'intéressent, et non les cas particuliers qui ont une chance sur un million d'arriver. Enfin, vous pourriez également dire « Mais, qu'est-ce qui te dit que tous ceux qui viennent dire qu'ils ont x parties avec un flamer à la suite se souviennent de tous les flamers qu'ils ont eu à la suite ? » (en gros, quelqu'un venant se plaindre de 4 flamers à la suite aurait pu en avoir 10 à la suite), et la réponse vient de la psychologie. Je ne vais pas rentrer dans les détails, mais en gros : Etant donné que les évenements négatifs ont plus d'importance, les personnes pour lesquelles c'est le cas sont trop peu nombreuses pour être statistiquement représentatives. Même si les parties sont séparées par plusieurs heures, voire jours, le fait qu'il y ait un lien négatif entre les deux (en l'occurence, un flamer) permet de les « coller » dans l'esprit du joueur, qui s'en souviendra donc parfaitement au moment de se plaindre. Plus on augmente ce nombre, moins ce que je viens de dire est vrai, certes, mais il faut atteindre des valeurs assez surprenantes avant d'avoir un effet significatif, et ces valeurs ne sont clairement pas atteintes à 10. D'ailleurs, si vous voulez aller plus loin, sachez que le graphique du nombre total de flamer, quelque soit la valeur, ressemble fortement (ce n'est pas exactement le cas, mais ça y ressemble énormément) à une courbe en cloche, caractéristique d'une distribution dite normale. Je ne saurais trop vous inciter à vous renseigner sur ce sujet. Tout ça pour dire une chose : Vous passerez en moyenne entre 40 et 190 matchs sur 1000 à voir quelqu'un de votre équipe flame. Et par conséquent, seuls 1 à 5% des personnes que vous croisez sont toxiques dans la partie dans laquelle vous les avez croisés. Si ça n'était pas vrai, si la communauté de League of Legends était vraiment toxique, les boards ne seraient pas dans l'état dans lequel ils sont aujourd'hui, et les threads pour « J'ai eu 8/9/10 parties avec un flamer à la suite ! » se seraient déjà multipliés.
Partager
Signalé comme :
Offensant Spam Harcèlement Forum incorrect
annuler