6/05/2018

Curiosidad Estadística


Estuve hace unos días leyendo a Mark Clattenburg, él trataba de explicar un poco sobre los estilos de los árbitros de las diferentes confederaciones. Sin embargo, la curiosidad me mató: muchas de las cosas que decimos o hablamos sobre los árbitros son empíricas o basadas en percepciones sin bases estadísticas. Por eso, de la curiosidad que me picó, empecé a realizar un análisis sobre los 298 partidos en torneos FIFA que han dirigido los árbitros que estarán en el mundial dentro de un par de días.
He aquí algunas de las cosas encontradas...

*Nota post publicación: me disculpo si me pongo un poco técnico en el siguiente párrafo sin explicarme del todo, pero, en resumen, aquí aseguro que los datos son viables para un análisis confiable*

Preámbulo: Recolección de Datos
Para contar un poquito del proceso de recolección de datos y dar fundamentos a todo: fui, uno por uno, por los partidos que dirigieron los árbitros seleccionados como principales (los que no son "especialistas en VAR" como los llaman algunos) en torneos FIFA, es decir, Mundiales, Confederaciones, Juegos Olímpicos, Mundiales de Clubes y Mundiales de categorías menores.
De ahí tomé varias informaciones: cantidad de goles, faltas, tarjetas amarillas, rojas, penales. Para un par de datos que hacían falta (de torneos olímpicos o torneos muy viejos) realicé una regresión lineal con stata basado en las estadísticas completas que tenía y las confederaciones de donde venían los equipos. Con los datos completos realicé tests de correlaciones, homocedasticidad y heterocedasticidad para garantizar independencia de los datos que, afortunadamente, se distribuían de forma normal en casi todos los casos. Ya, con esa garantía, comenzó el juego diseñado saciar mi curiosidad y derribar algunos mitos y verdades.
PD: Para los más puristas, pasé después los datos a excel con el fin de tener gráficas un poco más bonitas

Información Básica: Cantidad de partidos analizados por Confederación
Para el análisis se utilizaron 298 datos, donde se tiene una alta participación de UEFA (23,49% de los partidos) explicado por la cantidad de árbitros que participan en los torneos FIFA.
Adicionalmente, AFC y CONCACAF tienen una alta participación 22,82% y 21,81% respectivamente, inflados por sus dos referentes de experiencia: Irmatov y Aguilar, quienes llevan más de 10 años participando en este tipo de torneos. Al otro extremo está OFC pues, para nadie es un secreto, si logran tener dos partidos en cada torneo parece ser mucho, la FIFA no les confía mucho más.

Aspecto 1: Goles 
Lo primero que analicé fue la variabilidad en la cantidad de goles que se marcaban en los partidos, segmentado por Confederaciones.
Para eso, aprovechando la normalidad de estos datos, utilicé un par de diagramas de cajas o "box-plots" para el respectivo análisis.

Esta gráfica nos enseña varias cosas: 
La mediana  (línea en la mitad de las cajas) y la media (x dentro de las cajas) de los datos es muy similar para cada una de las confederaciones, lo que demuestra que, a la hora de marcar goles, no existe una gran diferencia entre los datos dependiendo de la confederación del árbitro.
Sin embargo, es curioso que a los árbitros de CONMEBOL y los árbitros de la OFC no les tocara aún partidos sin goles, sobretodo en el caso de CONMEBOL pues son 46 partidos los analizados.
Por otro lado se evidencia una alta variabilidad en los datos de CAF, donde el intervalo de confianza del 95% para los goles (distancia entre los bigotes, es decir, las líneas de los extremos) está entre 1 y 9. Es decir, tanto varían los datos que es casi imposible de predecir la cantidad de goles que habrá en sus partidos, a diferencia de OFC donde, de cada 100 partidos, podríamos asegurar de manera estadística que habrá entre 2 y 6 goles, siendo esta la confederación con menor variabilidad, en parte explicada por la cantidad de datos analizados.
Esto es reforzado por el tamaño de las cajas pues, recordemos, este nos dice entre que valores se encuentran el 50% de los datos. Por ejemplo, el 50% de los partidos analizados de los árbitros de UEFA tuvieron entre 3 y 5 goles, cifra igual a los árbitros de Conmebol y AFC, por más que las medianas sean diferentes.
En general estos datos confirman la primera primicia que tenemos en inculcada de mayoría de personas que seguimos este deporte: el fútbol es impredecible, tanto así que, por más que un árbitro pueda influir en un partido, la cantidad de goles que se marcan no se ve afectada por la confederación de donde provienen.

Aspecto 2: Tarjetas Amarillas
Si, lo sé, he peleado mucho por esa diferencia cultural sobre la forma de sacar tarjetas amarillas, el "management" que llaman algunos a mí no me convence, pero en esto quería ir más allá. Yo, al menos, tenía una concepción errada donde creía que los sudamericanos mostrábamos más tarjetas amarillas, incluso nos llamaban tarjeteros por algo, mientras, algunos, hablaban maravillas de como se escatimaban tarjetas los europeos. Acá va el primer mito que romperé:


Es curioso: ¡En CONMEBOL tenemos la media de tarjetas amarillas más bajita en torneos FIFA con los árbitros que seleccionaron para el mundial! ¡Todo lo contrario a lo que piensa la mayoría! Claro que la diferencia puede no ser tan notoria, con respecto a otras confederaciones porque termina siendo una cuestión decimal, pero no deja de sorprender. Más aun porque los árbitros que más amonestan son los de UEFA, con un promedio superior a las 4 amarillas por partido mientras nosotros estamos muy cerca a las 3 tarjetas por encuentro.
Incluso con el dato atípico más alto es de nada más y nada menos que de UEFA, si, con Skomina hace muchos años, cuando apenas empezaba en los Olímpicos de 2008, pero no deja de ser una anomalía interesante que derriba completamente un mito existente.
Me parece además interesante confirmar el comportamiento tan similar entre CONMEBOL y CONCACAF, cuyos partidos tendrán, con un 95% de confianza, entre 0 y 7 amarillas por encuentro, estando con una variabilidad más alta CONMEBOLcuyo grueso de amarillas se ubica entre 1 y 4 contrario a las 2 y 4 de CONCACAF.
Por otro lado será interesante estudiar a fondo esa variabilidad dentro de AFC, no sé si tanta dispersión sea por tener dos "estilos" de árbitros dentro de la confederación, tarea que exploraremos a fondo en próximas entradas, cuando revelemos los perfiles de los árbitros que estamos preparando junto a las estadísticas comparativas inherentes a cada una de las regiones.

Aspecto 3: Faltas Por Partido
El hecho de refutar mis dos pensamientos iniciales en cuanto a las amarillas me llevó a explorar un poquito más a fondo el tema, y estudiar su relación con la cantidad de faltas. En un inicio, arriba, les contaba que había hecho pruebas de correlación entre los datos y no había hallado nada. De todas formas pasé por un diagrama de dispersión comparativo entre UEFA y CONMEBOL que me relacionara la cantidad de faltas con la cantidad de tarjetas amarillas. Los datos, no sé si lastimosamente, no se correlacionaron, por lo cual fui más allá y comparé la cantidad de faltas en cada uno de las regiones.

En este aspecto CAF se debe llevar todas las miradas: son los que más faltas pitan, el 50% de sus partidos tiene entre 27 y 36 faltas, teniendo como valor inferior del intervalo de confianza del 95% 15 faltas.
También es curiosa la cantidad de datos atípicos dentro de CONCACAF, algo que será bonito analizar internamente: ¿los ocasionará un mismo árbitro que es más riguroso que los demás? tendremos que respondernos esa pregunta más adelante.
Por otro lado veo acá un comportamiento muy de extremos en AFC, hay mucha variabilidad entre los datos extremos, pero no tanta en los centrales, parecido a lo que sucedió en el gráfico de las tarjetas amarillas será importante analizar el caso a fondo cuando lo segmentemos por árbitro.
Por último, el detalle en CONMEBOL: parece ser un punto medio: una caja no tan grande, pero similar a la de UEFA, e incluso un intervalo de confianza más pequeño con valores más bajos.
De todas formas desde acá quiero desmentir un poco la teoría de Clattenburg, donde decía que los árbitros de AFC eran riguroso y cumplían al pie de la letra el reglamento: estadísticamente, no son los que más faltas pitan ni los que más amarillas muestran, a pesar de ciertas desviaciones que pueden ser inherentes algunos árbitros. Tal vez a fondo veamos esas diferencias cuando analicemos los casos, como pensaría yo había entre Nishimura y Al-Ghamdi por dar un ejemplo, pero la generalización que hizo me parece poco acertada a la luz de estos datos.

Aspecto 4: Expulsiones por Partido
Analizar las expulsiones por partido puede tornarse tonto, pues sabemos que en torneos FIFA suelen ser hechos esporádicos (o, al menos, bastante menos recurrentes que en las ligas locales o en torneos como la Libertadores). Sin embargo me animé, por curiosidad, a hacer el gráfico, para que así fuera solo nos mostrara las medias con el mismo formato de las anteriores, aunque, oh sorpresa, sí salió un aspecto interesante.

La media más alta la tiene UEFA, y la más baja otra vez CONMEBOL. Todos tienen el 50% o más de sus datos en 0, con par de datos atípicos que son las expulsiones. En CONMEBOL y OFC con una sola, en AFC y CAF se llegó a tener dos en un mismo partido.
Sin embargo, acá el caso interesante es UEFA: el grueso de sus datos incluye el 1, es decir, en el 50% de sus partidos se expulsó uno o no se expulsaron jugadores. Y, aunque parezca una obviedad, en el 95% de sus partidos se espera que se expulse 0, 1 o 2 jugadores. ¿Por qué hago notar esta obviedad? Porque en el 95% de los partidos de los demás se espera que no se expulse a nadie, haciendo una expulsión una rareza, mientras se convierte en algo más común cuando el árbitro es europeo. ¿Fascinante, no lo creen?

Aspecto 5: Penales por partido
Acá esperaba tener un comportamiento muy similar al de arriba, no tenía razones para esperar que los penales fueran algo más "usual" en los torneos, FIFA. Sin embargo, los datos nos indican que sí lo son, es más fácil ver un penal que una roja, con todo lo que eso puede implicar, sin embargo, es curioso volver a ver sendas diferencias en algunos casos.

Al igual que con las expulsiones, ver a un árbitro de CONMEBOL u AFC pitando uno parece ser una anomalía gigante, al punto tal que se esperaría que, de cada 100 partidos, en 95 no pitaran penales. Las medias de ambos se diferencian por centésimas, siendo un poco más baja la de AFC
Por otro lado tenemos un comportamiento simétrico entre CAF, OFC y UEFA, donde el 50% de sus partidos tienen entre 0 y 1 penal. En UEFA tenemos el dato atípico más alto con 3 penales en un mismo partido, al mismo tiempo que tienen la media más alta de todos.

Resumen de lo encontrado
(1) Goles por partido: Indiferente
(2) Amarillas por partido: Mayor cantidad en UEFA, menor cantidad en CONMEBOL
(3) Faltas por partido: Mayor cantidad en CAF, menor cantidad en OFC
(4) Expulsiones por partido: Mayor cantidad en UEFA, menor cantidad indiferente entre el resto.
(5) Penales por partido: Mayor cantidad: UEFA/CAF/OFC, menor cantidad AFC/CONMEBOL.

Ver todo esto me hace pensar en la "preferencia", si podemos llamarla así, de Busacca con UEFA. En 2014 lo enfocábamos (yo, y varios más que nos creemos analistas de todo esto) a la cantidad de tarjetas y faltas que se mostraban, pero analizando a fondo estos datos me atrevo a decir esa inferencia está errada.
No sé si los mundialistas lean esto con el tiempo suficiente para cambiar sus aproximaciones tácticas, pero estadísticamente queda derrumbado el mito de que, a mayor cantidad de tarjetas, menos oportunidades tienes en los torneos FIFA.
En UEFA muestran, estadísticamente, una toma de decisiones cruciales más alta (sin meternos a discutir cuantas fueron correctas, cuantas erradas y cuantas ignoradas) que el resto de las regiones. A mí esto me pone a pensar seriamente en factores más allá del político que puedan guiarnos hacia el estilo de arbitraje que esperan ver los dirigentes en la Copa del Mundo.
No sé si analizando a fondo cada árbitro encontremos otros factores o datos que nos permitan comprobar algunas sospechas o derribar otros mitos, pero, por ahora, tenemos un primer paso para seguir discutiendo.


5 comentarios:

  1. Toda a análise que se faça em relação a arbitragem da Copa do Mundo da Rússia é válida. No entanto, a confraria do apito que vai laborar na aludida competição, foi doutrinada com uma concepção totalmente diferente nos últimos quatro anos, dos demais torneios que se disputam no planeta. O mundial de futebol tem interesses e nuances que ultrapassam toda e qualquer expectativa que possamos elucubrar. Só teremos uma visão macro do que foi realizado por Massimo Busacca e Pierluigi Collina, aos árbitros e medir suas atuações, a partir do momento que a bola rolar a partir do próximo dia 14.
    Valdir Bicudo - Apito do Bicudo

    ResponderEliminar
    Respuestas
    1. Precisamente por eso el análisis es solo de los torneos FIFA donde, se supone, ellos han puesto en práctica lo que esperan Busacca y Collina.
      Saludos

      Eliminar
  2. Hi, thanks for your deep and clear analysis. Could we have access to the specific data for each referees, like in a excel file, with the absolute or relative frequencies for each referee?

    For example I do not understand how CONMEBOL referees can have a lower red card rate per game than UEFA, when you have referees such as Roldan (0,6 per game) or Ricci (0,4) with much higher odd than UEFA (usually between 0,15 and 0,25).

    (My data come from "World referee" database, and do not consider only the last 4 years, but still it should not be too different. For example, Roldan has a very high red card rate also in the last couple of years).

    Thanks and good luck to Pitana, Ricci, Caceres, Roldan, Cunha and Bascunan from a European reader!

    ResponderEliminar
    Respuestas
    1. Hi!

      Im going to do it, (It´s expected to be ready this weekend) BUT take into account its only done with the FIFA tournaments and not the continental ones.
      If we take Copa Libertadores or Concacaf Champions League, for example, Im pretty sure we would see a different tendency like you said before, with higher averages.
      Furthermore I really liked this exercise because it shows us exactly what you pointed out: referees from some confederations adapt themselves to FIFA "rules" and, maybe, it has a big effect on their performances.

      Eliminar
    2. Muchas gracias Carlos!

      Now everything is clearer to me. And I see what you mean by FIFA "rules" ;) let's just hope that certain referees don't get trapped by those rules as in 2014.

      Eliminar

Todo comentario es responsabilidad única del autor del mismo, los comentarios no reflejan la postura del blog sobre sus diferentes temas...