Cómo interpretar el xG para pronósticos ganadores

Jugador de fútbol disparando a portería en un estadio iluminado

El fútbol moderno ha dejado de ser un deporte donde los resultados se explican con frases como "jugaron mejor pero no tuvieron suerte". Hoy, esa supuesta mala fortuna tiene nombre, apellido y un valor numérico: se llama Expected Goals, y si no lo estás usando para tus pronósticos, estás apostando con una venda en los ojos mientras tus competidores ven en alta definición.

El concepto es engañosamente simple. Cada disparo a portería en la historia del fútbol profesional ha sido catalogado, medido y analizado. Distancia al arco, ángulo, posición del portero, presión defensiva, tipo de asistencia previa. Millones de datos que, procesados mediante algoritmos de machine learning, nos dicen algo fundamental: la probabilidad real de que un disparo termine en gol. Un tiro desde el punto de penalti tiene aproximadamente 0.78 xG, lo que significa que históricamente el 78% de los penaltis se convierten. Un remate desde 30 metros con tres defensas delante quizás llegue a 0.02. Esa diferencia entre lo que un equipo "debería" haber marcado y lo que realmente marcó es donde reside el verdadero valor para el pronosticador inteligente.

El origen de una revolución estadística

Sam Green, trabajando para Opta en 2012, publicó un análisis que cambiaría para siempre la forma de entender el fútbol. Estudiando la temporada 2011-12 de la Premier League, llegó a una conclusión que entonces parecía contraintuitiva: Luis Suárez, con solo 11 goles en su primera temporada completa en el Liverpool, había sido "especialmente desafortunado frente al arco". Los datos de expected goals sugerían que debería haber marcado considerablemente más. La siguiente temporada, Suárez marcó 23 goles. La siguiente, 31. No era magia, era regresión a la media predicha por los números.

Lo que Green intuía y los datos confirmaron es que los goles son eventos de baja frecuencia con alta variabilidad. En un partido típico se marcan entre 2 y 3 goles. Con tan pocos eventos, la aleatoriedad juega un papel desproporcionado. Un rebote afortunado, un poste, un error arbitral. Los disparos, sin embargo, son mucho más frecuentes: entre 20 y 30 por partido. Analizar la calidad de esos disparos en lugar de simplemente contar goles nos acerca exponencialmente más a la realidad del rendimiento de un equipo.

La metodología se extendió rápidamente. Bloggers como Michael Caley y Sander IJtsma (conocido como 11tegen11) desarrollaron sus propios modelos. Empresas como StatsBomb refinaron el concepto añadiendo variables que antes parecían imposibles de cuantificar: la posición exacta de cada jugador en el campo cuando se produce el disparo, la velocidad del balón, la altura a la que viaja. El xG pasó de ser una curiosidad de analistas a convertirse en una herramienta que utilizan desde los directores deportivos del Manchester City hasta los apostadores profesionales de cualquier rincón del mundo.

Anatomía de un modelo de Expected Goals

Pantalla de ordenador mostrando análisis de datos de fútbol con gráficos de posiciones de disparo

Entender cómo se calcula el xG es fundamental para interpretarlo correctamente. Los modelos más básicos consideran únicamente la distancia al arco y el ángulo de disparo. Un tiro desde dentro del área pequeña, perpendicular al arco, tiene un xG alto porque históricamente esos disparos entran con frecuencia. Uno desde la banda, cerca de la línea de fondo, tiene un xG bajo porque el ángulo es tan cerrado que resulta casi imposible batir al portero.

Los modelos avanzados, como los de Opta o StatsBomb, van mucho más allá. El modelo de Opta utiliza una técnica de machine learning llamada XGBoost, alimentada por casi un millón de disparos históricos de 40 competiciones entre 2018 y 2022. Considera más de 20 variables diferentes, entre las que destacan la posición del portero en el momento del disparo, la claridad que tiene el rematador hacia la portería basándose en las posiciones de otros jugadores, la presión defensiva que está recibiendo, y el tipo de disparo (cabezazo, volea, remate con el pie dominante o el débil). StatsBomb añade sus famosos "freeze frames", que capturan la posición exacta de todos los jugadores en el campo en el instante del disparo.

Esta sofisticación marca diferencias significativas. Un disparo desde el punto de penalti puede valer 0.68 xG en un modelo básico que solo considera ubicación y ángulo. Pero si el portero está fuera de posición y no hay ningún defensa bloqueando la trayectoria, el modelo de Opta puede asignarle 0.90 xG. La diferencia no es trivial cuando estás intentando predecir si un equipo está rindiendo por encima o por debajo de su nivel real.

Los penaltis merecen mención especial porque son el único tipo de disparo con características completamente estandarizadas. La mayoría de modelos les asignan un valor fijo entre 0.76 y 0.79 xG, reflejando la tasa histórica de conversión. Por esta razón, muchos análisis profesionales trabajan con npxG (non-penalty xG), que excluye los penaltis para evaluar el rendimiento ofensivo real de un equipo en jugadas dinámicas.

Interpretación práctica para pronósticos

Aquí es donde el conocimiento teórico se transforma en ventaja competitiva. La aplicación más directa del xG en pronósticos es identificar equipos que están sobre o bajo-rindiendo respecto a sus expectativas, porque la regresión a la media es una fuerza estadística inexorable.

Imaginemos un equipo que lleva 10 partidos con un xG acumulado de 18 pero solo ha marcado 10 goles. Esto representa un bajo-rendimiento del 44% en su capacidad de conversión. Las posibilidades son dos: o tienen los peores rematadores de la historia del fútbol, o están atravesando una racha de mala fortuna que estadísticamente no puede prolongarse indefinidamente. Si sus oponentes no han cambiado, si el estilo de juego se mantiene, si no hay lesiones de sus principales goleadores, lo más probable es que comiencen a marcar más. Apostar al over de goles de ese equipo en las próximas jornadas tiene fundamento estadístico sólido.

El análisis inverso también funciona. Un equipo que marca 15 goles con un xG de 10 está viviendo de prestado. Sus delanteros están convirtiendo ocasiones que normalmente no entrarían. Tarde o temprano, esa efectividad volverá a niveles normales. Es el momento perfecto para apostar en su contra o buscar unders en sus partidos.

La diferencia de xG (xG a favor menos xG en contra) es otro indicador poderoso. Un equipo puede liderar la clasificación con una diferencia de goles de +10, pero si su diferencia de xG es solo +3, probablemente esté ocupando una posición en la tabla que no refleja su nivel real. Cuando los resultados se normalicen, ese equipo caerá posiciones. Lo contrario también aplica: equipos con mala diferencia de goles pero buena diferencia de xG son candidatos a mejorar sus resultados.

Limitaciones que debes conocer

Delantero de fútbol profesional celebrando un gol en un estadio lleno de aficionados

El xG es una herramienta poderosa, pero no es infalible. Entender sus limitaciones es tan importante como entender su utilidad.

En primer lugar, el xG no considera la calidad individual del rematador. Un disparo con 0.15 xG en los pies de un delantero promedio puede valer mucho más si lo ejecuta Erling Haaland, cuya capacidad de remate supera consistentemente las expectativas estadísticas. Los mejores goleadores del mundo son precisamente aquellos que superan su xG de manera sistemática, no por suerte, sino por habilidad técnica superior. Por eso, al analizar equipos con rematadores de élite, es prudente ajustar mentalmente las expectativas al alza.

En segundo lugar, el xG de un solo partido es poco fiable como indicador. La desviación estándar en muestras pequeñas es enorme. Un equipo puede generar 3.0 xG en un partido y no marcar, o generar 0.5 xG y ganar 2-0. Es perfectamente posible y no indica nada anómalo. La utilidad del xG aumenta exponencialmente con el tamaño de la muestra. Cinco partidos comienzan a mostrar tendencias. Diez partidos son más fiables. Una temporada completa ofrece una imagen bastante precisa del rendimiento real de un equipo.

En tercer lugar, los diferentes proveedores de datos calculan xG de manera distinta, lo que puede generar discrepancias significativas. En análisis comparativos de la Premier League, se han encontrado diferencias de hasta 3.88 xG acumulado entre modelos de Understat y Opta para el mismo equipo. Los apostadores profesionales suelen agregar datos de múltiples fuentes o desarrollar sus propios modelos para mitigar este problema.

Finalmente, el xG no captura el contexto táctico completo. Un equipo que juega con ventaja en el marcador tiende a ceder territorio y generar menos xG, pero eso no significa que esté jugando peor. Simplemente está gestionando el partido de manera inteligente. Ignorar el contexto del marcador al interpretar xG puede llevar a conclusiones erróneas.

Fuentes de datos y aplicación práctica

Para comenzar a utilizar xG en tus pronósticos, necesitas acceso a datos fiables. Afortunadamente, existen opciones gratuitas de calidad. FBref ofrece datos de StatsBomb para las principales ligas europeas. Understat proporciona xG histórico de las cinco grandes ligas con filtros por equipo, jugador y situación de juego. Sofascore y Footystats también ofrecen estadísticas de xG sin coste.

Si buscas mayor profundidad, plataformas como Opta, Wyscout o InStat ofrecen datos granulares con funcionalidades avanzadas, aunque sus costes los hacen más accesibles para profesionales o apostadores con volúmenes significativos.

La implementación práctica puede comenzar de forma sencilla. Crea una hoja de cálculo donde registres el xG a favor y en contra de los equipos que sigues. Calcula medias móviles de los últimos 5-10 partidos. Compara con los goles reales. Identifica discrepancias significativas. Cuando un equipo muestre una diferencia sostenida entre xG y goles reales durante varios partidos, tienes un candidato a regresión. Ese es tu momento para actuar.

El xG no es una bola de cristal. No te dirá quién va a ganar cada partido. Pero en un mundo donde las casas de apuestas ajustan sus cuotas basándose principalmente en resultados recientes y percepción pública, tener acceso a indicadores más profundos del rendimiento real te otorga una ventaja sistemática. Y en las apuestas deportivas, las ventajas sistemáticas pequeñas, aplicadas consistentemente a lo largo del tiempo, son la diferencia entre perder dinero y construir un bankroll rentable.

Los números no mienten. Solo necesitas saber qué números mirar.