xG en la Premier League: cómo leer los goles esperados para detectar valor

Cargando...
El número que cambió cómo los profesionales leen los partidos
La primera vez que vi un modelo de xG aplicado a un partido Premier fue en 2017. Un analista profesional me mostró cómo un 1-0 del Manchester United frente al Liverpool no reflejaba lo que había pasado en el campo: los locales habían generado 1,8 xG en ocasiones, el Liverpool 2,4. El resultado fue victoria local, pero el mercado que miraba el partido sin xG estaba mintiéndose. En los siguientes 6 partidos, el Liverpool ganó a rivales directos y cumplió la regresión estadística. A partir de ese día, el xG entró en mi rutina semanal como herramienta fundamental. Diez años después, no concibo analizar un partido Premier sin mirarlo.
xG significa «expected goals» (goles esperados). Es una métrica estadística que asigna a cada ocasión de gol una probabilidad de ser convertida en gol, basada en factores objetivos: distancia al arco, ángulo del disparo, tipo de ocasión (pie, cabeza, tiro libre), posición defensiva en el momento del disparo, presión del defensor. Un disparo desde el punto de penalti tiene xG de aproximadamente 0,76. Un cabezazo desde el segundo palo tras córner tiene xG alrededor de 0,08. Un disparo desde fuera del área sin oposición directa suele tener xG entre 0,03 y 0,07.
Cómo se calcula el xG: los factores que importan
Los modelos de xG comerciales (Opta, StatsBomb, los propietarios de las casas grandes) usan regresiones logísticas entrenadas con cientos de miles de disparos históricos. Los factores principales son: distancia al centro de la portería, ángulo entre el punto del disparo y el arco, tipo de ocasión (pase rasante, cabeza, tiro libre, penalti), número de defensores entre el atacante y la portería, presión inmediata (si hay defensor a menos de 1 metro). Algunos modelos añaden también velocidad del balón en el momento del disparo, tiempo desde última pérdida del rival, estado del partido (gana, pierde, empata).
El xG por ocasión se suma al total del partido para cada equipo. Un equipo con 2,1 xG en 90 minutos ha generado ocasiones equivalentes a 2,1 goles esperados. Si el resultado fue 1-0, ha marcado menos de lo esperado. Si fue 3-0, ha marcado más. Esa diferencia entre xG y goles reales (llamada «overperformance» o «underperformance») es uno de los indicadores más fiables de regresión futura a la media.
Hay matices en los modelos. El xG post-shot (xGoT) afina más porque incluye dirección y precisión del disparo una vez efectuado. El xG sin penaltis (npxG, del que hablo en otra pieza más específica) elimina los penaltis del cálculo para eliminar ruido. El xThreat o xT mide el valor del pase, no del disparo, para evaluar el peligro generado por jugadas completas. Todos son derivados del mismo concepto base: convertir momentos puntuales del juego en probabilidades estadísticas comparables.
xG vs goles reales en la Premier 25/26: los casos actuales
Esta temporada tiene dos casos claros que ilustran el poder diagnóstico del xG. El Manchester City está sobre-rendiendo respecto a su xG acumulado. Sus 65 goles en 32 jornadas se compararon con un xG proyectado de aproximadamente 52. Overperformance de 13 goles. El rendimiento real es superior al esperado estadísticamente. Los goleadores del City convirtiendo ocasiones con mayor eficacia que la media histórica, impulsados por Haaland y su liderazgo en máximo goleador.
El Tottenham en cambio ha sufrido underperformance durante buena parte de la temporada. Su xG acumulado supera a sus goles marcados en 8 o 10 unidades en franjas largas. Los números dicen que el equipo genera oportunidades de gol a un ritmo razonable, pero las conversiones fallan. Aquí hay dos lecturas posibles: los delanteros están en mala racha, o el modelo de xG está sobreestimando sus ocasiones por algún sesgo tipo de jugada. En los siguientes partidos el Tottenham suele regresar a la media y marcar más.
El valor para el apostante: los equipos con overperformance grande suelen regresar a la media en las siguientes semanas, marcando menos goles y perdiendo partidos que proyecciones lineales decían que iban a ganar. Los equipos con underperformance grande tienden a lo contrario: empiezan a marcar, mejoran resultados, suben en la clasificación. Esta dinámica de regresión es lo que el xG permite detectar antes que las estadísticas superficiales de goles.
La Premier 25/26 tiene además un dato macro relevante. El promedio de goles por partido se sitúa en 2,8, con 1,4 por equipo. El xG agregado de la liga suele oscilar entre 2,7 y 2,9 por partido, muy cerca del real. Es decir, como liga entera la Premier marca lo que sus xG predicen. Las desviaciones individuales de equipos se compensan entre sí.
Aplicar xG a los mercados de apuestas: over/under, BTTS, hándicap
El mercado donde el xG aporta más valor decisional es el over/under de goles. Si conoces el xG histórico de los dos equipos del partido y el xG que cada uno concede, puedes proyectar el xG total esperado del partido con una aproximación decente. Modelo básico: xG local_ataque + xG visitante_ataque ajustado por xG local_defensa + xG visitante_defensa = xG total esperado del partido.
Un partido Liverpool vs Brighton con Liverpool ataque generando 2,2 xG/partido y Brighton defensa concediendo 1,4 xG/partido (media geométrica 1,8 para Liverpool en ese partido), más Brighton ataque 1,5 xG/partido contra Liverpool defensa 1,2 xG/partido (media 1,35), total xG 3,15. Eso implica probabilidad over 2,5 del 75% aproximadamente. Si la casa paga over 2,5 a 1,70 (probabilidad implícita 59%), hay valor esperado positivo claro.
El BTTS también se modela con xG por equipo. La probabilidad de que el equipo A marque es 1 − e^(−xGA). Para xGA=1,8, probabilidad de marcar = 1 − e^(−1,8) = 83,4%. La probabilidad conjunta BTTS sí es la multiplicación de las dos probabilidades individuales (con ajuste por correlación). Si ambos equipos tienen xG esperado cercano a 1,5, la probabilidad BTTS sí supera el 65%.
El hándicap asiático es el mercado donde más se nota la ventaja del xG aplicado. La diferencia de xG entre dos equipos en un partido concreto proyecta una «ventaja esperada» que se puede comparar con la línea asiática que ofrece la casa. Si el xG dice que el local tiene 1,2 goles de ventaja esperada pero la línea asiática está en -0,5, hay margen potencial.
Limitaciones del xG: dónde el modelo falla
El xG tiene sesgos conocidos. Sobreestima las ocasiones generadas por equipos que disparan desde cualquier sitio (xG bajo por disparo, muchos disparos acumulados). Infravalora las ocasiones de equipos que solo disparan cuando tienen probabilidad alta (xG alto por disparo, pocos disparos). Dos equipos con xG total de 2,0 pueden haber tenido partidos totalmente distintos si uno generó 20 disparos de xG=0,1 cada uno y el otro generó 4 disparos de xG=0,5 cada uno. Para el bettor importa conocer no solo el xG total, sino la distribución por disparo.
El xG no captura muy bien las ocasiones extraordinarias. Un disparo desde 45 metros fuera del área con portero adelantado tiene xG bajo (0,02-0,04) aunque sea un gol fácil en esa situación concreta. Los goles de pizarra ensayada tampoco aparecen bien en el xG clásico.
La muestra pequeña es otra limitación. Hacen falta al menos 20-25 partidos para que el xG acumulado de un equipo sea estadísticamente fiable. En las primeras 5 jornadas de temporada, el xG tiene poca potencia predictiva. A partir de la jornada 15 se vuelve muy fiable.
Los arqueros excepcionales (Alisson, Raya, Pickford en su mejor versión) generan underperformance sistemática del xG del rival. Los goleadores clínicos (Haaland es el caso extremo) generan overperformance sistemática. El xG promedio de la liga asume arqueros y delanteros medios, y los casos extremos se desvían del modelo. Es otra razón para combinar el xG con otras métricas antes de decidir una apuesta, y las métricas más allá del xG aportan esa capa complementaria que lee el juego con más matiz.