How we measure “stylistic fit” without overfitting nostalgia

«Necesitamos un lateral izquierdo como Marcelo». Es una frase útil y peligrosa. Útil porque transmite al instante un perfil que cualquier cabeza futbolera de la sala puede ver. Peligrosa porque puede significar cinco cosas distintas para cinco oyentes — y peor, puede no significar nada preciso para un buscador.

Match, nuestro motor de recomendación, vive en la frontera entre esas dos verdades. Tiene que traducir el lenguaje difuso del operador a rankings rigurosos, comparables y defendibles — sin aplanar lo que hace distinto a un jugador. Aquí cómo lo hacemos sin sobreajustar a la nostalgia.

El modelo de tres capas

En Scout Atlas la afinidad de estilo no es una sola puntuación de similitud. Es una pila de tres capas independientes, cada una calculada cada noche, cada una explicada en castellano llano junto al resultado.

Capa 1 — Huellas conductuales

Para cada jugador con al menos 900 minutos de liga en las dos últimas temporadas calculamos un vector conductual de 200 dimensiones. No estadísticas en bruto. Derivadas conductuales: distancia de conducción progresiva por toque, actividad en zonas defensivas ajustada por fuerza del rival, frecuencia de escaneo previa a pases progresivos, distancia de recuperación post-pérdida.

Son las features que sobreviven a la normalización entre ligas. Un partido de 70 minutos en la liga irlandesa no es el mismo lienzo que un partido de Premier — por eso normalizamos oportunidades, no resultados. La huella compara comportamiento en igualdad de condiciones.

Capa 2 — Contexto de rol

«Un lateral izquierdo como Marcelo» no es solo una forma conductual. Es una forma conductual en un sistema. Etiquetamos cada partido del corpus con el rol implícito del jugador (lateral invertido, lateral clásico, carrilero en línea de cinco, central exterior híbrido) usando un clasificador de formación basado en grafos. La similitud estilística se calcula entonces condicionada al rol — un híbrido del Bayern se compara con otros híbridos, no con un carrilero del Atalanta.

Capa 3 — Firma de decisión

La tercera capa es la más experimental y la que más nos entusiasma. Entrenamos un modelo de secuencia sobre puntos de decisión etiquetados — recibir bajo presión, disparador de presión defensiva, lanzamiento en transición — y producimos una distribución de probabilidad sobre clases de decisión para cada jugador. La firma de decisión captura qué tiende a hacer un jugador cuando le dan a elegir. Dos jugadores con huellas conductuales idénticas pueden tener firmas de decisión completamente distintas, y la firma suele predecir cómo se adapta el jugador a un sistema nuevo.

Tres cosas que explícitamente no hacemos

Cada motor de recomendación se define por lo que se niega a hacer. Match tiene tres negativas firmes.

No entrenamos sobre datos privados de clubes miembros sin consentimiento. Las huellas vienen de corpus de open-data y datos de eventos licenciados. Las notas privadas, GPS y shortlists de los clubes miembros son suyos — enriquecen el modelo personal del club, no el modelo inter-club.
No ocultamos las ligas que un brief cubrió. Si un brief filtró a las cinco grandes, lo decimos en cada resultado. Si un jugador no se incluyó, decimos por qué (minutos insuficientes, liga aún no ingestada).
No fingimos que un ranking con 60 de confianza es un 95. Cuando el ensemble discrepa — XGBoost gusta del jugador, CatBoost duda — marcamos la varianza directamente. La baja confianza es en sí una señal que merece la pena mostrar.

Cómo mantenemos las comparaciones honestas

Dos salvaguardas corren junto a cada Match score.

La primera es la corrección de sesgo de supervivencia. La prensa futbolera gravita hacia los ganadores. La similitud conductual con un jugador famoso puede ser un proxy peligroso — gran filtro para detectar genio retrospectivo, mal filtro para predecir encaje futuro. Reequilibramos las cohortes de entrenamiento para incluir explícitamente el «medio ruidoso» — jugadores que parecían estrellas y no lo fueron.

La segunda es la calibración por cohorte. Probamos el modelo no contra el niño bonito de la Premier, sino contra el extremo de la Allsvenskan que nadie había oído nombrar en 2021 y que ahora es titular en la Bundesliga. Si el modelo no podría haberlo sacado con alta confianza en 2021, volvemos al pizarrón. La mayoría de motores de «similitud» celebran a los jugadores que predijeron; nosotros nos medimos por los que se nos escaparon.

Lo que ves realmente en el producto

Cuando abres un jugador en Scout Atlas, «Pares estilísticos» muestra los seis jugadores top del corpus por similitud combinada huella + rol + decisión, con un desglose de atribución de features para cada par: dónde se concentra la similitud, dónde diverge. Ves la comparación y los límites de la comparación.

«Un lateral izquierdo como Marcelo» vuelve a ser útil — pero ya no tienes que creer a ciegas. La matemática está sobre la mesa.