How we measure “stylistic fit” without overfitting nostalgia

«Ci serve un terzino sinistro come Marcelo». È una frase utile e pericolosa. Utile perché trasmette all’istante un profilo che ogni testa di calcio nella stanza riesce a vedere. Pericolosa perché può significare cinque cose diverse a cinque ascoltatori — e peggio, può non significare niente di preciso a un motore di ricerca.

Match, il nostro motore di raccomandazione, vive sul confine fra queste due verità. Deve tradurre il linguaggio sfumato dell’operatore in classifiche rigorose, confrontabili e difendibili — senza appiattire ciò che rende un giocatore distinto. Ecco come lo facciamo senza fare overfitting sulla nostalgia.

Il modello a tre livelli

Su Scout Atlas l’affinità stilistica non è un singolo punteggio di similarità. È una pila di tre livelli indipendenti, calcolati ogni notte, ognuno spiegato in italiano piano accanto al risultato.

Livello 1 — Impronte comportamentali

Per ogni giocatore con almeno 900 minuti di campionato nelle ultime due stagioni calcoliamo un vettore comportamentale a 200 dimensioni. Non statistiche grezze. Derivate comportamentali: distanza di conduzione progressiva per tocco, attività in zona difensiva pesata per forza dell’avversario, frequenza di scansione prima dei passaggi progressivi, distanza di recupero post-perdita.

Sono le feature che sopravvivono alla normalizzazione tra leghe. Una partita di 70 minuti in League of Ireland non è la stessa tela di una partita di Premier — quindi normalizziamo le opportunità, non i risultati. L’impronta confronta il comportamento a parità di condizioni.

Livello 2 — Contesto del ruolo

«Un terzino sinistro come Marcelo» non è solo una forma comportamentale. È una forma comportamentale dentro un sistema. Etichettiamo ogni partita del corpus con il ruolo implicito del giocatore (terzino invertito, terzino classico, esterno in difesa a cinque, centrale ibrido largo) usando un classificatore di formazione basato su grafi. La similarità stilistica viene poi calcolata condizionata al ruolo — un ibrido del Bayern viene confrontato con altri ibridi, non con un esterno dell’Atalanta.

Livello 3 — Firma decisionale

Il terzo livello è il più sperimentale e quello che ci entusiasma di più. Addestriamo un modello sequenziale su punti decisionali etichettati — ricezione sotto pressione, trigger di pressione difensiva, scatto in transizione — e produciamo una distribuzione di probabilità su classi decisionali per ogni giocatore. La firma decisionale cattura cosa tende a fare un giocatore quando gli viene data una scelta. Due giocatori con impronte comportamentali identiche possono avere firme decisionali completamente diverse, e la firma prevede di solito come il giocatore si adatta a un nuovo sistema.

Tre cose che esplicitamente non facciamo

Ogni motore di raccomandazione è plasmato da ciò che si rifiuta di fare. Match ha tre rifiuti fermi.

Non addestriamo su dati privati di club membri senza consenso. Le impronte vengono da corpus open-data e da event data licenziato. Note private, GPS e shortlist dei club membri sono loro — arricchiscono il modello personale del club, non quello inter-club.
Non nascondiamo le leghe coperte da un brief. Se un brief ha filtrato sui top 5, lo diciamo su ogni risultato. Se un giocatore non è stato incluso, diciamo perché (minuti insufficienti, lega non ancora ingerita).
Non facciamo passare un ranking a 60 di confidenza per un 95. Quando l’ensemble è in disaccordo — XGBoost gradisce un giocatore, CatBoost è incerto — segnaliamo direttamente la varianza. La bassa confidenza è di per sé un segnale che vale la pena mostrare.

Come teniamo i confronti onesti

Due salvaguardie corrono accanto a ogni Match score.

La prima è la correzione del bias di sopravvivenza. La stampa calcistica gravita sui vincitori. La similarità comportamentale con un giocatore famoso può essere un proxy pericoloso — ottimo filtro per cogliere il genio retrospettivo, pessimo filtro per prevedere l’adattamento futuro. Riequilibriamo le coorti di addestramento per includere esplicitamente la «media rumorosa» — giocatori che sembravano stelle e non lo sono diventati.

La seconda è la calibrazione per coorte. Testiamo il modello non sul predestinato della Premier, ma sull’esterno dell’Allsvenskan di cui nessuno aveva sentito parlare nel 2021 e che oggi è titolare in Bundesliga. Se il modello non avrebbe potuto farlo emergere con alta confidenza nel 2021, torniamo al tavolo da disegno. La maggior parte dei motori di «similarità» celebra i giocatori che ha previsto; noi ci misuriamo sui giocatori che ci siamo persi.

Cosa vedi davvero nel prodotto

Quando apri un giocatore in Scout Atlas, «Pari stilistici» mostra i sei migliori giocatori del corpus per similarità combinata impronta + ruolo + decisione, con un breakdown di attribuzione delle feature per ogni coppia: dove si concentra la similarità, dove diverge. Vedi il confronto e i limiti del confronto.

«Un terzino sinistro come Marcelo» torna a essere utile — ma non devi più crederci sulla parola. La matematica è sulla pagina.