How we measure “stylistic fit” without overfitting nostalgia
Match clusters players by behaviour, not biography. The math behind why “a left-back like Marcelo” is a useful comparison and how we keep it honest.
By Match Engine team
«Ci serve un terzino sinistro come Marcelo». È una frase utile e pericolosa. Utile perché trasmette all’istante un profilo che ogni testa di calcio nella stanza riesce a vedere. Pericolosa perché può significare cinque cose diverse a cinque ascoltatori — e peggio, può non significare niente di preciso a un motore di ricerca.
Match, il nostro motore di raccomandazione, vive sul confine fra queste due verità. Deve tradurre il linguaggio sfumato dell’operatore in classifiche rigorose, confrontabili e difendibili — senza appiattire ciò che rende un giocatore distinto. Ecco come lo facciamo senza fare overfitting sulla nostalgia.
Il modello a tre livelli
Su Scout Atlas l’affinità stilistica non è un singolo punteggio di similarità. È una pila di tre livelli indipendenti, calcolati ogni notte, ognuno spiegato in italiano piano accanto al risultato.
Livello 1 — Impronte comportamentali
Per ogni giocatore con almeno 900 minuti di campionato nelle ultime due stagioni calcoliamo un vettore comportamentale a 200 dimensioni. Non statistiche grezze. Derivate comportamentali: distanza di conduzione progressiva per tocco, attività in zona difensiva pesata per forza dell’avversario, frequenza di scansione prima dei passaggi progressivi, distanza di recupero post-perdita.
Sono le feature che sopravvivono alla normalizzazione tra leghe. Una partita di 70 minuti in League of Ireland non è la stessa tela di una partita di Premier — quindi normalizziamo le opportunità, non i risultati. L’impronta confronta il comportamento a parità di condizioni.
Livello 2 — Contesto del ruolo
«Un terzino sinistro come Marcelo» non è solo una forma comportamentale. È una forma comportamentale dentro un sistema. Etichettiamo ogni partita del corpus con il ruolo implicito del giocatore (terzino invertito, terzino classico, esterno in difesa a cinque, centrale ibrido largo) usando un classificatore di formazione basato su grafi. La similarità stilistica viene poi calcolata condizionata al ruolo — un ibrido del Bayern viene confrontato con altri ibridi, non con un esterno dell’Atalanta.
Livello 3 — Firma decisionale
Il terzo livello è il più sperimentale e quello che ci entusiasma di più. Addestriamo un modello sequenziale su punti decisionali etichettati — ricezione sotto pressione, trigger di pressione difensiva, scatto in transizione — e produciamo una distribuzione di probabilità su classi decisionali per ogni giocatore. La firma decisionale cattura cosa tende a fare un giocatore quando gli viene data una scelta. Due giocatori con impronte comportamentali identiche possono avere firme decisionali completamente diverse, e la firma prevede di solito come il giocatore si adatta a un nuovo sistema.
Tre cose che esplicitamente non facciamo
Ogni motore di raccomandazione è plasmato da ciò che si rifiuta di fare. Match ha tre rifiuti fermi.
- Non addestriamo su dati privati di club membri senza consenso. Le impronte vengono da corpus open-data e da event data licenziato. Note private, GPS e shortlist dei club membri sono loro — arricchiscono il modello personale del club, non quello inter-club.
- Non nascondiamo le leghe coperte da un brief. Se un brief ha filtrato sui top 5, lo diciamo su ogni risultato. Se un giocatore non è stato incluso, diciamo perché (minuti insufficienti, lega non ancora ingerita).
- Non facciamo passare un ranking a 60 di confidenza per un 95. Quando l’ensemble è in disaccordo — XGBoost gradisce un giocatore, CatBoost è incerto — segnaliamo direttamente la varianza. La bassa confidenza è di per sé un segnale che vale la pena mostrare.
Come teniamo i confronti onesti
Due salvaguardie corrono accanto a ogni Match score.
La prima è la correzione del bias di sopravvivenza. La stampa calcistica gravita sui vincitori. La similarità comportamentale con un giocatore famoso può essere un proxy pericoloso — ottimo filtro per cogliere il genio retrospettivo, pessimo filtro per prevedere l’adattamento futuro. Riequilibriamo le coorti di addestramento per includere esplicitamente la «media rumorosa» — giocatori che sembravano stelle e non lo sono diventati.
La seconda è la calibrazione per coorte. Testiamo il modello non sul predestinato della Premier, ma sull’esterno dell’Allsvenskan di cui nessuno aveva sentito parlare nel 2021 e che oggi è titolare in Bundesliga. Se il modello non avrebbe potuto farlo emergere con alta confidenza nel 2021, torniamo al tavolo da disegno. La maggior parte dei motori di «similarità» celebra i giocatori che ha previsto; noi ci misuriamo sui giocatori che ci siamo persi.
Cosa vedi davvero nel prodotto
Quando apri un giocatore in Scout Atlas, «Pari stilistici» mostra i sei migliori giocatori del corpus per similarità combinata impronta + ruolo + decisione, con un breakdown di attribuzione delle feature per ogni coppia: dove si concentra la similarità, dove diverge. Vedi il confronto e i limiti del confronto.
«Un terzino sinistro come Marcelo» torna a essere utile — ma non devi più crederci sulla parola. La matematica è sulla pagina.
Keep reading
The transfer window is broken — and the tools made it worse
Why a market with €7B annual flow still runs on Excel, WhatsApp, and gut feel. And what changes when the data layer catches up.
Agents as network, not noise
Why filtering agents out is the lazy answer — and what changes when you verify the integrity ones and price out the unverified middle.
If this resonated, the next move is a conversation.
We onboard pilot members on rolling invitation. Send us your hardest question — we’ll send back the live answer.