Un partido de 90 minutos,
scouteado en tres.
Vision es un pipeline de visión por computadora que mira un partido como lo haría un gran scout — pero en tres minutos, en el mismo formato cada vez, sobre cada jugador del campo.
En una frase
Pega un enlace de partido.
Recibe un informe de scouting estructurado — y el highlight reel — en menos de lo que tarda un café.
La mayoría de los clubes gastan 4–6 horas por partido por scout en revisar vídeo. Vision hace el primer 80 % de ese trabajo — tracking, detección de eventos, clipping ajustado al rol — para que tu scout empiece con las preguntas, no con la preparación.
La salida está deliberadamente estandarizada. Cada informe de Vision sigue la misma estructura: identificación, rol, en posesión, fuera de posesión, balón parado, psicometría inferida del lenguaje corporal y un índice de momentos marcados. Tus informes se vuelven comparables. Por fin.
Lo que Vision ve y al ojo humano se le escapa.
✓
Tracking de jugador
Cada toque, cada carrera sin balón, cada recuperación defensiva — sobre los 22 jugadores, partido completo.
✓
Estimación de pose
Calidad del primer toque, postura al recibir, frecuencia de escaneo antes de los toques.
✓
Detección de eventos
Pases progresivos, conducciones que rompen líneas, gatillos de presión, segundas jugadas — etiquetados y con timestamp.
✓
Reels auto-cortados
Highlight + lowlight reel por jugador, generados a partir de los eventos que el jugador realmente protagonizó.
✓
Contexto de rol
Los informes ajustan las expectativas al rol que estás scouteando — un #6 no se evalúa contra un #10.
✓
Consistencia entre partidos
Cada informe sigue la misma plantilla, así un scout puede comparar 12 partidos en una sentada.
El stack que mira el partido.
Detección · YOLOv11
Detección de objetos a la última, entrenada con datasets específicos de fútbol (SoccerNet, clips etiquetados a medida). En tiempo real con una sola GPU.
Tracking · ByteTrack
Tracking multi-objeto con re-identificación. Los jugadores conservan su ID a través de oclusiones, sustituciones y cortes de cámara.
Pose · YOLOv8-Pose
Estimación de keypoints para postura corporal, calidad del primer toque y escaneo. Treinta y un keypoints por jugador por frame.
Cabezales de acción · CNN+LSTM
Clasificador 3D espacio-temporal entrenado sobre secuencias de eventos anotadas de StatsBomb y SoccerNet. Salidas a 25 FPS.
Re-ID · redes Siamesas
Mantienen la identidad entre ángulos de cámara y retransmisiones. Nos permiten fusionar múltiples fuentes en una sola línea de tiempo.
Capa táctica · GNN
Red neuronal de grafos sobre las posiciones de los jugadores para inferir formaciones, forma de la línea y gatillos de presión.
Manda un enlace de partido. Te enviaremos el informe.
Durante el piloto, ejecutamos Vision en vivo para cualquier club candidato. Mandas un enlace público de partido — feed de retransmisión o cámara táctica — y te devolvemos el informe automático y los reels recortados de cualquier jugador que nombres.