Beta cerrada

Motor 02 · Vision

Un partido de 90 minutos,
scouteado en tres.

Vision es un pipeline de visión por computadora que mira un partido como lo haría un gran scout — pero en tres minutos, en el mismo formato cada vez, sobre cada jugador del campo.

Top-down stadium view with players overlaid by tracking boxes and a luminous gold ball trajectory. — AI-rendered concept · fal.ai fluxConcept render — the alpha pipeline currently emits COCO classes (person/ball); football-specific event detection ships with the fine-tuned head.

En una frase

Pega un enlace de partido.
Recibe un informe de scouting estructurado — y el highlight reel — en menos de lo que tarda un café.

La mayoría de los clubes gastan 4–6 horas por partido por scout en revisar vídeo. Vision hace el primer 80 % de ese trabajo — tracking, detección de eventos, clipping ajustado al rol — para que tu scout empiece con las preguntas, no con la preparación.

La salida está deliberadamente estandarizada. Cada informe de Vision sigue la misma estructura: identificación, rol, en posesión, fuera de posesión, balón parado, psicometría inferida del lenguaje corporal y un índice de momentos marcados. Tus informes se vuelven comparables. Por fin.

Vision · salida de muestraPartido: Vitória SC vs FC Porto · 18 Abr · 90'

● Tracking · 22 jugadores · 71'14

events.detected

71’02progressive_pass#10 → #9

71’08turnover#10 / press

71’14shot_attempt · GOAL#10 / RIGHT_FOOT

74’21high_press_recovery#10 / 6.2 m

83’39second_assist#10 → #7 → #9

Capacidades

Lo que Vision ve y al ojo humano se le escapa.

◯

✓

Tracking de jugador

Cada toque, cada carrera sin balón, cada recuperación defensiva — sobre los 22 jugadores, partido completo.

◇

✓

Estimación de pose

Calidad del primer toque, postura al recibir, frecuencia de escaneo antes de los toques.

⚑

✓

Detección de eventos

Pases progresivos, conducciones que rompen líneas, gatillos de presión, segundas jugadas — etiquetados y con timestamp.

▶

✓

Reels auto-cortados

Highlight + lowlight reel por jugador, generados a partir de los eventos que el jugador realmente protagonizó.

⌖

✓

Contexto de rol

Los informes ajustan las expectativas al rol que estás scouteando — un #6 no se evalúa contra un #10.

☷

✓

Consistencia entre partidos

Cada informe sigue la misma plantilla, así un scout puede comparar 12 partidos en una sentada.

Dentro del pipeline

El stack que mira el partido.

Detección · YOLOv11

Detección de objetos a la última, entrenada con datasets específicos de fútbol (SoccerNet, clips etiquetados a medida). En tiempo real con una sola GPU.

Tracking · ByteTrack

Tracking multi-objeto con re-identificación. Los jugadores conservan su ID a través de oclusiones, sustituciones y cortes de cámara.

Pose · YOLOv8-Pose

Estimación de keypoints para postura corporal, calidad del primer toque y escaneo. Treinta y un keypoints por jugador por frame.

Cabezales de acción · CNN+LSTM

Clasificador 3D espacio-temporal entrenado sobre secuencias de eventos anotadas de StatsBomb y SoccerNet. Salidas a 25 FPS.

Re-ID · redes Siamesas

Mantienen la identidad entre ángulos de cámara y retransmisiones. Nos permiten fusionar múltiples fuentes en una sola línea de tiempo.

Capa táctica · GNN

Red neuronal de grafos sobre las posiciones de los jugadores para inferir formaciones, forma de la línea y gatillos de presión.

Vision · what ships today

Honest disclosure

v0Live in production
COCO-class detection pipeline live via Hugging Face Inference Endpoint, callable today at /api/v2/vision/detect with Bearer key. Honest disclosure: the model emits person/ball/sports-ball detections only — football-specific event labels (shot/tackle/dribble) require the fine-tuned head, which trains automatically when each class hits ≥500 labelled boxes via /api/v2/clips.
v0.1 alphaIn training· lands after each class reaches ≥500 labelled boxes
YOLOv11 fine-tune on the 12-class football event taxonomy (shot, pass, cross, header, tackle, interception, dribble, recovery, line_break, duel, save, foul). Schema and ingestion endpoint live in production; training runs on Modal GPU once labelling threshold is met.
v0.2Design phase
YOLOv8-Pose + CNN+LSTM action heads + Siamese re-ID + GNN tactical formation classifier. Full per-match auto-report ≤ 3 minutes at < €1 GPU spend.

Visuals on this page are AI-rendered concepts (fal.ai flux), not live model inference. Real YOLO COCO-class detection runs at /api/v2/vision/detect today; football-specific event labelling lands after the labelling threshold is met.

Ve Vision en vivo

Manda un enlace de partido. Te enviaremos el informe.

Durante el piloto, ejecutamos Vision en vivo para cualquier club candidato. Mandas un enlace público de partido — feed de retransmisión o cámara táctica — y te devolvemos el informe automático y los reels recortados de cualquier jugador que nombres.

Solicitar un informe de muestra Ver Shield a continuación

Un partido de 90 minutos,scouteado en tres.

Pega un enlace de partido.Recibe un informe de scouting estructurado — y el highlight reel — en menos de lo que tarda un café.