Why Shield is intentionally conservative
In injury prediction, false negatives are catastrophic and false positives are cheap. We tuned the model accordingly — and the rationale is in the math.
By Shield team
Sakatlık tahmininde yanlış negatifler felaket, yanlış pozitifler ucuzdur. 40 milyon avroluk bir varlıkta hamstring yırtığını kaçıran bir model bir kulübe bir sezon kaybettirir. Sonradan iyi olduğu anlaşılan bir oyuncuda watch katmanını işaretleyen bir model bir kulübe sezon öncesinde bir gün ekstra dinlenmeden başka bir şeye mal olmaz. Asimetri ince değil. Shield’ı buna göre ayarladık — ve gerekçe matematikte, pazarlamada değil.
Futbol sakatlık modelleri neden başarısız oluyor
Çoğu akademik sakatlık modeli etkileyici doğruluk bildirir ve sessizce en kötü sakatlıkları kaçırır. Sebebi yapısal. Hamstring yırtığı, ÇB rüptürü ve stres kırığı nadir olaylardır. “Sakatlanma yok” diye her gün tahmin eden naif bir model, formda bir Premier League takımında zamanın ~%98’inde haklıdır. Doğruluk yanlış metrik. Nadir sınıfta recall doğru olan — ve acımasız.
Daha kötüsü, dağıtım bağlamı affetmez. Bir kulüp temiz bir test seti almıyor. Bir oyuncu, bir iş yükü, Cumartesi günü oynanacak bir maç alıyor. Karar verildiği anda eyleme dökülebilir bir sinyal veremeyen bir model, model değildir. Slayttır.
Dört katman ve neden dört
Shield bir olasılık değil, bir katman çıktısı verir. Dört katman: düşük, watch, yükselmiş, yüksek. Eşikler 30/60/90 günlük tarihsel sakatlık sonuçlarına göre kalibre edilmiş, sonra watch ve yükselmiş sınırlarında temkinli yana doğru bilinçle kaydırılmış.
Üç katman sahte güveni zorlardı: yeşil / amber / kırmızı, “amber” çok iş yapar. Beş katman kozmetik olurdu — insanlar maç günü baskısı altında beş risk kategorisini güvenilir biçimde ayırt edemez. Dört, “üzerinde düşünmen gerekir” sinyalini “üzerinde harekete geçmen gerekir” sinyalinden ayıran ve “tamam, henüz sinyal yok” taban çizgisini kaybetmeyen en küçük settir.
Tasarım gereği temkinli
Burada temkinlilik kesin bir mühendislik tercihi. Üç yerde görünür:
- Asimetrik kayıp. Eğitim kaybı yanlış negatifleri yanlış pozitiflerin 7 katı ağırlıkla cezalandırır. Sayı keyfi değil; “oyuncu 4 hafta dışarıda” ile “oyuncu fazladan bir gün dinlendi” arasında kabaca bir maliyet oranından geliyor.
- Eşik kayması. Watch ve yükselmiş eşikleri sezon ortasında yorgunluk biriktikçe temkinli yöne kayar. Ekim ile Nisan’da aynı eşiği kullanan bir model bilinen biyolojiyi göz ardı eder.
- Anlaşmazlığı koruyarak ensemble. Random Forest, Survival Analysis ve LSTM iş yükü-anomali kafası ayrı ayrı oy verir. Anlaşmazlık keskinken yüzeye çıkarırız — üç sakin model, bir bağıran model — anlaşmazlığın kendisi gösterilmeye değer bir sinyaldir.
Temkinli ne demek, ne demek değil
Herkesi kırmızıya işaretlemek demek değil. Sürekli çığlık atan bir model işe yaramaz — kulüpler iki hafta içinde görmezden gelir, bunu iki önceki ticari sistemde tam olarak yaşadığımızı gördük. Gürültülü bir bayrağın maliyeti gerçek, sadece kaçırılan bir bayrağın maliyetinden daha küçük.
Mükemmel formdaki bir oyuncuda watch işaretlemeye ve kamuoyu önünde yanılmaya istekli olmak demek. Ürün bunu bir özellik atıf paneliyle ele alır: Shield watch işaretlediğinde panel iş yükü anomalisini, tarihsel emsal yörüngesini ve hayatta kalma eğrisi pozisyonunu gösterir. Bayrak denetlenebilir. Temkinli yanlılık denetlenebilir. Kulüpler tartışabilir — ve sıklıkla tartışmalıdır.
Katmanın arkasında ne var
Shield, her biri farklı bir sinyal sınıfına ayarlı üç model kafasını birleştirir.
İş yükü kafası mümkün olduğunda seans GPS’i, olmadığında yayın türevi player-load vekilleri üzerinde eğitilmiş bir LSTM. Son 21 günü bir dizi olarak okur ve spor bilimi literatürünün yirmi yıldır tutarlı olduğu akut-kronik iş yükü sapmalarını işaretler.
Hayatta kalma kafası zaman değişken eş değişkenli bir Cox orantılı risk modelidir: yaş, mevki, geçmiş, son dakikalar, rakip yoğunluğu. Önümüzdeki 90 gün için tehlike fonksiyonunu tahmin eder. 30 günlük, 60 günlük ve 90 günlük projeksiyonlarını ayrı ayrı yüzeye çıkarırız çünkü her ufukta eylem menüsü farklıdır.
Anomali kafası en kötü sınıf sakatlıklardan önce gelen örüntüyü — sakatlığı değil, ondan önceki iki haftanın parmak izini — tanımak için eğitilmiş bir Random Forest. Diğerleriyle anlaşmazlığa düşmesi en olası kafa. Anlaşmazlığa düşüp haklı çıktığında erken haklı çıkar. Anlaşmazlığı bir hata olarak değil, bir özellik olarak ele alıyoruz.
Olmadığımızı söylediğimiz şey
Shield bir tıbbi cihaz değil. Kulüp doktorunun, spor bilimcisinin veya performans başkanının yerini almaz. Hâlihazırda var olan verinin üstünde bir sinyal katmanı — herkes için yayın yük vekilleri, opt-in özel akışlar için GPS ve biyometri. Gerçek bir Salı gününün kararının içinde yararlı olacak şekilde kalibre edilmiş, bir Kaggle skor tablosunu kazanmak için değil.
Ondan en çok faydalanan kulüpler ona iyi bir kaptanın radara davrandığı gibi davranır: birkaç girdiden biri olarak, bilinen bir yanlış-pozitif yanlılığıyla ve yedi kat daha kötü bir yanlış-negatif maliyetiyle. Tasarım bu. Temkinlilik mesele.
Keep reading
The transfer window is broken — and the tools made it worse
Why a market with €7B annual flow still runs on Excel, WhatsApp, and gut feel. And what changes when the data layer catches up.
How we measure “stylistic fit” without overfitting nostalgia
Match clusters players by behaviour, not biography. The math behind why “a left-back like Marcelo” is a useful comparison and how we keep it honest.
If this resonated, the next move is a conversation.
We onboard pilot members on rolling invitation. Send us your hardest question — we’ll send back the live answer.