Stranice

29. rujna 2014.

Real Plus – Minus, you fo' real?



Prije pet mjeseci, na ESPN-ovim stranicama osvanuo je Real Plus-Minus; nova napredna statistika koja je najavljena kao „the next big thing“ u košarkaškoj statistici i koja bi trebala pripomoći boljem razumijevanju utjecaja pojedinca na dinamiku utakmice. Je li uspjela?

Kao što i samo ime govori, RPM je u korelaciji sa standardnim +/- podacima koje sadrži svaki box score, pa čak i onaj na FIBA-inim stranicama (op. a.). Dok obični +/- jednostavno bilježi što se događa s rezultatom dok je pojedini igrač u igri, RPM bi trebao prepoznati da igra s boljim suigračima olakšava nabijanje koš razlike i procijeniti za svakog igrača kako i koliko individualno doprinosi rezultatu. Primjerice, prema običnoj +/- statistici, Matt Barnes rangiran je kao 22. igrač lige, ali to je postigao igrajući sa Paulom (5.), Griffinom (2.) i Jordanom (7.). RPM bi trebao biti u stanju razlučiti koliko je tome doprinijeo sam Barnes, a koliko suigrači, odnosno, trebao bi pokazati da je on sretan što ima suigrače koje ima, a ne obrnuto. Sve to izračuna se preko bayesovske interpretacije vjerojatnosti a priori (ovo zapravo znači da je dio podataka projekcija, tj. „izmišljen“), regresije i sirovih box score podataka za standardni +/- svih igrača koji su na terenu u danom trenutku (suigrača i protivnika). Uz to, postoje odvojeni DRPM za utjecaj igrača na obranu i ORPM za napad.Sama matematika iza ideje, koja zvuči vrlo jednostavno, je komplicirana i dosadna pa je nema potrebe detaljnije objašnjavati. Potrebno je odgovoriti na ono bitno: radi li RPM ono što bi trebao? Daje li stvarno podatak o sirovoj vrijednosti nekog igrača u određenoj ulozi neovisno o okolnostima?

Kratak odgovor je ne. Osnovni problem RPM-a je njegovo brendiranje, pa i ime. Iako se radi o alatu koji će se u nekim situacijama svakako pokazati korisnim, nazvati nešto „stvarnim“ kao da je sve ostalo „nestvarno“, klasičan je senzacionalistički potez ESPN-a koji standardno više brine o broju klikova nego o preciznosti izražavanja. Dalje, gornji opis RPM-a, grubo preuzet sa stranice na kojoj je predstavljen zvuči jednostavno...nemoguće. Košarkaška igra je izoliran sustav s deset članova i svi podaci koje dobivamo van odnose se na svih 10 članova i sve detalje koje rade u igri. Takve podatke tada nije moguće sasvim razdvojiti jedne od drugih i dobiti potpuno neovisnu informaciju o vrijednosti jednog dijela tog sustava što god pokušali. U obranu ESPN-a, ispod tablice stoji napisano da je RPM zapravo posljednja verzija njihove starije statistike, odnosno xRAMP (expected regularised adjusted plus minus). Dakle, ljudi koji stoje iza ove statistike, svjesni su njenih limita i stvarnih ciljeva, odnosno činjenice da su sirov podatak ovim učinili manje sirovim, ali i manjkavim. Drugi ljudi, oni iz marketinškog odjela, baš i nisu. No, na stranu dosadni argumenti poput valjanosti čitave ideje i je li ideja uopće moguća te kako se zapravo zove i što to podrazumijeva. Svaku statistiku najbolje je podvrgnuti dobrom starom očnom testu da bi utvrdili je li ona ispravna. Naravno, ovim stupamo u teritorij subjektivnosti koji je vrlo sklizak teren i u kojem se lako možemo izgubiti o logičkoj zavrzlami stvari; zaključili smo da naša subjektivnost nije dovoljno precizna pa smo uveli statistiku koja bi trebala biti objektivna i time precizna, ali način na koji procjenjujemo točnost te statistike je subjektivan. No spustimo se u ludilo subjektivnosti i usporedimo podatke koje daje RPM s onim za što se smatra da je točno. Gledajući opći poredak igrača prema RPM-u, uz par iznimaka, na prvi se pogled teško može puno prigovoriti, većina igrača na prvoj stranici stvarno je odlična u svojim ulogama i stvarno uvelike doprinosi stvaranju koš razlike za svoju ekipu. Promatrajući dalje tablice prema pozicijama, prvi zabilježeni šok dolazi kada vidimo Kevina Garnetta u top 5 centara, a lagani infarkt nastupa kada tablicu s centrima sortiramo prema obrambenom RPM-u. Naime, Garnett je prema njemu prošle sezone bio najbolji obrambeni centar lige iako svatko tko je makar i površno pratio Netse zna da je KG bio apsolutno nebitan ako ne i štetan za obranu u ono malo minuta koje je odigrao. U redu, nitko nije savršen i pogreške i iznimke se događaju, a uostalom, možda su slučajno obračunati Garnettovi podaci iz 2004. umjesto 2014. Ostatak liste relativno je... DeMarcus Cousins i Andre Drummond iza Tysona Chandlera, Jeffa Witheya i...Pere Antića? No dobro, možda je problem u centarskoj poziciji, pogledajmo krila. Nažalost, ni s krilima situacija nije puno bolja i model govori da je DeMarre Carrol nekako više uspio pridonijeti koš razlici svoje ekipe nego nego Paul George i Carmelo Anthony svojima. I dok model daje poprilično dobre rezultate za poziciju razigravača, na dvojci nastaje apsolutni kaos koji je vrlo teško ikako opravdati.

Zbog ovih bolno očitih i vrlo brojnih nedostataka, RPM  je teško uopće shvatiti ozbiljno, a kamoli prihvatiti ga kao jedan stvaran pokazatelj ukupne individualne kvalitete igrača i kvantifikaciju utjecaja pojedinca na tijek igre. Gotovo sve igrače rangirane previsoko moguće je racionalizirati postavama u kojima igraju, (malom) minutažom, tj. malim statističkim uzorkom ili važnošću njihovih specijalizacija za igru momčadi, ali problem je u tome što RPM ne bi trebao tražiti alibi i pretjerano razumijevanje konteksta nego dati gotove rezultate koji donekle odgovaraju istini  i onome što bi trebalo biti „stvarno stanje“. Upravo zato je u svojoj ideji toliko privlačan tolikom broju ljudi koji prate NBA košarku. Gledajući profil igrača koji su rangirani previsoko (većinom igrači iz drugih postava ili lošijih momčadi) i banalizirajući matematiku iza brojke čini se da RPM „premalo oduzima“ za nižu kvalitetu protivnika, a „previše dodaje“ za nižu kvalitetu suigrača. Možda će to analitičari nakon nekog vremena promijeniti i dodati još jedno slovo u kraticu modela, ESPN će to nazvati Totally Real Plus-Minus, mi ćemo ponovno subjektivnom metodom tražiti nedostatke i tako dalje, krug života napredno statističkog modela.  RPM-u možda treba pružiti još jednu priliku u novoj sezoni i provjeriti kakve će rezultate izbaciti prije nego ga se otpiše kao potpuno irelevantan podatak, no prema njemu su u ovom trenutku skeptični i najveći zagovaratelji napredne statistike. I s dobrim razlogom.


Nema komentara: