Small data

Finish SD Embrun 2019

Big data heeft beloften en gevaren in zich, zeggen ze. Als onderwijsonderzoeker ben ik niet zo’n rekenaar (anders was ik wel statisticus geworden). Het liefst heb ik data die kan horen, zien, voelen en ruiken. Die rechtstreeks uit het klaslokaal komen. Bestaande, vaak cijfermatige data in de systemen van de school worden tegenwoordig gebruikt bij zogenaamd ‘learning analytics’, net zoals dynamische data van en over sporters gebruikt worden bij ‘sports analytics’ (zie bijvoorbeeld https://medium.com/@divyemadan.19/sports-analytics-the-game-changer-a846af556348). Nu ik mijn eigen cijfermatige data nu een tijdje volg en analyseer, raak ik meer en meer erdoor gefascineerd. Het is ware datadoping. Wel roepen die data allerlei vragen bij me op. Hoe berekent Polar eigenlijk de hartslag die getoond wordt? En qat wordt er dan doorgestuurd als ik synchroniseer? De berekening die ik op mijn horloge zag ,of de ruwe data van tijd en plaats en hartslagen? Beroepsdeformatie zullen we maar zeggen.
Of je data van één persoon over tijd ook groot moet noemen weet ik, maar ik ben op basis ervan (hier meer over mijn trainingsdata) maar eens aan het prognotiseren begonnen voor Almere. Spoiler alert, het zegt allemaal niets.
Eerst even intuïtief een prognose. Op gevoel, hoewel dat, nu ik al in de data gedoken ben, niet helemaal zonder kennis is uiteraard. Ik voel me fit, doe in wedstrijden lekker mee in het veld (loop in ieder geval niet achteraan) en ik blijf stukken steeds sneller zwemmen/fietsen/lopen. Vanuit dat gevoel denk ik dus dat als het heel goed gaat ik misschien wel onder een uur kan zwemmen, maar dat het waarschijnlijk tussen een uur en 1:10:00 zal worden. Voor fietsen hoop ik onder de zes uur te halen, omdat ik denk wel gemiddeld iets meer dan 30 km/uur te kunnen fietsen. Tot slot hoop ik dat ik de marathon ergens tussen vier en vierenhalf uur kan lopen. Dan kom ik dus tot een bandbreedte van 10:45 en 12:15 uur. Lekker ruime marge, zie onderstaande tabel.

Tabel 1: geschatte tijd op intuïtie

Dan nu het echte rekenwerk. Dit seizoen heb ik drie triatlons gedaan die ik als uitgangspunt kan nemen: Oud-Gastel (1/3), Aarschot (1/3) en Embrun (Olympische Afstand). Als ik daarvan de snelste tijden voor elk onderdeel neem en die extrapoleer[1] naar een hele, dan kom ik uit op onderstaande tabel. Onder de tien uur, dat lijkt wel heel snel.

Tabel 2: geschatte tijd op basis van eerder races

Omdat je natuurlijk niet zomaar het ene parcours met het andere kan vergelijken en je ook heel anders racet in een korte wedstrijd, kan ik beter uitgaan van de snelheid die ik lang kan volhouden. De literatuur zegt dat je een hele triathlon in zone 2, met af en toe een uitschieter naar zone 3 zou moeten kunnen volhouden.[2] Als ik dus van die zones de snelheid neem en die omreken naar de tijd die ik over elk onderdeel doe, kom ik tot onderstaande tabel. Ook weer een ruime bandbreedte tussen 9 1/2 en bijna 12 uur.

Tot slot de benadering die ik de sportcommentatorbenadering noem: op basis van eerder rankings inschatten hoe hoog ik in Almere kom. Maar dan in tijd. Dus ik neem de gemiddelde ranking in percentage van het aantal deelnemers van elk onderdeel, reken die om naar de ranking in Almere en zoek daarbij de tijd die in 2018 in Almere is gelopen. Een beetje vergezocht misschien. Maar wel leuk rekenwerk en een interessante tabel.

Tabel 4: geschatte tijden op basis van rankings

Kortom, de resultaten uit het verleden laten zien dat ik tussen de 9 1/2 en 13 1/2 uur over het wedstrijdje zou kunnen doen. Maar ja, resultaten uit het verleden zeggen niet zo veel. Je zult maar bij de finish staan te supporteren.

De eindtijden die dit oplevert zien er voor mij wat geruststellender uit en kloppen ook beter met mijn eerdere natte vingerwerk. Wel ook weer een brede marge. 12:25u. is de tijd die nr 63 in Heren 45+ in 2018 heeft gelopen. 13:25u. is de som van elk onderdeel, zonder wissels (die ik heb nergens mee gerekend, maar gezien de bandbreedte maakt 5 of 10 minuten wisselen niet heel veel uit).

Kortom, de resultaten uit het verleden laten zien dat ik tussen de 9 1/2 en 13 1/2 uur over het wedstrijdje zou kunnen doen. Maar ja, resultaten uit het verleden zeggen niet zo veel. Je zult maar bij de finish staan te supporteren.

Voetnoten

[1]Extrapoleren is in de wetenschap altijd riskant! In de financiële wereld zeggen ze dan:”Resultaten uit het verleden….”

[2] In mijn trainingsschema’s ga ik uit van de zones (7) van Matt Fitzgerald and David Warden in hun boek 80/20 Triathlon: Discover the Breakthrough Elite-Training Formula for Ultimate Fitness and Performance.

,

Geef een reactie