oÞað má alltaf gera betur. Í síðustu færslu setti ég fram gögn um hlaupatíma í 10 km hlaupi í Reykjavíkurmaraþoni frá upphafi. Eftir nokkrar ábendingar frá góðu fólki hef ég betrumbætt þessa tölfræði. Lykilbreytingin felst í því að skipta tímunum upp eftir kyni og setja inn meðaltíma hvers kyns inn á hverja “glæru”.
Enn sem áður er áhugavert að sjá hvernig fjöldi hlaupara óx statt og stöðugt frá 1993 þegar fyrsta 10k hlaupið var í boði (fram að því var bara 7k, 21k og 42k). Toppnum var hins vegar náð árið 2014 og hefur fjöldið aðeins farið niður síðan þá. Munur á milli karla og kvenna helst nokkurn veginn jafn yfir allt tímabilið. Þess ber að geta að gögn frá 2004 eru mjög skrýtin þar sem engir tímar yfir 1:00:00 eru birtir í opinberum gögnum. ÍBR mætti gera betur þar. Samhliða auknum fjölda þátttakenda lækkar / versnar meðaltíminn. Það segir okkur einfaldlega að breiddin í getu þátttakenda er að aukast. Það er hið besta mál að fleiri kjósi að taka þátt í þessu frábæru íþrótt.
Ef eitthvað mætti bæta að þá er það að setja inn miðgildi (median) í stað þess að nota meðaltali. Miðgildi segir til um hver tími þess sem er akkúrat í fyrstu 50% af öllum hlaupurum. Meðaltalið er líklegast alltaf aðeins lakari tími en miðgildið, einkum þar sem að síðustu 10% draga niður meðaltímann meira en fyrstu 10%. Svo eru líka skekkjur í gögnunum, t.d. að einhverjir hlauparar hafa verið skráðir í 10k en hlaupið hálft en fengið tímann sinn skráðan í 10k. Við þessu er ekkert hægt að gera og skekkjan ætti ekki að vera það mikil. Ef við göngum út frá sambærilegri skekkju flest/öll árin eru gögnin alveg lýsandi. Ég vann hins vegar gögnin í Excel og forritið vinnur illa með miðgildi í pivot töflum. Að finna það út hefði tekið umtalsvert meiri tíma og því ákveð ég að nota meðaltali í staðinn.
Sjón er sögu ríkari.
Mynd í haus er tekin af Roman Gerasymenko.
Gögnin eru fengin af hlaup.is
2 thoughts on “Betri sýn á hlaupatíma í 10k Reykjavíkurmaraþons frá upphafi”