Tölfræði Reykjavíkurmaraþons frá upphafi

Ég hef hlaupið í yfir 20 ár og hef reynt að passa upp á að halda nokkuð nákvæmlega upp á hversu mikið ég hleyp og hvenær. Frá því að ég keypti fyrsta Garmin úrið reyndist það ekki erfitt. Ég tók þátt í fyrsta Reykjavíkurmaraþoni (10K) árið 1993 og hef verið reglulegur þátttakandi í því síðan þá, þ.e. ef ég hef ekki verið meiddur eða utan landsteinanna.

Vefsíðurnar hlaup.is og marathon.is hafa svo reynst góð í að fylgjast með tímum þátttakenda, enda vilja allir sjá hvar þeir lenda í röðinni eða hvar þeir standa miðað við alla hina. Vefsíðurnar hafa svo byggst upp í gegnum tíðina og er þar að finna ógrynni gagna um hlaup á Íslandi og er hlaup.is þar í forgrunni, enda hefur Torfi verið ötull að bjóða góða þjónustu við hlaupara af ólíkum toga.

Sýn á gögn

Sjálfur er ég gagnanörd og hef gaman að grúska í tölum og leika mér með framsetningu á gögnum, bæði í leik og starfi. Þannig hef ég saknað þess að tiltölulega erfitt er að fá gögn á nokkuð samræmt form til að horfa heildrænt á gögnin. Ég ákvað því að bæta úr því og byrja á stærsta hlaupi landsins, Reykjavíkurmaraþoni, sem hefur verið haldið síðan 1986. Eins og með stór gagnasett þarf að jafnaði að hreinsa gögnin áður en unnið er með þau. Þá á ég við að koma dálkum, línum og innihaldi þeirra á staðlað form. Sem dæmi um þetta að þá voru íslenskir hlauparar, fyrir hreinsun gagna, í Reykjavíkurmaraþoni stundum skráðir frá „Iceland“, „ISL“, „IS“ eða jafnvel með póstnumeri, þ.e. „IS101“. Sama gilti um önnur þjóðerni. Til að fá rétta sýn þurfti því að koma nokkrum hlutum á hið staðlaða form. All nokkur tími fór í þessa grunnvinnu.

Gögnin eru öll tekin af hlaup.is þar sem ÍBR hafði ekki tök á að senda mér hrágögnin. Mér skilst að öll uppsetning gagna sé unnin í sjálfboðavinnu og utan hefðbundins vinnutíma. Á því hef ég skilning.

Um aðferðafræðina

Í gögnunum, sem telja um 112.000 línur koma eftirfarandi upplýsingar fram.

  • Nafn hlaupara
  • Þjóðerni
  • Kyn (þó ekki fyrir öll ár)
  • Fæðingarár hlaupara (að árinu 2004 undanskildu)
  • Árið sem hlaupið fór fram
  • Lengd hlaups
  • Lokatími (skv. klukku)
  • Flögutími (frá 2004)

Þó ekki sé um meiri gögn að ræða en þetta var gagnasettið nægilega flókið. Þar sem ekki er um að ræða gögn sem hanga á kennitölu getur einstaklingur verið skráður undir mismunandi nafni. Persónulega hef ég verið skráður sem Einar Guðmundsson, Einar G. Guðmundsson og Einar Gunnar Guðmundsson. Hefðbundin forrit, s.s. Excel, túlka þennan sama mann sem þrjá. Ógerningur væri að fara í gegnum öll gögnin og setja alla einstaklinga á staðlað form. Þjóðernið var nokkuð auðveldara þó svo að ljóst sé að margir Íslendingar sem búsettir voru í útlöndum skrá sig stundum frá því landi sem þeir voru búsettir í á hverjum tíma. Ég snerti ekki við landsskráningu hvers hlaupara. Kyn hlaupara reyndist öllu erfiðara en um 30.000 línur voru án kyns. Ég fór handvirkt í gegnum þær línur og setti kyn á hlaupara þar sem það var augljóst. Dæmi: Nöfn á borð við Þorgerður, Cathrine, Horst eru augljós þegar kemur að kyni. Málin flækjast þegar kemur að nafni líkt og Kim, Jean, Remy sem geta verið af báðum kynjum. Slík nöfn voru ókyngreind. Ennfremur lét ég vera að flokka nöfn sem ég hafði ekki þekkingu til að greina, s.s. frá hlaupurum frá Asíu. Þar viðurkenni ég vanmátt minn. Hlaupatímana sjálfa þurfti líka að staðla. Flaga var ekki notuð fyrr en 2004 í Reykjavíkurmaraþoni eða um það leiti hvenær fjöldi hlaupara var farinn að hafa nokkur áhrif á klukkutíma vs. raunverulegan hlaupatíma (flögutíma), einkum í 10 km hlaupinu. Ég nota þannig flögutíma þegar hann er aðgengilegur, annars klukkutímann.

En að gögnunum sjálfum. Þar er margt áhugavert að finna.

FjoldiHlauparaPrAr.png

Fjöldinn segir til um hversu margir eiga skráðan lokatíma. Hér væri reyndar athyglisvert að sjá hvernig þessar tölur samræmast skráningu sem Reykjavíkurmaraþon gefur upp fyrir hlaup. Það segir okkur þá um hversu hátt hlutfall brottfall hlaupara er pr ár.

KynHlaupara10.png

Skoðum þá þróun fjölda í hálfu maraþoni.

KynHlaupara21.png

 

KynHlaupara42.png

Í heilu maraþoni skal tekið fram að um 20% þátttakenda eru ókyngreindir og er þeim því sleppt í myndframsetningu. Leiða má að því líkur að hlutfall karla og kvenna sé sambærilegt þar.

Hraði hlaupara

Við hlauparar erum býsna uppteknir af lokatíma og þ.a.l. hraðanum okkar. Pace (min / km) segir okkur til þetta samband. Hlaupari sem hleypur að meðaltali 15 km per klukkustund er fjórar mínútur með hvern kílómetra (4:00 pace). Hlaupari sem hleypur á 12 km/klst er að jafnaði 5 mínútur með hvern kílómetra (5:00 pace). Fyrsta myndin segir okkur að frá upphafi er meðalhraði hlaupara í hverju hlaupi fyrir sig að lækka. Á því eru eðlilegar skýringar. Fleiri taka þátt í hlaupunum ár frá ári og geta þeirra er jafn breytileg og hlaupararnir eru margir. Æ fleiri sem stunda skokk taka þátt með tímanum. Þetta segir okkur líka að fyrstu 10-15 árin voru hlaup nokkurs konar jaðarsport (fyrir hlaupanörda) en hefur orðið að almenningssporti. Það er auðvitað afar jákvætt. Við þekkjum öll hvað hlaupin gera fyrir mann. Næring á líkama og sál.

medal_pace.png

Önnur framsetning á ofangreindri mynd er að horfa á meðallokatíma allra hlaupara í hverju hlaupi fyrir sig.

Lokatimi10.png

lokatimi21.png

lokatimi42.png

Þar sem meðaltal er ekki góður mælikvarði á hvern einstakan hlaupara eða tiltekinn hóp er áhugavert að skoða „relative performance“. Þannig getum við skoðað hvernig t.d. efstu 25% í hverjum árgangi standa sig milli ára. Er tíminn að fara upp eða niður? Þá fáum við eftirfarandi mynd.

perc10.png

Dökkbláa línan (2%) segir til um hver lokatími efstu 2% hlaupara er og sú appelsínugula um hver lokatími meðalhlauparans (50%) er. Breytingin í öftustu 5% hlaupara (95% percentile) er áhugaverð. Frá árinu 2004 er fjöldi hlaupara að aukast mjög hratt og eðlilegt að margir prófi sig áfram með hlaupin. Tími þeirra skilur sig nokkuð frá hinum. Að öðru leyti fylgja öll prósentubil sama mynstri, þ.e. að tímarnir verða lægri yfir tíma. Aukinn fjöldi hlaupara í 10K skýrir það. Sambærilegt mynstur má sjá í hálfu maraþoni.

perc21.png

perc42.png

Aldurshópar

Þegar gögnin eru skoðuð með tilliti til aldurshópa er áhugavert að sjá að samsetning í 10K hefur ekki mikið breyst frá upphafi þó svo gríðarlegur munur sé á fjölda hlaupara sem sést eðlilega ekki á þessari mynd. Þó má benda á að hlutfall yngri en 50 ára fer úr 70% í ca 57% frá 1993. Þetta skýrist að einhverju leyti að fólk flyst jú milli aldurshópa eftir því sem árin líða og það er líklegt að hlauparar haldi áfram hlaupum þó svo þeir eldist. Það er því eðlilegt að hlutfall 50 ára og eldri fari vaxandi yfir tíma. Til viðbótar eru vafalaust fleiri 50 ára og eldri sem byrja að hlaupa í dag en fyrir t.d. 20 árum.

aldurssamsetning10.png

Það kemur ekki á óvart að í hálfu maraþoni eru langflestir hlauparar á aldrinum 30-49 ára.

aldurssamsetning21.png

Þegar kemur að heilu maraþoni er dreifingin áþekk og í hálfu maraþoni nema hvað aldurshópurinn 50-59 er þar nokkru stærri.

aldurssamsetning42.png

Þess ber að geta að engin aldurstengd gögn eru til fyrir árið 2004 fyrir nein hlaup.

Lokaorð

Það er hægt að spegla þessi gögn fram og til baka. Ég tek gjarnan við ábendingum um það sem betur má fara og/eða nýjum greiningum. Markmiðið er að setja framfleiri greiningar á þessum gögnum á næstunni. Ég hefði kosið að setja þessi gögn í grunn þar sem hægt væri að fletta sér upp og skoða helstu eiginleika hvers og eins á hverju ári fyrir sig með alls kyns mögulegum greiningum. Ég óska eftir gjarnan eftir forritara sem hefði bæði gagn og gaman af því að dunda sér við slíka uppsetningu. Til þess eru aðrir betur fallnir til en ég. Með öðrum orðum, ég átta mig á takmörkuðu notagildi þessara gagna á myndaformi þó svo þau séu áhugaverð að mörgu leyti. Best væri að hafa þau eins gagnvirk og hugsast getur.

Um mig sem hlaupara

Ég bý í Vesturbænum og hef hlaupið með nokkrum hópum þar í gegnum tíðina en hleyp núna með KR-skokk undir frábærri leiðsögn Þorláks Jónssonar og Margrétar Elíasdóttur. Frábær félagsskapur með hlaupurum á öllum getustigum.

Persónuleg met:

5K – 18:07 (2001)

10K – 37:48 (2011)

21K – 1:24:17 (2017)

Strava prófíll og Garmin Connect: Einar Gunnar Gudmundsson

 

Leave a Reply

Please log in using one of these methods to post your comment:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s