CROW Academie: vanaf 10 mei weer cursussen op locatie. Lees meer

Moneyball in Verkeer en Vervoer

06-02-2014
Zijn er statistieken die we kunnen gebruiken om tot effectiever en efficiënter verkeer en vervoer te komen? Met die vraag in mijn achterhoofd ging ik deze week naar ‘Het Grote Big Data Congres’ over verkeer en vervoer. En ik dacht daarbij natuurlijk ook aan ons eigen collectief vervoer dataproject, waar we samen met het veld hard aan werken.

Betere honkbalteams door statistiek

Wachten op een homerunIn 2011 verscheen de film Moneyball. Een waargebeurd verhaal waarin een professionele honkbalorganisatie met een bescheiden budget  computergestuurde analyse van honkbalstatistieken gebruikt om nieuwe spelers aan te trekken, iets dat vaak nog gebeurde op basis van onderbuikgevoel. Als oud-honkballer weet ik hoeveel belang er gehecht wordt aan statistiek Elke prestatie wordt gemeten om zo tot beste resultaat te komen: wie moet wanneer ingezet worden en hoe moet de verdediging staan, om twee voorbeelden te noemen. Die film liet zien dat er nog veel meer mogelijk is. Kan het vakgebied verkeer en vervoer daarvan leren?

Moderne datavergaring

Een verschil met de ‘ouderwetse’ honkbalstatistieken is dat er in verkeer en vervoer ook nieuwe manieren zijn om statistiek te verzamelen. Een paar voorbeelden:
 
  • Mobiele telefoons kunnen op gemiddeld 10 manieren data over onze verplaatsingen genereren, interessant voor verkeer en vervoer. We kijken onderweg vaak op een app, om te zien of we echt in de goede bus zitten bijvoorbeeld. Ook in de auto wordt veel data verzonden de meest gebruikte telefoonmast staat in de buurt van de Coentunnel.
  • We checken in, en als het goed is ook weer out, wanneer we met het openbaar vervoer reizen. Dat moet toch meer informatie opleveren dan een  tel-trede of de tellende chauffeur?
  • ov-voertuigen laten op verschillende manieren weten waar ze zijn en of de dienstregeling wordt gehaald.

Wat kunnen we met N=all?

In plaats van een steekproef of een telling van een deel van de mobilisten, kunnen we nu spreken van ‘N=all’. Maar wat kunnen we daarmee? Als een honkballer goed slaat in avondwedstrijden op kunstgras tegen een linkshandige werper dan is dat nuttige informatie als je ’s avonds tegen een linkshandige werper op kunstgras speelt. Voordat je dat kunt berekenen, heb je veel waarnemingen nodig en moet je vast kunnen stellen dat de — in het genoemde voorbeeld drie — variabelen van invloed zijn geweest. En dat de uitslag niet te maken heeft met andere honkbalgerelateerde zaken, zoals positie in het veld of de slagvolgorde. Of nog andere zaken, als het eten van een bepaalde maaltijd, wel of geen bezoek van zijn vriendin enz.
 
Bij verkeer en vervoer zijn we denk ik nog bezig met het verzamelen van de gewenste data voordat we naar de verbanden kunnen gaan kijken. De druk op budgetten zorgt ervoor dat er andere keuzes gemaakt moeten worden.Daar kan big data bij helpen. Laten we de volgorde niet uit het oog verliezen. Dat veel data verzameld kan worden, wil nog niet zeggen dat het verzameld móet worden. Dat is denk ik van cruciaal belang:wat wil je met de data gaan doen? Welke keuzes wil je gaan maken?
 
Bijvoorbeeld in relatie tot het openbaar vervoer. Wil je weten:
  • waar mensen overstappen?
  • waar je DRIS-panelen niet of juist wel neer moet zetten?
  • of er een busbaan moet komen of prioriteit bij verkeerslichten?
  • of er ruimte is in de dienstregeling?
 
Dit zijn een paar van de vragen die Niels van Oort van de TU Delft noemde, die met big data beantwoord kunnen worden. Die vragen bepalen welke data en welke informatie daaruit je wilt hebben. Oftewel: wat ga je verzamelen (data) en welke verwerkingsslag voer je uit om er de informatie uit te halen die je nodig hebt? 

Met de juiste kennis kun je moeilijke beslissingen nemen

Eén van de lessen die ik heb meegenomen van het congres is: denk goed na over wat je echt wilt weten. Meet niet alleen omdat je iets kán meten,  maar meet omdat het kennis oplevert waarmee je als overheid lastige beslissingen beter kunt nemen. Privacy is daarbij een heel belangrijk issue. Analyseer bijvoorbeeld data van de OV-chipkaart in blokken van een uur om te voorkomen dat het aantal waarnemingen te laag is. Zo voorkom je dat data te eenvoudig tot een individu te herleiden zijn. Je kunt ook een minimum stellen aan het aantal waarnemingen dat je gebruikt voor analyse. Als er een of twee mobieltjes met de auto over een weg rijden, voer je daar geen analyse op uit. Dat doe je beter pas als er bijvoorbeeld tenminste 15 waarnemingen zijn.   Honkbal en statistiek gaan hand in hand

We staan pas aan het begin

Een andere les is dat veel overheden aan het begin staan van het nadenken over de mogelijkheden van statistieken. Dat nemen we mee in ons  collectief dataproject. Het zou zonde zijn als dezelfde mogelijkheden twee of drie keerworden uitgevonden. Om dat te voorkomen, maar om wel tot nieuwe mogelijkheden te komen, werken we samen met veel partners in ons collectief vervoer dataproject. Wat kun je met de OV-chipkaart data als opdrachtgever? Welke mogelijkheden zijn er om MIPOV te optimaliseren? Wat willen we weten over WMo en Leerlingenvervoer om daar keuzes in te kunnen maken? Dat zijn vragen waarmee we al aan de slag zijn gegaan. Later dit jaar komen we met de eerste resultaten.
 
Een voorbeeld van wat we nu al met data doen is te vinden in de dashboards (op basis van bestaande databases), die uiteindelijk zijn gecombineerd in de Duurzaamheidsscore: een score die aangeeft hoe duurzaam de mobiliteit van een gemeente is.
 
Daarnaast verkennen we ook andere mogelijkheden die Big Data voor verkeer en vervoer kan bieden. Dit kan leiden tot nieuwe kennisproducten, bijvoorbeeld op het gebied verkeersmanagement of verkeersonderzoek- en modellen. Het wachten is nog op  een homerun, maar de eerste slag is gemaakt!
 

Guy Hermans (guy.hermans@kpvv.nl)
Programmamanager collectief vervoer
 
 

Reacties

Guy Hermans
Hallo Mike, heldere driedeling en mooie citaten. Kan me inderdaad nog wel wat herinneren over ophef binnen het project waar je over schrijft.

Toegankelijkheid doe ik overigens nog steeds, recent zijn twee publicaties verschenen 'toegankelijkheid leeft!' en nieuwe CROW richtlijn toegankelijkheid.

Wellicht interessant?

De links zijn:

http://www.crow.nl/publicaties/richtlijn-toegankelijkheid

https://www.kpvv.nl/KpVV/KpVVHome/Kennisbank/Onderwerpen-Publicaties/Onderwerpen-Publicaties-Collectief-vervoer/Toegankelijkheid-leeft!.html
17-2-2014 13:19:24

Mike Bérénos
Dag Guy,
Dat is zegge en schrijven 7 jaren geleden, dat we elkaar ontmoet hebben. Voor de Universiteit Hasselt werkte ik toen aan het Europees project “PT-Access” en jij zat bij het kenniscentrum TO-DO. Ik kan me herinneren dat iets toen niet lekker zat, een dubbelinterview/dubbel project vanuit de EU, iemand uit Portugal en ik. Maar dat terzijde.
Graag reageer ik op jouw blog. Ook omdat ik het zag staan en las bij het reageren van mij op de blog van Marleen.

Ik ben het volstrekt met je eens. Laten we zorgen dat Big Data geen big problem voor ons en het vakgebied wordt. Daarvoor liggen er te mooie kansen met big data.
De essentie van je verhaal is goed omgaan met data. Goed omgaan betekent voor mij concreet:
1. beleidsrelevantie betrachten.
2. steeds zorgen voor het evenwicht en de samenhang tussen theorie(vorming) en data-analyse. In deze balans mag het nooit naar één kant doorslaan.
3. aan alle methodologische eisen voldoen.

Het klinkt allemaal zo triviaal, zo logisch en zo voor de hand. Maar in de praktijk zien we van deze drie punten vaak te weinig terug. Laten we e.e.a. niet alleen met de mond belijden (want de drie punten heb je snel op papier gezet), maar ook daadwerkelijk toepassen.
Misschien helpt het om daarbij steeds twee (oude) citaten voor ogen te houden als we met Big Data bezig zijn:
a) Meten is weten, maar je moet ook weten wat je waarom meet.
b) En een even toepasselijk citaat van de grote Albert Einstein: “Not everything that counts can be counted, and not everything that can be counted counts”!
13-2-2014 08:35:28

Abonneer
 Security code
Scroll naar boven