Het genereren van een populatie voor een Activity Based model

Het genereren van een populatie voor een Activity Based model

 

Gerdien Klunder, Erik de Romph, Bachtijar Ashari

In de wereld van de verkeersmodellen komt er recent meer aandacht voor Activity Based modellen. Dit zijn modellen die uitgaan van het mobiliteitsgedrag van individuen, waarbij de activiteiten per individu centraal staan. De trips in deze modellen zijn gekoppeld aan de verschillende activiteiten die een persoon over de gehele dag uitvoert. Dit levert een ketenverplaatsing op in plaats van losse trips uit een OD matrix. Welke activiteiten dit zijn (en waar), hangt af van de eigenschappen van een persoon. Denk bijvoorbeeld aan leeftijd, geslacht, en inkomen. Een werkende veertiger heeft bijvoorbeeld heel andere activiteiten dan een gepensioneerde of een schoolkind. Deze aanpak heeft als groot voordeel dat de effecten van nieuwe maatregelen of mobiliteitsconcepten (denk aan MAAS – Mobility as a Service) veel beter bepaald kunnen worden, omdat de wijze waarop mensen hun gedrag aanpassen afhangt van allerlei persoonlijke eigenschappen van deze mensen. In een Activity Based model kan dit gemodelleerd worden, omdat er in het model een populatie aanwezig is met individuele eigenschappen per persoon. TNO en de universiteit van Hasselt ontwikkelen momenteel het project Urban Tools Next een prototype Activity Based model voor heel Nederland, met de focus op de regio Rotterdam/Den Haag.

De populatie van een Activity Based model is een belangrijk onderdeel van het model. Echter, hoe kom je aan zo’n gedetailleerde populatie? Traditionele verkeersmodellen gebruiken gegevens op zoneniveau, maar niet op individueel niveau. Vanwege de wet op privacy zijn veel gegevens van individuen niet openbaar. Voor de ontwikkeling van het Activity Based model heeft TNO zich tot doel gesteld om een zo realistisch mogelijke populatie te genereren, gebaseerd op de meest gedetailleerde gegevens die er zijn in Nederland. Binnen het CBS zijn heel veel gegevens van alle inwoners van Nederland aanwezig, opgeslagen in zogenaamde microdata. Via een beveiligde omgeving is het mogelijk deze gegevens in te zien, echter, ze mogen niet naar buiten gebracht worden op individueel niveau. Het kleinste niveau waarop de gegevens geëxporteerd mogen worden, is als groep van minimaal 10 personen. De aanpak die we hebben gevolgd is om de gewenste gegevens van de populatie binnen de beveiligde omgeving van het CBS te aggregeren naar het zone niveau van het Activity Based model, vervolgens te exporteren, en buiten de CBS omgeving weer te desaggregeren naar individueel niveau met behulp van diverse schattingsmethoden. Op deze manier hebben we een populatie gegenereerd met de volgende individuele kenmerken: leeftijd, geslacht, herkomst, rijbewijsbezit, opleidingsniveau, huishoudsamenstelling, inkomenscategorie, werkstatus, aantal beschikbare personenvoertuigen in het huishouden, wel/geen OV kaart.

De belangrijkste schattingsmethode die we gebruikt hebben, is de IPF methode, Iterative Proportional Fitting. Dit is een algoritme om een matrix te schatten als de rij- en kolomtotalen bekend zijn. In het geval van de populatiegenerator gaat het hierbij telkens om twee variabelen die bepaalde relatie met elkaar hebben, waarvan de totalen per zone wel bekend zijn, maar niet de combinatie van deze variabelen. Denk bijvoorbeeld aan de eigenschappen leeftijd en geslacht. Per zone weten we hoeveel mensen er wonen per leeftijdscategorie en hoeveel mannen en vrouwen in totaal, maar niet hoeveel mannen en vrouwen er zijn per leeftijdscategorie. De IPF-methode gebruikt een achtergrondmatrix als initiële schatting, en voert vervolgens een aantal iteratieve berekeningen uit op de kolommen en rijen totdat de totalen kloppen. Deze methode is al door diverse onderzoekers gebruikt voor populatieschatting [Choupani, 2016]. Er zitten echter nog wel wat lastige kanten aan, zoals dat het resultaat gebroken getallen oplevert, terwijl we hele getallen nodig hebben voor de populatie. Ook is het niet voor alle variabelen toepasbaar, met name als er een meer complexe koppeling gemaakt moet worden met huishoudens.

Voor het mobiliteitsgedrag is het soms van belang om te weten hoe de huishoudsamenstelling is van een individu. Er kan bijvoorbeeld rekening gehouden worden met het aantal beschikbare auto’s, en met de gecombineerde trips. Een moeder brengt bijvoorbeeld eerst haar kinderen naar school en rijdt vervolgens door naar haar werk. Het samenstellen van deze huishoudens uit de individuele personen in de populatie is een grote uitdaging. Binnen een huishouden bestaan allerlei verbanden, zoals leeftijdsverschillen en herkomst, die ook op een realistische wijze in de fictieve populatie moeten zitten. De IPF methode kan hier niet voor gebruikt worden. We hebben hiervoor verschillende aannames gedaan en wiskundige/heuristische methodes geïmplementeerd.

Met het Activity Based model willen we ook scenario’s voor de toekomst door kunnen rekenen. Daarom hebben we ook een populatie geschat voor het jaar 2030. Deze schatting is gebaseerd op verschillende gegevens en aannames, o.a. over de bevolkingsgroei en de veranderende samenstelling naar leeftijd, geslacht en herkomst.

Uiteindelijk hebben we op deze wijze diverse populaties gegenereerd voor het jaar 2016 en het jaar 2030. Een uitdaging was ook het beheersbaar houden van de enorme hoeveelheid gegevens en van de verschillende uitkomsten die iedere verandering in het model opleverde. Om na te gaan of de gegenereerde populatie realistisch is, is er een validatie uitgevoerd aan de hand van de geaggregeerde gegevens van het CBS. De resultaten van deze validatie zijn in beeld gebracht met behulp van Power-BI. Hiermee is van elke populatie inzichtelijk gemaakt hoe groot de verschillen zijn ten opzichte van de gegevens van het CBS en ten opzichte van elkaar, per doorsnede van individuele kenmerken (bijvoorbeeld leeftijdsverdeling) op landelijk en op zonaal niveau, en per doorsnede van combinaties van kenmerken. Deze evaluatie leverde vertrouwen op voor de kwaliteit van de populatie voor een groot aantal doorsnedes, maar bracht ook punten aan het licht waarop de populatie nog niet nauwkeurig genoeg is. Dit gaat met name om de koppeling van de personen aan huishoudens, en het aantal personenvoertuigen per huishouden. Dit zijn punten van verder onderzoek. Ook voor de generatie van een toekomstpopulatie zijn er verbeterpunten, waaronder het voertuigbezit, dat in de toekomst waarschijnlijk zal veranderen door de introductie van o.a. MAAS.

Het genereren van een populatie met individuele eigenschappen is een relatief nieuw onderzoeksonderwerp in de verkeerswereld, waarover nog veel te leren valt en veel interessante mogelijkheden biedt voor verkeersmodellering.

In de presentatie voor het PLATOS colloquium zullen we de methodiek in meer detail toelichten en voorbeelden laten zien van de resultaten van de validatie van de gegenereerde populaties.

Referenties:

Abdoul-Ahad Choupani, Amir Reza Mamdoohi. Population Synthesis Using Iterative Proportional Fitting (IPF): A Review and Future Research. In: Transportation Research Procedia, volume 17, 2016.

Download presentaties 2018
Don’t spoil…