track4science ist eine Pilotstudie zur Erfassung von Mobilitätsdaten über eine Smartphone-App. Die Studie wurde vom Ferdinand-Steinbeis-Institut in Zusammenarbeit mit der Technischen Hochschule München durchgeführt und von der Dieter Schwarz Stiftung und der Innovationsinitiative mFUND des Bundesministeriums für Digitales und Verkehr gefördert.
Die Datenerhebung erfolgte über eine App. Diese nutzt Sensordaten des Smartphones, etwa GPS, Beschleunigungssensor, Wi Fi oder Mobilfunknetze, um Fahrten und Verkehrsmittel wie zu Fuß, Fahrrad, Auto oder öffentliche Verkehrsmittel zu erkennen.
Bereitgestellt werden anonymisierte Daten in folgender Form:
- Zurückgelegte Verkehrswege der Teilnehmenden: Ein Verkehrsweg kann aus mehreren Tracks bestehen, also Routen mit einem Verkehrsmittel, sofern weniger als 15 Minuten Aufenthalt zwischen zwei Tracks besteht. Bereitgestellt wird der Modal-Split des zurückgelegten Verkehrswegs bezogen auf die zurückgelegten Kilometer pro Verkehrsmittel.
- Länge des Verkehrswegs in Sekunden
- Anfangs- und Endpunkt des Verkehrswegs auf PLZ-Ebene: Für PLZ auf 5-stelliger Ebene gilt die Anonymitätsregel, das mindestens drei Personen dieselbe PLZ-Kombination innerhalb einer Woche aufweisen müssen, andernfalls werden die PLZ-Stellen durch entfernen der letzten Ziffern schrittweise anonymisiert bis eine K=3 Anonymität erreicht ist. Für Verkehrswege außerhalb Deutschlands ist die PLZ leer.
- Zeitstempel der Verkehrswege aggregiert auf Kalenderwoche, Jahr und 4-Stunden-Zeitfenster.
- Für jeden Nutzer wird wöchentlich eine neue User-ID vergeben, um einerseits die Anonymität zu gewährleisten, andererseits Verkehrsroutinen untersuchen zu können.
Verfügbare Daten
Es handelt sich um statische Daten, die von Juni 2024 bis Oktober 2025 erfasst wurden. Die Daten wurden dabei deutschlandweit erhoben, wobei die Rekrutierung der Teilnehmenden fokussiert auf dem Bildungscampus Heilbronn stattfand.
Zugang
Die Daten stehen als CSV zum Download zur Verfügung. Folgende Attribute sind dabei enthalten:
- UserId (string) – Anonymisierte Benutzerkennung, wöchentlich neu gehasht.
- StartPLZ (string) – Anonymisierte Postleitzahl des Startorts, gespeichert als Zeichenkette. Mögliche Formate:
- ##### – vollständige 5-stellige PLZ
- ###XX – 3-stelliger Präfix
- ##XXX – 2-stelliger Präfix
- #XXXX – 1-stelliger Präfix
- XXXXX – vollständig anonymisiert
- Wenn sich der Startort außerhalb Deutschlands befindet oder keine PLZ verfügbar ist, bleibt das Feld leer ("").
- EndPLZ (string) – Anonymisierte Postleitzahl des Zielorts. Gleiche Formate und Anonymisierungslogik wie bei StartPLZ. Wenn sich der Zielort außerhalb Deutschlands befindet oder keine PLZ verfügbar ist, bleibt das Feld leer ("").
Verkehrsmittel-Distanzen (integer, in Metern)
- other_Length – Distanz mit sonstigen oder unklassifizierten Verkehrsmitteln.
- airplane_Length – Zurückgelegte Distanz mit dem Flugzeug.
- bicycle_Length – Zurückgelegte Distanz mit dem Fahrrad.
- bus_Length – Zurückgelegte Distanz mit dem Bus.
- cable_car_Length – Zurückgelegte Distanz mit der Seilbahn.
- car_Length – Zurückgelegte Distanz mit dem Auto.
- e_scooter_Length – Zurückgelegte Distanz mit dem E-Scooter.
- ferry_Length – Zurückgelegte Distanz mit der Fähre oder dem Boot
- light_rail_Length – Zurückgelegte Distanz mit der Stadtbahn oder S-Bahn.
- moped_Length – Zurückgelegte Distanz mit dem Moped.
- motorcycle_Length – Zurückgelegte Distanz mit dem Motorrad.
- regional_train_Length – Zurückgelegte Distanz mit dem Regionalzug.
- subway_Length – Zurückgelegte Distanz mit der U-Bahn.
- train_Length – Zurückgelegte Distanz mit dem Fernzug.
- tram_Length – Zurückgelegte Distanz mit der Straßenbahn.
- walk_Length – Zurückgelegte Distanz zu Fuß.
Zeitbezogene Attribute
- journey_duration_s (integer) – Gesamtdauer der Reise in Sekunden.
- calendarweek (integer) – Kalenderwoche der Reise (1–53).
- year (integer) –– Jahr des Reisebeginns.
- start_timeframe (string) – 4-Stunden-Zeitfenster des Reisebeginns (z. B. 08:00–12:00).