Die 27-jährige Heidi Seibold kam 2014 für ihre Masterarbeit an die Uni Zürich. Zu Hause ist die gebürtige Bayerin in Zürich-Affoltern und unterwegs meistens mit den öV und dem Velo. Im Interview erklärt die Statistikerin, die in ihrer Freizeit gerne Salsa tanzt, weshalb sie zusammen mit ihren Kollegen Muriel Buri und Christoph Molnar der Zurich R User Group*, den VBZ, Open Data Zürich und dem Masterprogramm Biostatistik der Universität Zürich am 4. März einen Hackathon organisiert.
Frau Seibold, erklären Sie uns, was man unter einem Hackathon versteht.
Der Begriff Hackathon ist eine Wortschöpfung aus «Hack» und «Marathon». Bei einem Hackathon-Event nehmen die unterschiedlichsten Leute teil – idealerweise sind dies Coder und Fachexperten, die ihr Knowhow zusammenbringen. Bei unserem Hackathon am 4. März sind dies also Verkehrsexperten und Statistiker, die aufeinandertreffen. Die Experten aus dem Bereich Verkehr sollen mit ihrem inhaltlichen Know-how die gewissermassen «fachfremden» Statistiker bei der Arbeit mit den Daten unterstützen. Bei den Daten handelt es sich um die frei zugänglichen Daten der VBZ: Die «Fahrzeiten im SOLL-IST-Vergleich», die «Fahrgastzahlen» und die «Fahrplandaten (inkl. georeferenzierte Linienverläufe des ZVV)» (zugänglich per Februar 2017).
Das eigentliche «Hacken» oder verständlicher gesagt «das Verarbeiten der Daten» findet dann in Teams statt und dauert in unserem Fall einen Tag lang.
Welchen Nutzen haben die VBZ-Kunden davon?
Wir hoffen natürlich, dass wir am Ende des Tages kleine Analysen und Grafiken zeigen können. Besonders spannend wird es jedoch sein, die Ergebnisse mit anderen Datensätzen zu kombinieren. Zum Beispiel Fragen wie «Hat Schneefall einen Einfluss auf die Verspätung von bestimmten Linien?» oder «Wie lange dauert es nach einem Stromausfall bis sich der Fahrplan von Trams normalisiert hat?» sind für Statistiker besonders interessant.
Gibt es am Ende des Tages einen Gewinner?
Es gibt Hackathons, bei denen es ein Preisgeld zu gewinnen gibt. Nicht jedoch bei unserem Event am 4. März. Wir haben uns bewusst gegen einen kompetitiven Anlass entschieden, sondern für ein kollaboratives Arbeiten. Die gute Atmosphäre und der Spirit hinter der Open Data Bewegung sind uns wichtig.
Lassen Sie uns näher auf den Begriff «Open Data» eingehen. Was genau meint dieser?
Open Data bedeutet die freie Verfügbar- und Nutzbarkeit von Daten. Das können Daten aus verschiedenen Bereichen sein, wie beispielsweise Daten von der Regierung (Open Government Data), der Wissenschaft (Open Science Data) oder im aktuellen Beispiel Daten aus dem Verkehrswesen (Open Transport Data). Ziel ist es, mit den frei zugänglichen Daten, vorteilhafte Entwicklungen zu unterstützen und damit mehr Transparenz zu schaffen sowie eine bessere Zusammenarbeit zu ermöglichen.
Die Sensibilität vieler Internet-User, welche persönlichen Daten-Spuren sie hinterlassen, ist hoch. Wie hängt das mit dem Begriff Open Data zusammen bzw. wie rechtfertigen Sie, dass Open Data eine gute Sache ist?
Obwohl mich Statistiken und Daten faszinieren, bin ich ganz klar der Meinung, dass Informationen, die privat sind, privat bleiben sollen. Die VBZ-Daten sind aber keine sensiblen Daten, sondern sehr wertvoll und können daher auch öffentlich zugänglich sein. Das Wissen darüber, wie viele Leute wo und wann unterwegs sind, verletzt nicht die Privatsphäre. Im Gegenteil, im besten Fall können Verbesserungen vorgenommen werden, die den Kunden zu Gute kommen. Und weil die Ideen nicht immer aus der eigenen Unternehmung stammen müssen, ist es umso wichtiger, solche Daten öffentlich zur Verfügung zu stellen. Die VBZ ist damit ein sehr fortschrittliches Unternehmen.
Wie ist die Partnerschaft zwischen der Zurich R User Group, den VBZ, Open Data Zürich und dem Masterprogramm Biostatistik der Universität Zürich entstanden?
Ich habe Reto Wick und Marco Sieber, die Open Data Spezialisten der Stadt Zürich, über das «R User Meetup» kennengelernt. Sie zeigten damals auf, wie man bei der Stadt Zürich mit Open Data umgeht und welche Daten bereits heute auf dem Open Data Portal der Stadt Zürich zur Verfügung stehen. Als zu einem späteren Zeitpunkt die Idee eines Hackathons aufkam, empfahlen sie dazu, die Daten der VBZ zu verwenden, welche ebenfalls auf dem Portal der Stadt Zürich zugänglich sind. Die Daten seien spannend und es wäre schade, sie nicht auszuwerten. Des Weiteren eignen sie sich gut für den Hackathon, weil man viele verschiedene Fragen damit beantworten könne. Die grosse Menge an SOLL-IST-Fahrplandaten ist eine besondere Herausforderung, die man als Team besser bewältigen kann.
Wie viele Teilnehmer können sich für den Hackathon am 4. März anmelden? Gibt es bestimmte Voraussetzungen, die man erfüllen muss?
Maximal 60 Teilnehmer können sich bis zum 26.Februar 2017 online anmelden. Basic Skills sind natürlich vorausgesetzt, aber ein aufwändiges Auswahlverfahren gibt es nicht. Wir erwarten auch nicht zwingend nur Statistik-Experten, sondern auch Interessierte, die beispielsweise schöne Grafiken und Visualisierungen erstellen können.
Welches Rahmenprogramm erwartet die Teilnehmerinnen und Teilnehmer?
Nebst dem Hacken finden während des Tages auch verschiedene Impuls-Referate zum Thema statt. Zum Mittagessen gibt es, wie das bei Hackathons üblich ist, Pizza. Abends schliessen wir die Veranstaltung mit einem Apéro. Die Teilnahme am Event sowie die Verpflegung sind für die Teilnehmenden selbstverständlich kostenlos.
Was würden Sie sich wünschen, was bei dem Hackathon entsteht?
Natürlich wäre es schön, wenn das Thema Open Data dadurch noch bekannter würde. Das liegt mir sehr am Herzen. Des Weiteren ist es natürlich schön, dass wir so einen Beitrag im Rahmen des internationalen Open Data Day leisten.
Wann und wo können wir einsehen, was aus dem Hackathon entstanden ist?
Wir wollen den Code und die Ergebnisse aller Projekte auf GitHub veröffentlichen. Das ist eine Online-Plattform, die für solche Zwecke viel genutzt wird. Ich hoffe, dass vielleicht auch Blogeinträge, Webseiten oder Apps entstehen. Diese werden wir auf jeden Fall über unsere Webseite verlinken.
Und Ihr persönliches Ziel?
Der Event soll Spass machen und interessante Leute zusammenbringen, die Freude an spannenden Daten haben.
* Die Zurich R User Group ist eine Meetup Gruppe, die sich über ihre Meetup-Website organisiert.
Über den Hackathon:
Datum: Samstag, 4. März 2017Zeit: 9.00 bis 17.00 UhrOrt: Universität Zürich, Karl Schmid-Strasse 4, 8006 Zürich, Räume KO2-F-150 und KO2-F-152Anmeldung: Online via Zurich R User Group WebsiteAnmeldeschluss: 26. Februar 2017Die Teilnahme ist kostenlos.
Die VBZ stellen ihre Daten auf dem Open Data Portal der Stadt Zürich zur Verfügung:
– Fahrzeiten Soll-Ist-Vergleich
– Fahrgastzahlen
– Georeferenzierte Linienverläufe des ZVV (zugänglich ab Februar 2017)
Die Fahrplan-Daten werden wöchentlich, die Fahrgastzahlen jährlich und die georeferenzierten Linienverläufe des ZVV alle ein bis zwei Wochen aktualisiert.
Erfahren Sie mehr über das Open Data Portal der Stadt Zürich im Interview von 2015 mit Reto Wick, Open Data Spezialist.