Bei einem Vergleich zweier praktizierter Designs zur Erhebung der Mobilität zeigt sich schnell, dass zur Beurteilung der Ergebnisse genauere Kenntnisse über den Einfluss des gewählten Designs erforderlich sind. Auch oder gerade beim SrV (System repräsentativer Verkehrserhebungen).

Vergleichbarkeit von Erhebungen zum Mobilitätsverhalten

Vor einiger Zeit erreichte uns bei Socialdata eine Ausschreibung zu einer Mobilitätserhebung. Wir haben uns an dieser Ausschreibung nicht beteiligt. Aber eine Anforderung aus der Ausschreibung gab Anlass zu einem interessanten Gedankenspiel und mündete letztlich in diesem Beitrag.

Es wurde nämlich verlangt, dass die erhobenen Daten mit denen des SrV (TU Dresden) vergleichbar sein sollten, weil man sich zukünftig (2013) an dieser Erhebung beteiligen wolle.

In dieser Aufforderung drückt sich eines der vielen Probleme aus, die die empirische Mobilitätsforschung in Deutschland hat: Das Verständnis für den Einfluss der Erhebungsmethodik auf die erhobenen Daten. Dabei gehört es doch zum Grundwissen jeder empirischen Wissenschaft, dass das gewählte Messverfahren die Ergebnisse beeinflusst (und das übrigens nicht nur in den Sozialwissenschaften). Wenn man weiß, dass die im SrV gewählte Methodik sich bei den letzten Erhebungen immer wieder verändert hat und dass weitere Veränderungen angekündigt sind, dann ist es schon ein bisschen keck, in einem Ausschreibungsverfahren 2011 Vergleichbarkeit zu einem noch nicht bekannten Design 2013 zu verlangen. Aber das soll hier nicht unser Thema sein. Unser Thema ist: Können wir unsere (KONTIV-) Erhebungen (in etwa) vergleichbar machen mit dem, was wir über das SrV-Design wissen.

Wirkung von Erhebungsdesigns

Um Erhebungsdesigns vergleichbar zu machen, muss man ihre Wirkung auf die Ergebnisse kennen. Dabei gibt es bei Erhebungen zur Mobilität drei wichtige Wirkungsfelder:

Wirkungen des Designs

In unserer Betrachtung hier können wir uns auf zwei dieser drei Felder konzentrieren:

  • a) Non-response (NR) Bei keiner empirischen Erhebung gelingt es, dass alle für eine Stichprobe ausgewählten Teilnehmer auch tatsächlich an der Erhebung teilnehmen. Bei der gängigen Berechnung des Stichproben­fehlers (Signifikanz; umgangssprachlich: richtig) wird dieser Effekt (so gut wie) immer ausgeblendet. Dabei hat er große Bedeutung. In der letzten Ausgabe der mobilogisch! haben wir am Beispiel der nationalen Mobilitäts­ erhebung in den Niederlanden gezeigt, dass alleine der durch non-response erzeugte Fehler bis zu fünfzehnmal größer sein kann als der Zufallsfehler.
  • b) Non-reported trips (NRT) Verlässliche Erhebungen der Mobilität befragen wegebezogen, in der Regel in einer Art Tagebuch für einen oder mehrere Stichtag(e). Dabei darf man nicht glauben, dass alle Menschen immer alle Wege genau berichten. Vielmehr gibt es Wege, die absichtlich oder unabsichtlich nicht angegeben werden (non-reported trips). Bei den NRT muss man unterscheiden zwischen solchen, die man mit einem geeigneten Design entdecken kann (z.B. fehlende Heimwege), solchen, die man bei einer gezielten Nachexploration findet und solchen, die man gar nicht findet. In einer Untersuchung für die BAST1) haben wir diese Thematik genauer untersucht und festgestellt, dass bei einem professionellen Design der Anteil der überhaupt ermittelbaren NRT etwa 14 % beträgt, wovon knapp die Hälfte bei der Aufbereitung und Codierung der Fragebogen gefunden und korrigiert werden können. Dabei ist wichtig zu wissen, dass sich beide Effekte gegenseitig beeinflussen. Schlechte Designs machen das Antworten schwierig und damit ungenau (hoher NRT-Anteil) und frustrieren in Folge die potentiellen Antworter (hoher NR-Anteil).
Design-Einfluss

Zur Veranschaulichung dieses Zusammenhanges kommt uns zugute, dass das KONTIV-Design mit der schriftlich/ postalischen Methode arbeitet. Dabei können alle Fragebogen zu einem kontrollierbaren Zeitpunkt versendet werden. Je nach Interesse an der Befragung, Qualität des Designs und der Nachfass-Aktio­nen antworten die Befragten dann schneller, langsamer oder gar nicht. Da es relativ einfach ist, die Antwort­geschwindigkeit zu messen, ergibt sich ein guter Indikator für den Design-Ein­fluss. Bei einem schlechten Design ist der Rück­lauf gering, es antworten nur die Interessierten (das sind Menschen mit überdurchschnittlicher Mobilität), dafür ergibt sich aber ein höherer NRT-Anteil.

So läge beispielsweise bei einer Antwortquote von 20 % der Anteil der NRT bei etwa 25 %, gleichzeitig ist aber die Mobilität der 20 % Antworter um etwa 25 % höher als sie im Gesamt gewesen wäre. Es ergibt sich der ebenso kuriose wie irreführende Effekt, dass sich beide Wirkungen scheinbar weitgehend ausgleichen. Dafür gibt es auch ein reales Beispiel (aus Wien 1993, das wir in einer anderen Publikation ausführlich beschrieben haben2)). Da dort die ermittelte Wege-Anzahl dem erwarteten Durchschnitt entsprach, fiel nicht auf, dass über­durch­schnittlich Mobile überdurchschnittlich unvollständig geantwortet haben. Das Ergebnis war unter anderem ein völlig unrealistischer ÖPNV-Anteil (37 %), der als Basis eines Stadtratsbeschlusses mit einem nie erreichbaren Wert für 2010 diente.

Vergleich zweier Designs

In diesem Beitrag wollen wir aber die Frage behandeln, wie man zwei Erhebungsdesigns (KONTIV und SrV) einander angleicht. Da kommt es uns zugute, dass es drei Städte gibt, in denen sowohl eine KONTIV als auch ein SrV durchgeführt wird: Augsburg, Fürth und Halle. In allen drei Städten wird die KONTIV seit Jahren als „echte“ KONTIV durchgeführt (also über das ganze Jahr) mit Stichproben, die schon für ein Jahr größer sind als die im Fünfjahres-Abstand durchgeführte SrV. Falls Sie, liebe Leser, fragen, warum man diesen Doppelaufwand betreibt, tun Sie es nicht. Es ist eine der vielen Merkwürdigkeiten der Mobilitätsforschung in Deutschland (und nicht einmal die verwunderlichste).

Immerhin ist es damit möglich, die beiden Erhebungen miteinander zu vergleichen (wobei wir uns im Falle SrV mit den wenigen uns zugänglichen Daten begnügen müssen). Dabei ist es wichtig zu wissen, dass die SrV-Erhebung sich nur auf die Stichtage Dienstag, Mittwoch und Donnerstag bezieht und dieses Konstrukt „durchschnittlichen Werktag“ nennt.

Im Jahr 2008 – dem letzten Jahr, für das es SrV-Daten gibt – waren die Antwortquoten der KONTIV’s in den drei Städten sehr gut: Für alle Tage des Jahres 80 %, für alle Werktage und auch für Dienstag / Mittwoch / Donnerstag sogar 83 %. Rücklaufquoten für die SrV-Erhebung in den drei Städten haben wir nicht. Für 2008 gesamt lag die Ausschöpfung für die teilnehmenden Städte zwischen 20 und 37 %. Dies ist ein besonders deutliches Beispiel für das in unserem letzten mobilogisch!-Beitrag kritisierte (mangelnde) Qualitätsbewusstsein bei Mobilitätserhebungen in Deutschland. Denn wie sollen denn verlässliche Aussagen zum Mobilitäts­geschehen gemacht werden, wenn bis zu 80% der Haushalte in der Stichprobe gar nicht an der Befragung teilnehmen? Und wie sollen diese Daten seriös verglichen werden mit denen aus anderen Erhebungen mit wesentlich besseren Designs und deutlich höheren Antwortquoten?

Hinzu kommt, dass sowohl die TU Dresden wie auch das durchführende Institut genau wissen, wie Erhebungsdesigns besser gestaltet werden und (deutlich) höhere Antwortquoten erzielt werden können. Mit dem ebenso simplen wie nicht belegbaren Argument des „sich insgesamt verschlechternden Befragungsklimas“3), mit dem angeblich „eine Vielzahl anderer in der Bundesrepublik stattfindender Bevölkerungsbefragungen zu kämpfen haben“3), wird die Schuld in bewährter Weise den Befragten in die Schuhe geschoben und die Fachöffentlichkeit (einschließlich der Geldgeber) nimmt das einfach hin.

Wir wollen das hier nicht weiter kommentieren, erlauben uns aber noch einen Hinweis: Bei pro­fessioneller Durchführung einer Mobilitätserhebung ist es in Deutschland gar nicht möglich, lediglich Antwortquoten von 20 – 30 % zu erreichen. Es sei denn, man macht vorsätzliche Feh­ler oder grobe Vereinfachungen.

Design-Angleichung

Für unsere nachfolgenden Betrachtungen mussten wir einen Rücklaufwert für das SrV in den drei Städte annehmen. Wir haben ihn bei 30 %, also etwas über der arithmetischen Mitte, angesetzt.

Rücklauf-Quoten

 

Bei den folgenden Auswertungen wurden die Werte der drei Städte im Verhältnis 1 zu 1 zu 1 gewichtet. Danach ergab sich für die Mobilität ein Wert von 3,07 Wegen pro Person/ Tag. Dieser Wert ist nur unwesentlich höher als der entsprechende KONTIV-Wert für die Werktage.

Verkehrsmittelwahl

 

Bei der Verkehrsmittelwahl (hauptsächlich genutztes Verkehrsmittel) sind die Ergebnisse ebenfalls sehr ähnlich, wenngleich der höhere Anteil an Fuß- und der geringere an Pkw­Fahrer-Wegen beim SrV sicher dem dabei verwendeten Design zugerechnet werden kann.

Wenn wir jetzt versuchen wollen, das KONTIV-Design dem des SrV anzupassen, müssen wir von gerundeten Prozentwerten zu Wegen pro Person und Tag wechseln. Dies verlangt den Gebrauch zweistelliger Kommawerte (bedeutet aber keinen Gewinn an Genauigkeit).

Nach dem eingangs vorgegebenen Rahmen muss zunächst eine KONTIV mit 30 % Antwortquote hergestellt werden. Das ist relativ einfach, wenn man die Rücklaufgeschwindigkeit erfasst hat. Eine Auswertung der ersten 30 % ergibt das erwartete Bild: Die Wege-Anzahl (3,58) ist deutlich höher als in der KONTIV-Gesamt (3,03 und im SrV 3,07). Das liegt in dem in Kapitel 2 skizzierten Erwartungsbereich. Dabei sind die Unter­erfassungen im SrV (insgesamt –16 %) am höchsten beim motorisierten Individualverkehr (-21 %) und am geringsten beim öffentlichen Verkehr.

Wege pro Person/ Tag

In dieser Auswertung sind allerdings die non-reported trips (NRT) bereits enthalten. Die muss man unterscheiden nach erkennbaren und explorierbaren. Die erkennbaren werden vermutlich in beiden Designs erkannt und korrigiert (klassisches Beispiel ist hier der vergessene Heimweg).

Bei den explorierbaren ist das etwas anderes. Wir gleichen hierzu die eingegangenen Tagebücher sorgfältig miteinander ab, denn gerade dieser Vergleich gibt wichtige Hinweise darüber, wie ein Haushalt seine Alltagsmobilität organisiert. Dieser Abgleich ist aufwändig, verlangt den Einsatz von Menschen und konkrete Aufzeichnungen des Mobilitätsgeschehens (am besten auf Papier). Insgesamt verwenden wir für diese Daten­validierung fast genauso viel Zeit wie für die Datensammlung.

Das wird bei der SrV-Erhebung anders sein. Ein großer Teil der Befragung wird telefonisch durch­geführt, obwohl es nahezu unmöglich ist, eine Stichtagsbefragung aller Haushaltsmitglieder am Telefon durchzuführen (dazu müssten nämlich alle Haushaltsmitglieder gleichzeitig anwesend und befragungsbereit sein). Wir haben schon in mobilogisch! 2/04 darauf hingewiesen, dass diese Problematik bei der MiD (Mobilität in Deutschland) zu kuriosen Regelungen geführt hat (z.B. galten Haushalte als vollständig befragt, wenn mindestens die Hälfte der Haushaltsmitglieder an der Befragung teilgenommen hat; oder es wurden in größerem Umfang sog. „proxy-Interviews“ zugelassen, bei denen ein Haushaltsmitglied die Mobilität eines anderen berichtet).

Vor diesem Hintergrund kann man sich schon vorstellen, dass eine gründliche Erfassung der nicht so offensichtlichen NRT im SrV nicht einfach ist. Im KONTIV-Design verlangt diese zusätzliche Validierung jedenfalls meist weitere Nachfragen bei den Haushalten. (Wir führen Korrektur- und Validierungsanrufe bei etwa 80 % der Haushalte durch.)

Dabei zeigt sich, dass etwa die Hälfte dieser NRT auf den nichtmotorisierten Verkehr entfallen (0,25 von 0,50) und der Rest überwiegend auf den motorisierten Individualverkehr. Wege mit dem ÖPNV werden dagegen – das ist auch lange bekannt – relativ gut berichtet (s. Grafik S. 22, linke Spalte).

Bei der in der eingangs zitierten Ausschreibung geforderten Design-Angleichung haben wir jetzt zwei wichtige Schritte gemacht und die Effekte non-response und non-reported trips bereinigt. (Ein solches Vorgehen ist übrigens nicht neu. Wir haben entsprechende Verfahren bereits in den siebziger Jahren entwickelt und Anfang der achtziger Jahre publiziert 4) 5).)

Wege pro Person/ Tag

 

Eine Gegenüberstellung der „angeglichenen“ KONTIV mit dem SrV ergibt eine gleich hohe Wegeanzahl. Aber es berichten dann überdurchschnittlich mobile Personen überdurchschnittlich unvollständig über ihre Mobilität.

Um die KONTIV mit dem SrV vergleichbar zu machen, müssten wir uns auf die mobilen Schnellantworter konzentrieren und alle non-reported trips streichen. Zu einer derartigen Verschlechterung eines erfolgreichen Designs wäre wohl niemand bereit. Wir auch nicht.

Wege pro Person/ Tag

Allerdings zeigt eine Aufgliederung nach Verkehrsmittelgruppen, dass diese Angleichung auch ihre Grenzen hat. Damit wird auch deutlich, dass die harmlos klingende Forderung nach vergleichbaren Daten nur sehr schwer zu erfüllen ist. Deshalb sollten bei jeder Mobilitäts­erhebung wenigstens der non-response-Effekt abgeschätzt und die non-reported trips erhoben werden. Beim KONTIV-Design ist das Standard. Eine fruchtbare Diskussion dieser Problematik gibt es aber in Deutschland leider nicht.

In Kürze

Die zunehmend unkritische Verwendung von empirisch erhobenen Mobilitätsdaten macht es erforderlich, den Einfluss des jeweils gewählten Erhebungsdesigns genauer zu durchleuchten. Eine solche Durchleuchtung ergibt für Deutschland: Selektiv ausgewählte Personen berichten selektiv über ihre Mobilität.

Info und Quellen:

  1. Werner Brög u. Gerhard Winter: Untersuchungen zum Problem der „non-reported trips“ zum Personen-Wirtschaftsverkehr bei Haushaltsbefragungen, Juni 1990 Erschienen in: Forschung und Straßenbau und Straßentechnik Heft 593, 1990 Herausgeber: Bundesministerium für Verkehr, Abteilung Straßenbau, Bonn-Bad Godesberg
  2. Werner Brög u. Erhard Erl: Systematic Errors in Mobility Surveys Paper presented at the 23rd ATRF Conference, Perth, September/ October 1999
  3. Prof. Dr. Ing. Gerd-Axel Ahrens, Technische Universität Dresden, Fakultät Verkehrswissenschaften „Friedrich List“ Institut für Verkehrsplanung und Straßenverkehr Endbericht zur Verkehrserhebung „Mobilität in Städten – SrV 2008“ und Auswertungen zum SrV-Städtepegel, Dresden im Dezember 2009
  4. Werner Brög, Arnim H. Meyburg: Non-response Problem in Travel Surveys: An Empirical Investigation in: Transportation Research Record No. 775, 1981
  5. Werner Brög, Erhard Erl, Arnim H. Meyburg, Manfred Wermuth: Problems of Non-Reported Trips in Surveys of Non-Home Activity Patterns in: Transportation Research Record No. 891, 1982

Dieser Artikel von Werner Brög ist in mobilogisch! , der Vierteljahres-Zeitschrift für Ökologie, Politik und Bewegung, Heft 3/2012, erschienen. 

Einzelhefte von mobilogisch! können Sie in unserem Online-Shop in der Rubrik Zeitschrift bestellen.