Die experimentelle Statistik



In dieser Rubrik stellt das Statistische Landesamt Saarland neue digitale Daten und Methoden vor, die unter dem Begriff der experimentellen Statistik zusammengefasst werden.

Unsere Welt und damit verbunden auch die amtliche Statistik, wird immer digitaler und eröffnent uns damit neue Methoden und Datenquellen. Diese sind in dem neuen Feld der experimentellen Statistik untergebracht. Sie gehören bislang nicht standardmäßig zur amtlichen Statistik, können aber - perspektivisch betrachtet - zukünftig dazu beitragen, die Qualität der amtlichen Statistik zu verbessern und vor allem die Aktualität der veröffentlichten Daten (enorm) zu erhöhen.

Wichtig dabei ist die Unterscheidung in zwei Bereiche:

Experimentelle Daten stammen nicht aus den klassischen Erhebungswegen der amtlichen Statistik, sondern aus anderen Quellen wie z. B. Satelliten- oder Luftbildern, Web Scraping oder dem Bereich Big Data.

Experimentelle Methoden sind in der amtlichen Statistik bisher nicht verwendete statistische Verfahren, die alternative Auswertungsmöglichkeiten für vorhandene Statistiken bieten können. Hierzu zählen Verfahren des maschinellen Lernens oder der künstlichen Intelligenz sowie Methoden, die unter Wahrung der Geheimhaltung die Veröffentlichung von kleinräumigen Daten ermöglichen.

In diesem Bereich finden Sie Praxisbeispiele, die die neuen Daten und Methoden aufgreifen.

Tourismusauswertung der Online-Plattformen

Auswertung von Kurzzeitübernachtungen, die über Online Sharing Economy Plattformen angeboten werden

 Die amtliche Tourismusstatistik veröffentlicht Zahlen über Ankünfte, Übernachtungen und Kapazitätsangaben für Beherbergungsbetriebe der Hotellerie und Ferienunterkünfte ab 10 Betten sowie 10 Stellplätzen im Campingbereich. Dabei wurde die Begrenzung der Erhebung auf größere Betriebe festgelegt zur Entlastung einer Vielzahl von sogenannten Kleinbeherbergungsbetrieben. Bisher wurde das Beherbergungssegment unter 10 Schlafgelegenheiten bzw. Stellplätzen lediglich mittels stark aggregierter Daten dargestellt, die auf Schätzungen und Hochrechnungen basieren und zur Erfüllung jährlicher Datenlieferverpflichtungen gegenüber der Europäischen Union erstellt werden. Genau zu diesem in der amtlichen Statistik unterrepräsentierten Marktsegment können die Daten der Plattformbetreiber einen Eindruck geben.

Die aggregierten Transaktionsdaten der Plattformbetreiber werden in diesem Artikel als experimentelle Statistik veröffentlicht. Solche Statistiken verwenden neue Datenquellen oder Methoden, um den Benutzerbedürfnissen besser gerecht zu werden. Sie haben jedoch noch nicht die Reife einer vollwertigen amtlichen Statistik erreicht.

Für den Zugang zu Transaktionsdaten von Plattformbetreibern gibt es derzeit auf europäischer und nationaler Ebene keine allgemeine gesetzliche Regelung. Im März 2020 hat die Europäische Kommission daher mit vier Online-Plattformbetreibern aus dem Beherbergungsbereich - Airbnb, Booking, Expedia Group und TripAdvisor - eine Vereinbarung über die gemeinsame Nutzung von Daten getroffen, die bisher jedoch einer verpflichtenden gesetzlichen Basis entbehrt. Das Abkommen erlaubt dem Europäischen Statistikamt (Eurostat) und den Statistischen Ämtern der Mitgliedstaaten, für Deutschland ist dies das Statistische Bundesamt, die Auswertung von Daten zur Nutzung von Unterkünften für touristische Aufenthalte. Die dargestellten Informationen beziehen sich auf Unterkünfte der Kategorie NACE 55.2, hinunter fallen Ferienwohnungen, Ferienhäuser oder Zimmer, in denen wenig bis gar kein Service angeboten wird und es sich somit oft um privat vermietete Unterkünfte handelt.

Schon zum jetzigen Zeitpunkt können die Plattformdaten eine gute Ergänzung zur amtlichen Statistik darstellen, da sie das Segment der privat angebotenen Beherbergungsbetriebe unter 10 Betten vermutlich zum größten Teil abdecken. Um diese Daten jedoch dauerhaft in die amtliche Statistik integrieren zu können, müssen in der Zukunft, neben den methodischen Problemen hinsichtlich der Doppelzählung von Unterkünften, die auf mehreren Plattformen angeboten werden noch Fragen zum Datenbezug geklärt werden. Außerdem ist anzumerken, dass die verwendeten Transaktionsdaten derzeit lediglich von vier Plattformen stammen. Für die Integration der Daten in die amtliche Tourismusstatistik ist eine rechtliche Absicherung für einen dauerhaften Zugang zu den Daten notwendig.

Auswertung von Kurzzeitübernachtungen, die über Online Sharing Economy Plattformen angeboten werden

Jahre

2018

2019

2020

2021

2022

Kreis / Gemeinde

Anzahl Übernachtungen

insgesamt

Anzahl Übernachtungen

insgesamt

Anzahl Übernachtungen

insgesamt

Anzahl Übernachtungen

insgesamt

Anzahl Übernachtungen

insgesamt

Saarland

124 000

170 000

149 000

176 000

254 000

RV Saarbrücken

58 000

70 000

57 000

69 000

98 000

Merzig-Wadern

19 000

28 000

29 000

34 000

50 000

Neunkirchen

7 000

14 000

12 000

14 000

23 000

Saarlouis

9 000

17 000

15 000

19 000

30 000

Saarpfalz-Kreis

19 000

24 000

20 000

21 000

28 000

St. Wendel

12 000

17 000

16 000

19 000

25 000

Daten gerundet

Quelle: Eurostat-Experimentelle-Statistik

Übernachtungen im Rahmen von Kurzzeitaufenthalten gebucht auf Sharing Economy Plattformen nach Herkunftsland des Gastes – experimentelle Statistik

Jahre

2018

2019

2020

2021

2022

Kreis/Gemeinde

sowie Herkunftsland

(ständiger Wohnsitz)

Anzahl

Übernachtungen insgesamt

Anzahl

Übernachtungen insgesamt

Anzahl

Übernachtungen insgesamt

Anzahl

Übernachtungen insgesamt

Anzahl

Übernachtungen insgesamt

Saarland

124 000

170 000

149 000

176 000

254 000

Deutschland

75 000

101 000

103 000

118 000

161 000

Ausland

51 000

68 000

48 000

58 000

94 000

RV

Saarbrücken

58 000

70 000

57 000

69 000

98 000

Deutschland

32 000

39 000

35 000

43 000

58 000

Ausland

26 000

31 000

22 000

26 000

40 000

Merzig-Wadern

19 000

28 000

29 000

34 000

50 000

Deutschland

12 000

16 000

21 000

24 000

32 000

Ausland

8 000

11 000

8 000

10 000

19 000

Neunkirchen

7 000

14 000

12 000

14 000

23 000

Deutschland

5 000

8 000

8 000

10 000

14 000

Ausland

3 000

6 000

4 000

4 000

8 000

Saarlouis

9 000

17 000

15 000

19 000

30 000

Deutschland

6 000

11 000

11 000

12 000

20 000

Ausland

3 000

6 000

4 000

7 000

10 000

Saarpfalz-Kreis

19 000

24 000

20 000

21 000

28 000

Deutschland

12 000

15 000

15 000

15 000

18 000

Ausland

7 000

8 000

6 000

6 000

10 000

St. Wendel

12 000

17 000

16 000

19 000

25 000

Deutschland

8 000

12 000

13 000

14 000

19 000

Ausland

4 000

6 000

4 000

5 000

7 000

Daten gerundet

Quelle: Eurostat-Experimentelle-Statistik

Tourismusatlas

Tourismusstatistik in interaktiven Rasterkarten

Mit dem Tourismusatlas werden ausgewählte Jahresergebnisse der amtlichen Tourismusstatistik in Form von interaktiven Rasterkarten regional tief gegliedert und visualisiert. Die im Atlas präsentierten Karten basieren auf den aggregierten und georeferenzierten Angaben der deutschen Beherbergungsbetriebe mit zehn oder mehr Schlafgelegenheiten. Der Atlas bietet verschiedene Auswertungsmöglichkeiten zu den Berichtsjahren 2018 bis 2022 an.

Ergebnisse der Tourismusstatistik in interaktiven Rasterkarten

Tourismus Prognosewerte

Einsatz eines Forecast-Verfahrens in der Tourismusstatistik

Die Tourismusstatistik ist ein wichtiger Konjunkturindikator. Ein eingesetztes Forecast-Verfahren ermöglicht es, die zeitsensiblen Ergebnisse deutlich frühzeitiger zu veröffentlichen.

Ausgangslage

Amtliche Statistik - Monatserhebung im Tourismus

Um ihren jeweiligen gesetzlichen Auftrag zu erfüllen, haben sich die statistischen Ämter weltweit technisch wie methodisch weiterzuentwickeln. Derzeit entstehen dabei sehr viele Machbarkeitsstudien auf der Grundlage neuer Daten und Methoden, deren erfolgreiche Resultate später in die laufenden Berechnungen einfließen sollen. Die Ergebnisse dieser Studien sind dabei derzeit überwiegend noch experimentell. Experimentelle Statistiken (EXSTAT) unterscheiden sich daher im Reifegrad und in der Qualität von amtlichen Statistiken, z.B. in Bezug auf die Harmonisierung, den Erfassungsbereich oder die Methodik. Trotzdem sind es Ergebnisse der Statistischen Ämter des Bundes und der Länder (Auszug Destatis „Experimentelle Statistik“).

Die Daten der amtlichen Statistik „Monatserhebung im Tourismus“ stehen 40 Tage nach Ablauf des Berichtsmonats fest. In dieser Zeit erfolgt in den Statistischen Ämtern der Länder die Datenerhebung, Validierung und Korrektur der erhobenen Daten. Der Nutzerbedarf zielt jedoch auf eine frühere Bereitstellung von Informationen ab, um eine frühzeitige Einschätzung der aktuellen Situation herbeiführen zu können.

Das Hessische Statistische Landesamt (HSL) hat im Rahmen der sogenannten experimentellen Statistik ein Forecast-Verfahren entwickelt, das es erlaubt sehr früh zwei wesentliche Kennzahlen, die Zahl der Ankünfte und die Zahl der Übernachtungen in den hessischen Beherbergungsbetrieben auf Kreisebene zu generieren. Das HSL bietet nun den Statistischen Landesämtern an, das Forecast-Verfahren auch für sie durchzuführen. Für das Forecast-Verfahren des aktuellen Berichtsmonats werden nur die aktualisierten erhobenen Vormonatswerte verwendet, es gehen keine Dateninformationen aus dem aktuellen Berichtsmonat ein.

Da die Tourismusstatistik auch im Saarland ein wichtiger Konjunkturindikator ist, hat das Statistische Landesamt Saarland ein Pilotprojekt „ExStat im Tourismus“ in Zusammenarbeit mit dem HSL gestartet. Das eingesetzte Forecast-Verfahren ermöglicht es, die zeitsensiblen Ergebnisse deutlich frühzeitiger zu veröffentlichen. Die Prognosewerte des aktuellen Berichtsmonats können 14 Tage nach Ende des aktuellen Berichtsmonats zur Verfügung gestellt werden.