Die experimentelle Statistik
In dieser Rubrik stellt das Statistische Landesamt Saarland neue digitale Daten und Methoden vor, die unter dem Begriff der experimentellen Statistik zusammengefasst werden.
Unsere Welt und damit verbunden auch die amtliche Statistik, wird immer digitaler und eröffnent uns damit neue Methoden und Datenquellen. Diese sind in dem neuen Feld der experimentellen Statistik untergebracht. Sie gehören bislang nicht standardmäßig zur amtlichen Statistik, können aber - perspektivisch betrachtet - zukünftig dazu beitragen, die Qualität der amtlichen Statistik zu verbessern und vor allem die Aktualität der veröffentlichten Daten (enorm) zu erhöhen.
Wichtig dabei ist die Unterscheidung in zwei Bereiche:
Experimentelle Daten stammen nicht aus den klassischen Erhebungswegen der amtlichen Statistik, sondern aus anderen Quellen wie z. B. Satelliten- oder Luftbildern, Web Scraping oder dem Bereich Big Data.
Experimentelle Methoden sind in der amtlichen Statistik bisher nicht verwendete statistische Verfahren, die alternative Auswertungsmöglichkeiten für vorhandene Statistiken bieten können. Hierzu zählen Verfahren des maschinellen Lernens oder der künstlichen Intelligenz sowie Methoden, die unter Wahrung der Geheimhaltung die Veröffentlichung von kleinräumigen Daten ermöglichen.
In diesem Bereich finden Sie Praxisbeispiele, die die neuen Daten und Methoden aufgreifen.
Tourismusauswertung der Online-Plattformen
Auswertung von Kurzzeitübernachtungen, die über Online Sharing Economy Plattformen angeboten werden
Die amtliche Tourismusstatistik veröffentlicht Zahlen über Ankünfte, Übernachtungen und Kapazitätsangaben für Beherbergungsbetriebe der Hotellerie und Ferienunterkünfte ab 10 Betten sowie 10 Stellplätzen im Campingbereich. Dabei wurde die Begrenzung der Erhebung auf größere Betriebe festgelegt zur Entlastung einer Vielzahl von sogenannten Kleinbeherbergungsbetrieben. Bisher wurde das Beherbergungssegment unter 10 Schlafgelegenheiten bzw. Stellplätzen lediglich mittels stark aggregierter Daten dargestellt, die auf Schätzungen und Hochrechnungen basieren und zur Erfüllung jährlicher Datenlieferverpflichtungen gegenüber der Europäischen Union erstellt werden. Genau zu diesem in der amtlichen Statistik unterrepräsentierten Marktsegment können die Daten der Plattformbetreiber einen Eindruck geben.
Die aggregierten Transaktionsdaten der Plattformbetreiber werden in diesem Artikel als experimentelle Statistik veröffentlicht. Solche Statistiken verwenden neue Datenquellen oder Methoden, um den Benutzerbedürfnissen besser gerecht zu werden. Sie haben jedoch noch nicht die Reife einer vollwertigen amtlichen Statistik erreicht.
Für den Zugang zu Transaktionsdaten von Plattformbetreibern gibt es derzeit auf europäischer und nationaler Ebene keine allgemeine gesetzliche Regelung. Im März 2020 hat die Europäische Kommission daher mit vier Online-Plattformbetreibern aus dem Beherbergungsbereich - Airbnb, Booking, Expedia Group und TripAdvisor - eine Vereinbarung über die gemeinsame Nutzung von Daten getroffen, die bisher jedoch einer verpflichtenden gesetzlichen Basis entbehrt. Das Abkommen erlaubt dem Europäischen Statistikamt (Eurostat) und den Statistischen Ämtern der Mitgliedstaaten, für Deutschland ist dies das Statistische Bundesamt, die Auswertung von Daten zur Nutzung von Unterkünften für touristische Aufenthalte. Die dargestellten Informationen beziehen sich auf Unterkünfte der Kategorie NACE 55.2, hinunter fallen Ferienwohnungen, Ferienhäuser oder Zimmer, in denen wenig bis gar kein Service angeboten wird und es sich somit oft um privat vermietete Unterkünfte handelt.
Schon zum jetzigen Zeitpunkt können die Plattformdaten eine gute Ergänzung zur amtlichen Statistik darstellen, da sie das Segment der privat angebotenen Beherbergungsbetriebe unter 10 Betten vermutlich zum größten Teil abdecken. Um diese Daten jedoch dauerhaft in die amtliche Statistik integrieren zu können, müssen in der Zukunft, neben den methodischen Problemen hinsichtlich der Doppelzählung von Unterkünften, die auf mehreren Plattformen angeboten werden noch Fragen zum Datenbezug geklärt werden. Außerdem ist anzumerken, dass die verwendeten Transaktionsdaten derzeit lediglich von vier Plattformen stammen. Für die Integration der Daten in die amtliche Tourismusstatistik ist eine rechtliche Absicherung für einen dauerhaften Zugang zu den Daten notwendig.
Auswertung von Kurzzeitübernachtungen, die über Online Sharing Economy Plattformen angeboten werden
Jahre | 2018 | 2019 | 2020 | 2021 | 2022 | 2023 |
---|---|---|---|---|---|---|
Kreis / Gemeinde |
Anzahl insgesamt |
Anzahl insgesamt |
Anzahl insgesamt |
Anzahl insgesamt |
Anzahl insgesamt |
Anzahl insgesamt |
Saarland | 125 000 | 170 000 | 149 000 | 176 000 | 283 000 | 322 000 |
RV Saarbrücken | 58 000 | 70 000 | 57 000 | 69 000 | 108 000 | 124 000 |
Merzig-Wadern | 19 000 | 28 000 | 29 000 | 34 000 | 56 000 | 62 000 |
Neunkirchen | 7 000 | 14 000 | 12 000 | 14 000 | 27 000 | 32 000 |
Saarlouis | 9 000 | 17 000 | 15 000 | 19 000 | 33 000 | 37 000 |
Saarpfalz-Kreis | 19 000 | 24 000 | 20 000 | 21 000 | 30 000 | 35 000 |
St. Wendel | 12 000 | 17 000 | 16 000 | 19 000 | 29 000 | 32 000 |
Daten gerundet
Quelle:Eurostat-Experimentelle-Statistik
Übernachtungen im Rahmen von Kurzzeitaufenthalten gebucht auf Sharing Economy Plattformen nach Herkunftsland des Gastes – experimentelle Statistik
Jahre | 2018 | 2019 | 2020 | 2021 | 2022 | 2023 |
---|---|---|---|---|---|---|
Kreis / Gemeinde |
Anzahl insgesamt |
Anzahl insgesamt |
Anzahl insgesamt |
Anzahl insgesamt |
Anzahl insgesamt |
Anzahl insgesamt |
Saarland | 125 000 | 170 000 | 149 000 | 176 000 | 283 000 | 322 000 |
Deutschland | 74 000 | 102 000 | 102 000 | 118 000 | 180 000 | 205 000 |
Ausland | 51 000 | 68 000 | 48 000 | 58 000 | 103 000 | 116 000 |
RV Saarbrücken | 58 000 | 70 000 | 57 000 | 69 000 | 108 000 | 124 000 |
Deutschland | 32 000 | 39 000 | 35 000 | 43 000 | 64 000 | 73 000 |
Ausland | 26 000 | 31 000 | 22 000 | 26 000 | 43 000 | 51 000 |
Merzig-Wadern | 19 000 | 28 000 | 29 000 | 34 000 | 56 000 | 62 000 |
Deutschland | 12 000 | 16 000 | 21 000 | 24 000 | 35 000 | 38 000 |
Ausland | 8 000 | 11 000 | 8 000 | 10 000 | 21 000 | 24 000 |
Neunkirchen | 7 000 | 14 000 | 12 000 | 14 000 | 27 000 | 32 000 |
Deutschland | 5 000 | 8 000 | 8 000 | 10 000 | 17 000 | 21 000 |
Ausland | 3 000 | 6 000 | 4 000 | 4 000 | 10 000 | 11 000 |
Saarlouis | 9 000 | 17 000 | 15 000 | 19 000 | 33 000 | 37 000 |
Deutschland | 6 000 | 11 000 | 11 000 | 12 000 | 22 000 | 26 000 |
Ausland | 3 000 | 6 000 | 4 000 | 7 000 | 11 000 | 11 000 |
Saarpfalz-Kreis | 19 000 | 24 000 | 20 000 | 21 000 | 30 000 | 35 000 |
Deutschland | 12 000 | 15 000 | 15 000 | 15 000 | 20 000 | 24 000 |
Ausland | 7 000 | 8 000 | 6 000 | 6 000 | 10 000 | 11 000 |
St. Wendel | 12 000 | 17 000 | 16 000 | 19 000 | 29 000 | 32 000 |
Deutschland | 8 000 | 12 000 | 13 000 | 14 000 | 21 000 | 24 000 |
Ausland | 4 000 | 6 000 | 4 000 | 5 000 | 8 000 | 8 000 |
Daten gerundet
Quelle:Eurostat-Experimentelle-Statistik
Tourismusatlas
Tourismusstatistik in interaktiven Rasterkarten
Mit dem Tourismusatlas werden ausgewählte Jahresergebnisse der amtlichen Tourismusstatistik in Form von interaktiven Rasterkarten regional tief gegliedert und visualisiert. Die im Atlas präsentierten Karten basieren auf den aggregierten und georeferenzierten Angaben der deutschen Beherbergungsbetriebe mit zehn oder mehr Schlafgelegenheiten. Der Atlas bietet verschiedene Auswertungsmöglichkeiten zu den Berichtsjahren 2018 bis 2022 an.
Ergebnisse der Tourismusstatistik in interaktiven Rasterkarten
Tourismus Prognosewerte
Einsatz eines Forecast-Verfahrens in der Tourismusstatistik
Die Tourismusstatistik ist ein wichtiger Konjunkturindikator. Ein eingesetztes Forecast-Verfahren ermöglicht es, die zeitsensiblen Ergebnisse deutlich frühzeitiger zu veröffentlichen.
Ausgangslage
Amtliche Statistik - Monatserhebung im Tourismus
Um ihren jeweiligen gesetzlichen Auftrag zu erfüllen, haben sich die statistischen Ämter weltweit technisch wie methodisch weiterzuentwickeln. Derzeit entstehen dabei sehr viele Machbarkeitsstudien auf der Grundlage neuer Daten und Methoden, deren erfolgreiche Resultate später in die laufenden Berechnungen einfließen sollen. Die Ergebnisse dieser Studien sind dabei derzeit überwiegend noch experimentell. Experimentelle Statistiken (EXSTAT) unterscheiden sich daher im Reifegrad und in der Qualität von amtlichen Statistiken, z.B. in Bezug auf die Harmonisierung, den Erfassungsbereich oder die Methodik. Trotzdem sind es Ergebnisse der Statistischen Ämter des Bundes und der Länder (Auszug Destatis „Experimentelle Statistik“).
Die Daten der amtlichen Statistik „Monatserhebung im Tourismus“ stehen 40 Tage nach Ablauf des Berichtsmonats fest. In dieser Zeit erfolgt in den Statistischen Ämtern der Länder die Datenerhebung, Validierung und Korrektur der erhobenen Daten. Der Nutzerbedarf zielt jedoch auf eine frühere Bereitstellung von Informationen ab, um eine frühzeitige Einschätzung der aktuellen Situation herbeiführen zu können.
Das Hessische Statistische Landesamt (HSL) hat im Rahmen der sogenannten experimentellen Statistik ein Forecast-Verfahren entwickelt, das es erlaubt sehr früh zwei wesentliche Kennzahlen, die Zahl der Ankünfte und die Zahl der Übernachtungen in den hessischen Beherbergungsbetrieben auf Kreisebene zu generieren. Das HSL bietet nun den Statistischen Landesämtern an, das Forecast-Verfahren auch für sie durchzuführen. Für das Forecast-Verfahren des aktuellen Berichtsmonats werden nur die aktualisierten erhobenen Vormonatswerte verwendet, es gehen keine Dateninformationen aus dem aktuellen Berichtsmonat ein.
Da die Tourismusstatistik auch im Saarland ein wichtiger Konjunkturindikator ist, hat das Statistische Landesamt Saarland ein Pilotprojekt „ExStat im Tourismus“ in Zusammenarbeit mit dem HSL gestartet. Das eingesetzte Forecast-Verfahren ermöglicht es, die zeitsensiblen Ergebnisse deutlich frühzeitiger zu veröffentlichen. Die Prognosewerte des aktuellen Berichtsmonats können 14 Tage nach Ende des aktuellen Berichtsmonats zur Verfügung gestellt werden.