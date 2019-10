"Wir stellen an neue digitale Daten die gleichen hohen Anforderungen bezüglich Datenschutz und Qualität wie an alle übrigen Daten, die wir verwenden. Deshalb werden sie in den Statistischen Ämtern gründlich getestet, bevor wir damit Statistik machen", sagt Natalie Rosenski, Leiterin des Referats "Methoden der sekundären Datengewinnung" im Statistischen Bundesamt. Von den neuen Datenquellen verspricht sich die amtliche Statistik eine schnellere Verfügbarkeit, höhere Aktualität und eine größere Genauigkeit in fachlicher und räumlicher Hinsicht. Zudem sei durch die Nutzung der Daten grundsätzlich eine Entlastung der befragten Personen möglich, so die Expertin.



Web Scraping ermöglicht bessere Abbildung des Online-Handels bei der Preismessung



"Mit Web Scraping ist es möglich, der gestiegenen Bedeutung des Internethandels gerecht zu werden und stark schwankende Preise zu erfassen", erklärt Christian Blaudow, Referent im Referat "Zwischenörtliche Preisvergleiche, Parteienindex" beim Statistischen Bundesamt. "Wir arbeiten seit etwa sieben Jahren mit Web Scraping und haben unsere Verfahren immer weiter verfeinert. Mittlerweile werden Preise für so unterschiedliche Produkte wie Mietwagen, Medikamente oder Fernbusse und Bahnreisen mithilfe von Web Scraping erfasst und fließen in die Berechnung des Verbraucherpreisindex beziehungsweise der Inflationsrate ein", führt der Experte weiter aus.



Bis Ende des Jahres 2021 sollen auch die letzten manuellen Preiserhebungen im Online-Handel mit Web Scraping automatisiert werden. Dies ist jedoch nicht der einzige Einsatzbereich von Web Scraping. Die Statistischen Ämter des Bundes und der Länder prüfen diese Technik beziehungsweise auch für das Auslesen von Informationen über Unternehmen - etwa Branche oder Insolvenzbekanntmachungen. (18.10.2019/ac/a/m)







Schon seit einigen Jahren beschäftigt sich das Statistische Bundesamt in enger Zusammenarbeit mit den Statistischen Ämtern der Länder intensiv mit den Potentialen, die "Neue Digitale Daten" für die Statistikproduktion bieten. Diese Daten stehen schnell zur Verfügung, können jedoch nicht mit herkömmlichen Methoden verarbeitet werden - sie entsprechen dem, was allgemeinhin mit "Big Data" bezeichnet wird.