Corona-Krise (Datenanalyse Kommunen)

Diese Seite lässt sich am besten im Desktop-Modus betrachten.

Am 2.6.2023 wurden zum letzten Mal Tagesdaten eingepflegt.

Die in den nachfolgenden Tabellen ausgewiesenen Werte basieren hauptsächlich auf den Veröffentlichungen des Robert-Koch-Instituts auf der Seite corona.rki.de.

Die Einwohnerzahlen stammen vom Statistischen Bundesamt destatis und waren verfügbar für den Stichtag 31.12.2018. Aufgrund eines Zugangs zu Daten, die für die Inzidenz-Ermittlung stark genutzt werden, wurden die Einwohnerzahlen pro Region von der entsprechenden Datenbank übernommen. Die Datenbank befindet sich bei der ESRI GmbH, die vom RKI mit der Datenpräsentation beauftragt worden ist. Es zeigt sich ein geringer Unterschied in den Einwohnerzahlen dieser Datenbank und denen des Statistischen Bundesamtes. 

Datenaufbereitung und Datenpräsentation sind meine Arbeit. Und wie ich schon mehrfach feststellen musste, können an verschiedenen Stellen Fehler auftreten, die natürlich nicht gewollt sind. Von daher muss diese Möglichkeit immer in Betracht gezogen werden, wenn man solche Ergebnisse liest.

Aufgrund der Datenfülle werden an dieser Stelle nur die Top-10 der Landkreise, kreisfreien Städte und / oder Stadtstaaten der Bundesrepublik Deutschland ausgewertet. Die Daten aktualisieren sich leider nicht automatisch, sondern müssen durch einen manuellen Datenimport in eine spezielle Kalkulations-Tabelle eingefügt werden, bevor sie schließlich zu diesen Ergebnissen führen. An den Tabellen und der Grafik wird nach Möglichkeit weiter gearbeitet, um die Aussagekraft und das Lesen zu verbessern.

Wie mit den folgenden Tabellen ein Erreichen von Grenzwerten ermittelt wird und was es mit dem betrachteten 7-Tage-Zeitraum auf sich hat, steht am Ende.

Darüber hinaus soll auch untersucht werden, inwieweit sich Regionen mit unterschiedlichen Einwohner-Zahlen voneinander unterscheiden in der Dauer der Vorkommnisse. Es wird also täglich ermittelt, seit wie vielen Tagen keine neue Infektion gemeldet wurde.







1.
Für die Bestimmung des 50-Tage-Grenzwerts werden alle neuen Fallzahlen vom ersten Tag bis zum letzten Tag des Betrachtungszeitraums gebraucht. Bezogen auf die Einwohnerzahl wird das Ergebnis als eine Fallzahl pro 100.000 Einwohner in der Spalte rechts außen von der Tabelle 1 ausgewiesen. Sobald der Grenzwert von "50" erreicht oder überschritten wurde, ändert sich die Darstellung in Rot-Weiß oder sogar Schwarz. Da es in einigen Landkreisen einen niedrigeren Grenzwert gibt, ändert sich die Farbe auf Orange-Schwarz, wenn ein Grenzwert von "35" erreicht oder überschritten wird.

In Tabelle 2 werden die gemeldeten fortgeschriebenen (kumulierten) Fallzahlen für die jeweiligen Regionen angezeigt. Weil ein 7-Tage-Zeitraum betrachtet werden muss, wird die Fallzahl-Änderung des ersten Tags zum Vortag ermittelt. Insgesamt darf es somit nur sieben Fallzahl-Änderungen geben. Wenn es im Nachhinein aufgrund bessererer Erkenntnis eine Verschiebung der Fallzahlen in einen früheren Zeitraum (außerhalb der 7-Tage) gegeben hat, wird diese Änderung der Daten nicht nachvollzogen (zu den Gründen, siehe 2. und 3.).

In Tabelle 3 werden diese sieben Neu-Meldungen dargestellt und summiert. Die Summe wird dann in Tabelle 1 mit der Einwohnerzahl der Region geteilt und auf 100.000 hochgerechnet.

Gleichzeitig wird in Tabelle 3 ein Mittelwert der Fallzahlen der letzten 7 Tage ausgegeben, was aber nur untergeordneten Charakter hat. Mit dem Mittelwert könnte nun eine "normale" Entwicklung für die nächste Zeit unterstellt werden; Median und Modalwert sind dagegen nicht verwendet worden, weil der Betrachtungszeitraum meiner Ansicht nach zu kurz ist und eine einfache Nachvollziehbarkeit erforderlicher anzusehen ist.

In Tabelle 4 wird die prozentuale Entwicklung der Fallzahlen, bezogen auf den kumulierten Stand vom Vortag dargestellt. Auch dies hat einen untergeordneten Charakter und soll lediglich die relative Entwicklung über diesen 7-Tage-Zeitraum veranschaulichen. Es wird dabei angenommen, dass eine Linearität und stetig gleichbleibende Entwicklung eine gewisse "Normalität" erzeugt, während ein plötzlicher Anstieg als ein bedrohliches Ereignis wahrgenommen wird. Derartigen Bedrohungen begegnet man üblicherweise mit hohem Einsatz - vermutlich handelt es sich dann um ein "Superspreader"-Ereignis. Dagegen werden stetig wachsende Verläufe zu einer Normalität, an die sich die Menschen gewöhnen. Ein Bekämpfen der Ursache für diese Neuinfektionen findet dagegen nicht statt.

Superspreading und lineare Verläufe müssen meines Erachtens gleichermaßen angegangen werden.

In der zweiten Übersicht geht es um das Verhältnis der Fallzahlen in den jeweiligen Regionen (d.h. Landkreise und kreisfreien Städte nach Einwohnerzahl; insgesamt 411 seit Oktober 2021, zuvor noch 412). Bezugspunkt ist die Einwohnerzahl vom 31.12.2018, die man aus einer Datenbank beim Statistischen Bundesamt ablesen kann. Die Darstellung pro 100k = 100.000 Einwohner soll somit eine Vergleichszahl ergeben. Vergleichszahlen, die über dem Mittelwert liegen, werden noch einmal in Rot hervorgehoben.

Gleichzeitig wird danach geschaut, wie viele Tage es her ist zwischen der letzten und vorletzten Meldung; das bezieht sich nicht auf das Erkrankungsdatum, so dass man eigentlich, streng genommen, nur die Effizienz des Meldewesens beurteilen kann.

Vorkommnisse mit der Angabe in Dauer-1 sind eigentlich die wichtigste Größe (Tabelle 5). Bei einem Wert von "1" heißt es, dass jeden Tag in den Regionen eine Meldung an das RKI ging. Der zweite Wert Dauer-2 sagt dagegen aus, seit wie vielen Tagen in einer Region keine Vorkommnisse gemeldet werden mussten. Wie gesagt, der Vergleich beruht auf den Größenverhältnissen in Bezug auf die jeweiligen Einwohner eines Landkreises oder kreisfreien Stadt. Es gibt also keine Differenzierung nach Bundesländern, sondern bevölkerungsreiche und bevölkerungsarme Regionen.

In der Tabelle 6 wird das Vorkommen in einzelne Zeiträume weiter differenziert. Zu Beginn der Krise konnte sehr gut beobachtet werden, wie selten manche Regionen etwas zu melden hatten. In der zweiten Welle änderte sich dieses Verhalten enorm. 

In Tabelle 7 wird nach den Inzidenzen in den einzelnen Regionen pro Bundesland geschaut. In den Hoch-Zeiten der Pandemie gab es Kommunen mit Inzidenzen von weit über 600, sogar über mehrere Tage. Dass in dieser Tabelle "nur" als Mindestgröße der Wert von 300 erscheint, beruht einfach auf rein platz-technische Gründen und der Häufigkeit trotz weit verbreitet niedrigerer Inzidenzen an anderen Orten. 


2.
Wenn es mal eine Berichtigung einer überhöhten Fallzahl-Meldung gegeben hat (z.B. Landkreis Coburg am 29.5.2020 mit "- 1"), wird diese als eine "Minus-Fallzahl" in der Farbe Grün-Schwarz in Tabelle 3 sichtbar. Das ist grundsätzlich erfreulich, verdeutlicht aber ein Problem im Meldewesen, weil offenbar etwas "zuviel" gemeldet wurde. Ein gut funktionierendes Meldewesen wird jedoch gebraucht, um das Aufkommen von Infektionsherden in einer Region besser zu erkennen und eingreifen zu können.

Immer mal wieder hat es solche Korrekturen gegeben, die aber nicht weiter kommentiert oder in den Nachrichten besprochen wurden. Die Zahlen stammen vom RKI und werden unverändert fortgeschrieben bzw. ohne weiteres übernommen. Formeln aus meiner Kalkulation erzeugen diese kumulierten Fallzahlen jedenfalls nicht. Eine Kontrolle der Richtigkeit der übernommenen Daten wäre im Nachhinein nur über andere Datensammler möglich, da die Landesbehörden selber nicht die Meldungen veröffentlichen, sondern nur die "tatsächlichen" Fallzahlen (die sich, wie gesagt, im Nachhinein ändern können).

Ein anderes "scheinbares" Problem zeigt sich, wenn statt der Fallzahlen nach den Erkrankungs-Daten die der Meldungen verwendet wird (wie in den Tabellen oben). Das Erkrankungs-Datum ist genauer, kann aber nur in einer vollständig zur Verfügung stehenden Datenbank gepflegt werden (dazu siehe 3.). So kommt es vor, dass ein 50er-Grenzwert in einer Analyse der Meldedaten angezeigt wird, aber vor dem Hintergrund der tatsächlichen Erkrankungs-Daten schon nicht mehr erreicht wird (z.B. Landkreis Gütersloh am 9.7.2020 lt. der eigenen Analyse noch 53 pro 100 Tsd. Einwohner in 7 Tagen, weil 192 Neu-Infizierte errechnet wurden, lt. RKI aber nur 28,8, weil 105 Personen in den letzten sieben Tagen in Wirklichkeit neu erkrankt waren - bei identischer Einwohnerzahl 364.083).

Ein solches Vorgehen erscheint nicht nachvollziehbar, man sollte es aber dennoch als richtig einstufen, weil schließlich das übergeordnete Interesse in der Mitteilung der Erkrankungen bzw. des Erkrankungszeitpunkts liegt. Abweichungen zu den Meldungen sagen lediglich etwas zum Meldewesen aus und wäre für die Analyse des Ausbruchsgeschehen nicht wichtig. Da immer nur der aktuelle Meldestand vom RKI an dieser Stelle übernommen werden kann, können die ermittelnden Werte nur eine Information sein, nicht aber Auslöser für sofortiges Eingreifen und dem Ausrufen von Kontaktbeschränkungen.

3.
Mittlerweile ist auch ein Zugriff auf die gesamten Meldedaten und weitere Auskünfte möglich. Da allerdings diese besondere Datenbank ein Volumen von über 94 MB aufweist per 3.1.2021, ist eine Darstellung und Analyse nach Erkrankungsdatum mit den hier verfügbaren Bordmitteln nicht möglich; inwiefern sich das vielleicht in Zukunft bewerkstelligen lässt, kann ich nicht sagen.  

4.
Wenn Regionen fusionieren, erstmals bekannt gemacht und eingearbeitet in die Analyse ab Oktober 2021, müssen nach einer einwöchigen Wartezeit die letzten Einträge geändert werden. Die historischen Daten wurden jetzt noch nicht rückwirkend zusammengebracht.

CGS



PS:

Manchmal funktioniert es einfach nicht. Die Daten werden von mir in ein Google-Spreadsheet übertragen, was für die Veröffentlichung teilweise freigegeben ist, und mit einem Embedded Code in diese Seite eingearbeitet wird per iFrame. Einige weitere Parameter im Code erlauben das Scrollen und bestimmen die Fenster-Größe. In manchen Fällen kann ein Add-on dazu führen, dass die Daten nicht angezeigt werden. Sobald ein Fehler entdeckt wird, kann es trotzdem noch dauern, bis die Lösung dafür gefunden wurde.  





Hat Ihnen der Beitrag gefallen?

Empfehlen Sie ein//gegliedert weiter oder klicken Sie gleich reihum auf die übrigen Seiten dieses Blogs – ersetzt das Applaudieren und ist ein guter Motivator für mich.

Möchten Sie was sagen?

Schreiben Sie mir eine E-Mail – Ihre Meinung hilft mir, meine Sichtweise neu zu überdenken. Meine E-Mail-Adresse finden Sie auf der Seite Über mich.