Tag Archiv für Statistik

Wahlanfechtung und Klage auf Neuauszählung?

Was hat man sich über Donald Trump aufgeregt, ihn einen schlechten Demokraten geschimpft, als er sagte er wolle im Falle eines Sieges von Hillary Clinton das Wahlergebnis nicht anerkennen und ggf. wegen Wahlmanipulation anfechten. Was passiert nun? Man rät Hillary Clinton zur Wahlanfechtung (Welt, CNN) und Klage auf Neuauszählung in den Swing-Staaten Pennsylvania, Michigan und Wisconsin, weil sie (angeblich) in den Bezirken, in denen Wahlmaschinen einegsetzt wurden statistisch systematisch schlechtere Ergebnisse erzielte, als in denen, wo noch mit Kreuz auf Papier und Scannern bei der Auszählung gewählt wurde. Allein diese Diskrepanz ist jedoch kein Beweis für eine Manipulation der Wahl. Wenn eine Neuauszählung zum selben Ergebnis kommen sollte, haben wir es mal wieder mit einem interessanten Fall der „statistischen Dreifaltigkeit“ aus Koinzidenz, Korrelation und Kausalität zu tun, denn es wäre durchaus wissenswert, wodurch die Unterschiede dann verursacht wurden.

Auch wieder nett, das messen mit zweierlei Maß. Die angedrohte Anfechtung durch Donald Trump ist böse, weil Trump böse ist, fechtet Clinton wegen Unregelmäßigkeiten an, ist das ihr gutes Recht, weil sie zu den Guten gehört.

Die Wahlergebnisdarstellung ist aber meiner Ansicht nach auch wirklich undurchsichtig. Ich wollte mir ein paar Tage nach der Wahl mal die Einzelergebnisse ansehen. Das ist aber eine höchst komplizierte Angelegenheit gewesen, die ich auch nicht erfolgreich zum Abschluss gebracht habe. Eine offizielle Seite welche die Einzelergebnisse systematisch zusammenführt habe ich nicht gefunden, ansonsten zu Hauf verstreute Seiten, gerne auch immer wieder mit vorläufigen Ergebnissen oder Verweisen wie „wie mitgeteilt wurde“.

Auf jeden Fall wird es am 19. Dezember nochmal interessant werden, wenn die eigentliche Wahl des Potus stattfinden wird, denn die Wahlmänner könnten sich auch anders entscheiden, als für Donald Trump zu stimmen.

Soziale Netzwerke und der Bildungsstand der Nutzer

Über das Twitterkonto @OECDStatistik wurde vor einiger Zeit folgende Statistik (via dümmlichen Kommentar von Sascha Lobo auf Spigel-Online) mit dem Tweet „Soziale Netzwerke und der Bildungsgrad ihrer Nutzer: Deutschland entgegen dem Trend“ verbreitet. Weiterlesen

3.787.237 Minuten Verspätung

Wie die Antwort auf eine Anfrage von der Die Linke ergeben hat, soll die Deutsche Bahn im Jahre 2013 3.787.237 Verspätungsminuten erreicht haben (HAZ, Zeit), was immerhin 7,2 Jahren entspricht. Eine wunderbar genaue Zahl, die durch Angabe bis auf die letzte Minute mal wieder eine Genauigkeit vorspiegelt, die es so gar nicht gibt und die vor allen Dingen für den Bahnkunden praktisch keine Aussagefähigkeit hat. Der Ehrlichkeit halber sollte man aber auch erwähnen, daß nicht alle Verspätungen durch die DB verantwortet werden (Selbstmörder, Notfälle, Randale, Polizeieinsätze, Unwetter etc.).

  • Zunächst einnmal werden Verspätungen unter 6 Minuten nicht als Verspätung gezählt. Die kleinen Verspätungen sind aber im alltäglichen Leben die Hauptursache, daß der Kunde seine Anschlüsse (nicht zwansläufig bei der DB) verpasst.
  • Eine Verspätung wird bei der DB nicht dann gemessen, wenn sich die Türen öffnen und der Kunde wieder volle Bewegungsfreiheit genießt, sondern bei der Durchfahrt an einem bestimmten Punkt einer Betriebsstätte. Besonders „interessant“ wird die Art Messung bei großen Kopfbahnhöfen (z. B. Hbf. Frankfurt am Main). Die Züge kommen messtechnisch zwar häufig pünktlich an, stehen dann aber gerne noch eine ganze Weile (10, 15, 30 min) im Vorfeld. Ebenfalls nicht gezählte Verspätungen, die bei den Kunden aber für verpasste Anschlüsse und jede Menge Ärger (gerade wenn der letzte Bus o.Ä. weg ist) sorgen.

Unsinn mit p-Werten

Der Vortrag von Dr. Michael Frass zu den angeblichen Vorteilen einer begleitenden Therapie mit Homöopathie war hier bereits zweimal Thema (Teil 1, Teil 2). Heute nun geht es um eine Tabelle mit p-Werten aus dem Vergleich der Gruppen mit und ohne begleitende homöopathische Therapie.

Exkurs p-Wert

An der Stelle zunächst ein kurzer Exkurs zur Bedeutung des p-Wertes in der Statistik. Ganz allgemein formuliert ist die Idee hinter dem p-Wert der Versuch, eine Maßzahl zu erhalten, die angibt ob die erhaltenen Ergebnisse auch durch Zufall entstanden sein könnten. Da es sich bei ihm um eine Wahrscheinlichkeit — daher p, probability — handelt kann er nur Werte zwischen 0 und 1 annehmen.

Um zum p-Wert zu gelangen, wird das Gegenteil dessen angenommen, was es nachzuweisen gilt. Diese Annahme wird als Nullhypothese bezeichnet. Bei klinischen Studien zum Wirksamkeitsnachweis einer Behandlungsmethode lautet daher die Nullhypothese, daß es zwischen den Gruppen keinen Unterschied gibt. Zeigt sich entgegen der Nullhypothese ein Unterschied zwischen den Gruppen, wird unter Annhame der Gültigkeit der Nullhyptohese die Wahrscheinlichkeit berechnet, mit der die Untersuchungsergebnisse auch durch Zuffall entstanden sein könnten. Diese Wahrscheinlichkeit wird in der Statistik als p-Wert bezeichnet. Je näher der p-Wert bei Null liegt, desto unwahrscheinlicher ist es, daß die Nullhypothese zutrifft. Bezogen auf die Nullhypothese besagt ein p-Wert von 0,05 (5%), daß bei Durchführung von 20 Experimenten eines durch Zufall zu dem erhaltenen Ergebnis führen könnte. Ein p-Wert von 0,05 (5%) gilt nach allgmeinem Konsens als signifikant, einer von 0,01 (1%) als stark signifikant. Weiterlesen

Lebenszeitverlängerung durch Homöopathie (Teil 2)

Ich habe inzwischen mal die zum Vortrag von Dr. Frass passende Veröffentlichung [1] quergelesen. Ausgangspunkt der retrospektiven Studie bilden die Krankenakten von 538 Tumorpatienten aus den Jahren 2004-2008 des Uniklinikums Wien, als Gruppe 1 bezeichnet. Von diesen wurden die ausgewählt, die in der Zeit neben der konventionellen Krebstherapie mindestens drei homöopathische Behandlungen hatten. Übrig blieben 287 Patienten, die als Gruppe 2 bezeichnet werden. Davon wurden alle Patienten mit fataler Diagnose, aber unter Ausschluss von Kindern und Patienten mit unvollständigen Daten, ausgewählt. Außerdem mussten zu jeder Tumorart mindestens Daten von fünf Patienten vorliegen. Die hiernach verbliebenen 54 Patienten bilden die Gruppe 3.

Welche Bedeutung kommt der Gruppeneinteilung zu? Keine! Es handelt sich dabei auch nicht um eigenständige Gruppen, sondern um voneinander abgeleitete Teilmengen. Es werden zwar ein paar statistische Daten, wie z.B. der Altersdurchschnitt, berechnet, jedoch haben diese keine Ausagekraft, da die Patienten im Verlauf der Studie nicht mehr auftauchen. Untersuchungsgegenstand sind nur die Daten der 54 Patienten aus Gruppe 3, verteilt auf 6 verschiedene maligne Erkrankungen. Wobei für die Auswertung das Lugenkarzinom in zwei Untergruppen, mit 7 und 3 Patienten (man hat keine Scheu Statistik mit drei Meßpunkten zu treiben!) aufgeteilt wird, die in der Präsentation aber wieder zusammengefasst werden. Weiterlesen

Wenn wahre Grafiken lügen

Im Jahre 2005 trat im US-Bundesstaat Florida ein neues, von Anfang an umstrittenes Selbstverteidigungsgesetz in Kraft, das „Stand-your-ground law“, welches den Einsatz tödlicher Gewalt gegen einen (vermeindlichen) Angreifer regelt.

A person who is not engaged in an unlawful activity and who is attacked in any other place where he or she has a right to be has no duty to retreat and has the right to stand his or her ground and meet force with force, including deadly force if he or she reasonably believes it is necessary to do so to prevent death or great bodily harm to himself or herself or another or to prevent the commission of a forcible felony.

Jetzt wurde über Reuters eine grafische Darstellung verbreitet, welche die Auswirkungen des Gesetzes veranschaulichen soll: Weiterlesen

XX XY Männer und Frauen. Grafiken erklären die Unterschiede

XX XY Männer und Frauen

XX XY Männer und Frauen,
ISBN 978-3-426-65536-8

Die Autoren Matthias Stolz und Ole Häntzschel haben mit ihrem Buch XX XY Männer und Frauen. Grafiken erklären die Unterschiede eine Anthologie von Grafiken zum Thema Männer und Frauen verfasst. Zu 72 Sachgebieten rund um das Thema wie Namen, Kleidung, Sexualität, Gewalt, Bildung, Politik, Sprache etc. stellen sie auf ebenso vielen Doppelseiten die ermittelten Unterschiede grafisch anschaulich dar. Die Daten entstammen unterschiedlichsten Quellen wie bspw. dem Statistischem Bundesamt, dem Robert-Koch-Insitut, der Literatur wie auch aus eigener Recherche der Autoren. Durchgehend werden die Werte für Frauen in rot, die für Männer in blau dargestellt. So stehen beispielsweise den 15 Methoden der Empfängnisverhütung für Frauen nur 3 für Männer gegenüber. Man kann diese Aussage in diesem einen Satz treffen oder eben grafisch aufarbeiten in dem man auf einer Seite für jede Methode für Frauen ein Symbol, also 15 Symbole angeordnet in einer 3 × 5 Matrix, drei Symbolen für die Methoden beim Mann auf der anderen Seite gegenüberstellt. Die Kunst lag nun darin, für die Sachgebiete geeignete, leicht verständliche und vor allen Dingen abwechslungsreiche Darstellungsformen zu finden. Das ist weitestgehend auch gelungen, wenn auch manchmal das Datenamterial lückenhaft ist. So haben sie zwar für die Länge des täglichen Aufenthalts der Frauen im Bad Daten für 12 Länder, aber bei Männern nur für drei (Italien, Mexiko, Polen), die sich wiederum nicht bei den Frauen wiederfinden, womit ein Ländervergleich unmöglich ist. Weiterlesen

Studie: Zuwanderung macht die Deutschen glücklicher

Zuwanderung macht die Deutschen glücklicher ist der Titel eines kürzlich erschienenen Artikels bei der FAZ. Sie bezieht sich hierbei auf eine Studie des IZA (Institut für Zukunft der Arbeit/Institute for the Study of Labor).

Mit verblüffend klarem Ergebnis: Typischerweise waren die Einwohner einer Region umso zufriedener, je mehr Zuwanderer in der Region lebten.
[…]
Der Studie zufolge wird die Zufriedenheit der Deutschen umso größer, je besser die Einwanderer integriert sind – zumindest bis zu einem gewissen Punkt. Doch nicht nur die Deutschen macht Einwanderung glücklich. Auch die Zuwanderer sind umso zufriedener, je mehr andere Zuwanderer in ihrer Nähe wohnen.

Eine Formulierung wie im ersten Satz als Ergebnis einer Studie läßt immer den Verdacht aufkeimen, daß einer der Kardinalfehler der Statistik gemacht wurde, in dem Korrelation als Kausalität interpretiert wird, Weiterlesen