Nichtnormalverteilte Daten? Wunderbar – Prozessverbesserung ich komme!

Daniel Fügner
15. März 2022
3 Min. Lesezeit

In vielen Fällen wünschen wir uns normalverteilte Daten. Gefühlt viel zu oft schlägt jedoch unser Test auf Normalverteilung aber fehl. Was nun? Oft weisen uns nichtnormalverteilte Daten direkt den Weg zur Prozessverbesserung. Worauf wir achten sollten und was wir tun können, wenn der Prozess tatsächlich von der Normalverteilung abweicht, behandelt dieser Artikel.

©iStockphoto.com/Luda311 & Daniel Fügner/Minitab 21

Gründe für nichtnormalverteilte Daten, dessen Eliminierung den Prozess verbessern kann

Häufig ist die Ursache von nichtnormalverteilten Daten, dass unser Prozess als solcher nicht stabil ist. Die Identifikation der Ursache für die nichtnormalverteilten Daten und dessen Eliminierung kann uns zu einer bedeutenden Prozessverbesserung führen. Im Folgenden werden einige Möglichkeiten vorgestellt.

Mangelnde Auflösung des Messsystems

Der Anderson-Darling-Test auf (Normal-)Verteilung geht davon aus, dass wir beliebig genau messen können. Ist das Auflösungsvermögen des Messsystems zu grob, schlägt der Hypothesentest fehl. Erkennbar ist dies meist für uns durch die Ausprägung von „Stäbchen“ im Wahrscheinlichkeitsnetz. Die beste Variante ist natürlich, ein Messsystem mit besserer Auflösung zu nutzen. Sollte dies aus den verschiedensten Gründen nicht möglich sein, haben wir dennoch Möglichkeiten, um mit den Stäbchen umzugehen:

„Gut hinsehen“: Wenn es keinen praktischen Grund gibt, dass die Daten nicht normalverteilt sein sollen und der Schwerpunkt der Stäbchen der theoretischen Linie folgt, kann es für uns je nach Ermessen und Zielsetzung dennoch sinnvoll sein, die Normalverteilung anzunehmen.
„Alternatives Testverfahren“: Nutzen Sie den Ryan-Joiner-Test an Stelle des Anderson-Darling-Tests. Der Ryan-Joiner-Test achtet weniger auf den einzelnen Datenpunkt, sondern schaut eher auf die Tendenz/Richtung. Achtung: Dieser Test ist „bequemer/träger“, wenn es darum geht, die Nullhypothese im Fall von nicht normalverteilten Daten zu verwerfen.
„Ausgleich durch Simulation“: Hierbei füllen wir die mangelnde Auflösung des Messsystems durch zufällig erzeugte (simulierte) Daten auf. Seien Sie daher besonders vorsichtig! Erzeugen Sie eine zusätzliche Spalte mit gleichverteilten Zufallszahlen +/- des halben Korridors der Auflösungseinbuße. Addieren Sie die Spalte mit diesen Zufallszahlen dann auf Ihre Messwerte. Somit haben Sie das Auflösungsdefizit zumindest theoretisch „ausgeglichen“. Wenden Sie dann einen Test auf Normalverteilung auf die simulierten Daten an. Alles weitere machen Sie dann wieder mit den Originaldaten.

Ausreißer

Ungewöhnliche Einzelwerte können dafür sorgen, dass der Verteilungstest fehlschlägt. Diese können wir in Regelkarten oder – bei extremeren Werten – auch im Wahrscheinlichkeitsnetz identifizieren.

Verschiedene Grundgesamtheiten

Ein stabiler Prozess kann nur einen ausgeprägten Gipfel besitzen. Wenn mehrere Parallelprozesse (zwei Maschinen, drei Schichten, vier Prüfer, …) sehr verschieden arbeiten und dessen Ergebnisse „zusammengeschmissen“ werden, ergeben sich Bi- oder Multimodale Verteilungen. (Aber auch eine neue Charge, die die Eigenschaften "springen" lässt, kann hierfür verantwortlich sein.) In solchen Fällen sollten wir die Parallelprozesse einander angeglichen oder separat bewerten. Histogramme und Wahrscheinlichkeitsnetze können uns bei der Identifizierung unterstützen. Für den Fall, dass eine Separierung aktuell nicht praktikabel ist, gibt es für uns bei Prozessfähigkeitsuntersuchungen die Möglichkeit, dass wir diese auf Grundlage der Mischverteilung (auch als Minitab Makro von ADDITIVE möglich) durchführen. Eine Prozessverbesserung sollte für uns aber immer die erste Wahl sein.

Mittelwertverschiebungen oder Streuungsveränderungen

Zeitliche Veränderungen in der Prozesslage und der Streuung führen zu einer Verwischung der Verteilung. Dies kann sowohl als Trend auftreten (Verschleiß, …) als auch periodisch (Tagestemperatur, …). Zeitreihendiagramme und Regelkarten können uns helfen dies aufzudecken.

Möglichkeiten mit nichtnormalverteilten Daten umzugehen

Es gibt in Natur und Technik zahlreiche Prozesse die per se nicht normalverteilt sind. Möglichkeiten mit solchen Prozessen umzugehen werden im Folgenden beschrieben. Diese Punkte sollten nur in Erwägung gezogen werden, wenn der Prozess auch stabil ist. Beachten Sie daher stets zuerst die obenstehenden Punkte.

Andere Verteilung

Wenn der Prozess einer anderen Verteilung folgt, können wir diese auch für dessen Beschreibung nutzen. Statistikpakete, wie Minitab bieten verschiedenste Verteilungen an. (Auch existieren für Minitab Makros von ADDITIVE zur Nutzung der Betragsverteilung 1. und 2. Art.) Einen nichtnormalverteilten Prozess mit der Normalverteilung zu beschreiben, führt zu großen Irrtümern bei der Prozessbewertung.

Attributive Daten

Die Normalverteilung ist eine Verteilung für stetige Daten (wie auch Lognormal, Weibull, Extremwert, u.v.m.). Viel zu oft passiert es, dass attributive Daten irrtümlich als stetig angesehen werden: So beispielsweise, wenn wir bei Gut-Schlecht-Merkmalen den Ausschussanteil als Prozentwert angeben. Es bleiben hier dennoch binomialverteilte Daten.

Transformation auf Normalverteilung

Wenn weder die Normalverteilung, noch eine andere Verteilung passt, können wir versuchen, die Daten zu transformieren. Die Meinungen gehen dabei weit auseinander, wie sinnvoll Transformationen wirklich sind. Wir sollten dies auf jeden Fall mit Achtsamkeit durchführen und eher als eine der letzten Möglichkeiten ansehen. Typische Transformationsarten sind Box-Cox und Johnson.

Verteilungsfreie Beschreibung

Diese Herangehensweise können wir in Betracht ziehen, wenn alles andere gescheitert ist. Dabei wird die Prozessfähigkeit nicht auf Grundlage einer Verteilung, sondern direkt aus den Daten der Stichprobe ermittelt. Alternativ können wir die Verteilung auch mittels Kerndichteschätzer "nachstellen". So oder so: Für nutzbare Aussagen werden wir dabei große Mengen an Daten benötigen. (Für Minitab gibt es für beide Herangehensweisen vorgefertigte Makros von ADDITIVE.)

Schulungen bieten sich an, um mit den angesprochenen Themen vertrauter zu werden. Auch sind die Aufzählungen in diesem Artikel sicherlich nicht vollständig. Was führt bei Ihnen noch zu nichtnormalverteilten Daten? Und wie gehen Sie damit um? Lassen Sie uns hierzu in Kontakt bleiben!

Optimierung & Achtsamkeit by Daniel Fügner