• 2024-07-01

Datenglättung Definition & Beispiel |

Inhaltsverzeichnis:

Anonim

Was ist das:

Datenglättung ist eine statistische Technik, die das Entfernen von Ausreißern aus einem Datensatz zur Folge hat ein Muster mehr sichtbar.

So funktioniert es (Beispiel):

Nehmen wir beispielsweise an, eine Universität analysiert ihre Kriminalitätsdaten in den letzten 10 Jahren. Die Anzahl der Gewaltverbrechen sieht in etwa so aus:

Wie Sie sehen, erlebt die Universität meistens weniger als 15 Verbrechen pro Jahr. In den Jahren 2006 und 2007 erlebte es jedoch 44 aufgrund einer experimentellen Meldepflicht des Public Safety Teams der Universität. Das Berichtsexperiment änderte die Definition von Gewaltverbrechen in jene Jahre, die Diebstähle jeglicher Art einschlugen, was einen großen Sprung in der Anzahl von "gewalttätigen" Verbrechen auf dem Campus verursachte. Wenn wir diese Jahre in den Durchschnitt einbeziehen - das heißt, wenn wir Daten glätten -, erlebte die Universität durchschnittlich etwa 19 Gewaltverbrechen pro Jahr. Aber wenn wir diese Jahre auslassen, können wir sehen, dass ein realistischer Durchschnitt 13 Gewaltverbrechen pro Jahr beträgt - ein Unterschied von 32%.

Warum es wichtig ist:

Es gibt viele Möglichkeiten, Daten zu glätten, einschließlich der Verwendung von Bewegung Durchschnittswerte und Algorithmen. Die Idee ist, dass die Datenglättung die Muster besser sichtbar macht und somit die Vorhersage von Veränderungen der Aktienkurse, Kundentrends oder anderer Geschäftsinformationen unterstützt. Datenglättung kann jedoch wichtige Informationen übersehen oder wichtige Fakten weniger sichtbar machen. mit anderen Worten, das "Abrunden der Kanten" von Daten kann bestimmte Daten überbewerten und andere Daten ignorieren.