Was sind Unterschiede zwischen Grundgesamtheit und Stichprobe?
Was sind Unterschiede zwischen Grundgesamtheit und Stichprobe?
Der Unterschied zwischen Grundgesamtheit und Stichproben besteht darin, dass die Grundgesamtheit alle Objekte umfasst, über die du Erkenntnisse gewinnen willst. Die Stichprobe ist hingegen der Teil der Grundgesamtheit, den du untersuchst, um Schlüsse zu ziehen.
Ein Hypothesentest wird dazu benötigt, Annahmen über die Welt zu überprüfen. Dazu werden Hypothesen aufgestellt, die anhand statistischer Tests überprüft werden.
Wann wir welchen Korrelationskoeffizienten als Zusammenhangsmaß verwenden, hängt vom Skalenniveau unserer Daten ab. Um die Korrelation nach Pearson zu berechnen, benötigen wir metrische Daten. Spearman’s Rangkorrelationskoeffizienten verwenden wir für ordinalskalierte Daten.
In der deskriptiven Statistik geht es um das Beschreiben von Daten. Ziel ist es dabei einen Überblick über die vorliegenden Daten zu erhalten und diese zu ordnen.
In der deskriptiven Statistik beziehen sich alle Ergebnisse auf unseren vorliegenden Datensatz. In der induktiven Statistik schließen wir von Daten aus einer Stichprobe auf eine Grundgesamtheit.
Statistische Signifikanz gibt an, wie wahrscheinlich es ist, dass ein Ergebnis auf Zufall basiert. Signifikanz wird i. d. R. durch einen p-Wert angegeben.
Das Signifikanzniveau, das mit dem der p-Wert verglichen wird, wird von den Forschenden selbst festgelegt und ist meistens 0.05 oder 0.01. Wenn der p-Wert kleiner ist als das gewählte Signifikanzniveau, spricht man von einem statistisch signifikanten Ergebnis.
Ein Signifikanzniveau α gibt an, was die maximale Wahrscheinlichkeit ist, mit der eine Nullhypothese fälschlicherweise abgelehnt wird. Das Signifikanzniveau legst du zu Beginn deiner statistischen Untersuchung selbst fest.
Ein Alpha-Fehler, auch Typ-1-Fehler oder false positive genannt, ist das fälschliche Ablehnen einer Nullhypothese. Es wird aus der statistischen Analyse also geschlossen, dass es einen statistisch signifikanten Zusammenhang, Effekt oder Unterschied gibt, obwohl dies eigentlich nicht der Fall ist.
Ein niedriges Signifikanzniveau erhöht die Wahrscheinlichkeit für einen Alpha-Fehler.
Der p-Wert beschreibt die Wahrscheinlichkeit, dass die gefundene Teststatistik (oder ein extremerer Wert) in der Stichprobe vorkommt, unter der Annahme, dass die Nullhypothese wahr ist.
Das hängt davon ab, welches Signifikanzniveau (α) gewählt wurde. Meist ist dies 0,05.
Wenn der p-Wert kleiner ist als α, dann wird die Nullhypothese abgelehnt.
Der p-Wert kann am einfachsten mithilfe eines Statistikprogramms berechnet werden. Hierfür solltest du den richtigen statistischen Test durchführen.
Alternativ gibt es im Internet Tabellen, die die p-Werte auflisten. Suche nach der richtigen Tabelle für deinen statistischen Test. Dafür benötigst du die Freiheitsgrade und die Teststatistik.
Die Kovarianz ist ein nicht-standardisiertes Zusammenhangsmaß und hat daher nur eine geringe Vergleichbarkeit. Wir können aus der Kovarianz die Korrelation bestimmen. Diese ist standardisiert und lässt daher eine höhere Vergleichbarkeit zu.
Die Nullhypothese ist das Gegenteil der Alternativhypothese und besagt, dass es keinen wirklichen Zusammenhang gibt. Mögliche Unterschiede sind demnach nur durch Zufall entstanden.
Die vier Schritte des Hypothesentests sind: 1. Hypothesen aufstellen, 2. Daten sammeln, 3. Statistischen Test durchführen, 4. Entscheiden, ob die Nullhypothese abgelehnt oder beibehalten wird.
Hypothesentests können einseitig oder beidseitig sein. Die einseitigen Tests können linksseitig oder rechtsseitig sein. Welcher Hypothesentest angebracht ist, hängt von der Forschungsfrage ab.
Im allgemeinen solltest du mit Verallgemeinerungen auf die gesamte Population (oder Grundgesamtheit) vorsichtig sein. Außerdem können beim Hypothesentest die Fehler 1. und 2. Art auftreten.
In Excel können wir den Korrelationskoeffizienten mit dem Befehl =KORREL() bestimmen. Gib dazu in den Klammern die Zellen an, für die du die Korrelation bestimmen möchtest. Trenne die Werte für die beiden Variablen mit einem Semikolon.
Gib in Excel =STABW.S() oder =STDEV.S() ein, um die Standardabweichung einer Stichprobe zu bestimmen. In die Klammern schreibst du dann die Zellen mit den Werten, für die du die Standardabweichung bestimmen willst.
BeispielDeine Werte, für die du die Standardabweichung bestimmen willst, stehen in den Zellen C3 bis L3. Schreibe also in eine leere Zelle: =STABW.S(C3:L3) oder =STDEV.S(C3:L3) und du erhältst die Standardabweichung der Werte in diesen Zellen.
Beachte dabei, dass es sich um die Standardabweichung einer Stichprobe handelt. Die Standardabweichung einer Grundgesamtheit kannst du in Excel mit dem Befehl =STABW.N. bestimmen.
BeispielDu hast 20 Personen nach dem Alter gefragt und möchtest nun die Standardabweichung des Alters in der Gruppe bestimmen. Füge für xi die einzelnen Altersangaben der Personen in die Formel der Standardabweichung ein.
Die Standardabweichung ist ein Maß für die Streuung von Daten. Sie gibt die durchschnittliche Abweichung aller erhobenen Werte von ihrem Durchschnittswert an.
Welche Formel du zur Berechnung der Standardabweichung verwendest, hängt davon ab, ob du die Daten einer Stichprobe oder einer Grundgesamtheit vorliegen hast.
Formeln zur Standardabweichung
Stichprobe
Grundgesamtheit
BeachteWenn du die Varianz bereits gegeben hast, kannst du die Standardabweichung auch bestimmen, indem du die Wurzel aus der Varianz ziehst.Beispiel
Verwende den Korrelationskoeffizienten nach Pearson bei metrischen Daten und den Rangkorrelationskoeffizienten nach Spearman bei ordinalen Daten, für die du eine Korrelation bestimmst.
Wann wir welchen Korrelationskoeffizienten verwenden, hängt vom Skalenniveau der Daten ab. Um die Korrelation nach Pearson zu berechnen, benötigen wir metrische Daten. Spearman‘s Rangkorrelationskoeffizienten verwenden wir für ordinalskalierte Daten.
Der Rangkorrelationskoeffizient nach Spearman gibt uns Auskunft über den Zusammenhang zwischen zwei mindestens ordinalskalierten Variablen.
Anhand des Rangkorrelationskoeffizienten können wir sagen, ob zwei Variablen zusammenhängen, und wenn ja, wie stark der Zusammenhang ist und in welche Richtung er besteht.
Wann wir welchen Korrelationskoeffizienten verwenden, hängt vom Skalenniveau unserer Daten ab. Um die Korrelation nach Pearson zu berechnen, benötigen wir metrische Daten. Spearman’s Rangkorrelationskkoeffizienten verwenden wir für ordinalskalierte Daten.
Cramers V ist ein standardisiertes Zusammenhangsmaß und lässt daher Vergleiche mehrerer Koeffizienten zu. Chi-Quadrat ist nicht standardisiert und hat daher eine geringere Aussagekraft.
Der Wert für Cramers V liegt zwischen 0 und 1. Dabei bedeutet 0, dass es überhaupt keinen Zusammenhang gibt, und 1, dass es einen vollständigen Zusammenhang gibt. Dabei gilt es zu beachten, dass wir anhand von Cramers V zwar Aussagen über die Stärke, nicht aber über die Richtung des Zusammenhangs treffen können.
Nein, über die Richtung des Zusammenhangs informieren nur einige Zusammenhangsmaße wie der Rangkorrelationskoeffizient nach Spearman oder der Korrelationskoeffizient nach Pearson. Allerdings geben alle Zusammenhangsmaße Informationen über die Stärke eines statistischen Zusammenhangs.
Welches Zusammenhangsmaß du verwenden kannst, hängt vom Skalenniveau deiner Daten ab. Überprüfe dazu, ob du nominale, ordinale oder metrische Daten vorliegen hast.
Noch Fragen?
Frag unser Team
Du bevorzugst direkten Kontakt?
Kein Problem, wir sind montags bis sonntags
von 9:00 Uhr bis 23:00 Uhr für dich da.