Varianzanalyse durchführen - ANOVA

Veröffentlicht am von
Mit dem Begriff ANOVA, englisch für Analysis of Variance, wird eine Varianzanalyse bezeichnet, die Mittelwerte von mehr als zwei Gruppen miteinander vergleichen. Sie stellt einer Erweiterung zum bekannten t-Test dar, der nur die Mittelwerte von maximal zwei Gruppen vergleicht. Schauen wir uns die ANOVA anhand der Beispiele von Studi-Kompass an!

Beispiel
Du möchtest überprüfen, ob es in der Größe von Fußballspielern, Handballern und Volleyballspielern Unterschiede gibt. Selbstverständlich musst du die verschiedenen Größen in einer Stichprobe ermitteln. Anschließend kannst du mit Hilfe von ANOVA aussagen, ob die durchschnittliche Größe der Sportler tatsächlich unterschiedlich ausfällt. 


Formen der Varianzanalyse

Welche Form der Varianzanalyse du verwendest, richtet sich nach deinen Daten und deinem konzeptionellen Modell. In der Regel werden einfaktorielle und zweifaktorielle Varianzanalysen benutzt. 
  • Einfaktorielle Varianzanalyse
Du kannst sie verwenden, wenn dir eine Gruppenvariable für alle Gruppen und eine abhängige Variable vorliegen. 
  • Zweifaktorielle Varianzanalyse
Sie eignet sich, wenn du über zwei oder mehr Gruppenvariable mit einer abhängigen Variablen verfügst. 
  • Mehrfaktorielle Varianzanalyse (MANOVA)
Falls mehrere abhängige Variablen vorliegen, lässt sich ANOVA mit jeweils einer oder mehreren Gruppenvariablen durchführen.

Beispiel
Du möchtest neben der durchschnittlichen Größe von Sportlern auch das durchschnittliche Gewicht von unterschiedlichen Gruppen untersuchen und miteinander vergleichen. Wenn du mehrere individuelle ANOVAs anwendest, schleicht sich eventuell ein Fehler der 1. Art oder α-Fehler ein. Das bedeutet die inkorrekte Annahme, dass Unterschiede zwischen den Gruppen existieren. Bei mehreren abhängigen Variablen empfiehlt sich auf jeden Fall die Methode MANOVA. 
  • ANOVA mit Messwiederholungen
Diese Methode eignet sich, wenn du zu mehreren Zeitpunkten eine Gruppe von Befragten untersuchen möchtest. 

Beispiel
Um herauszufinden, ob sich das durchschnittliche Gewicht von denselben Personen über ein gewisses Zeitintervall verändert hat, misst du deren Gewicht in den Jahren 2009, 2014 und 2019. 


Durchführung einer einfaktoriellen ANOVA

In diesem Verfahren soll die durchschnittliche Größe von verschiedenen Athleten wie Fußballspielern, Turnern und Leichtathleten miteinander verglichen werden. Die einzige Gruppenvariable besteht aus der Art des Sports, die einzige abhängige Variable ist die Größe. 


Durchführung einer zweifaktoriellen ANOVA

Du möchtest die durchschnittliche Größe von unterschiedlichen Gruppen von Sportlern und dessen Geschlecht vergleichen. Der Test bezieht sich nicht nur darauf, ob Unterschiede zwischen dem Mittelwert von Turnern, Fußballspielern oder Leichtathleten bestehen, sondern ob bei den Athleten auch bei Männern und Frauen ein Größenunterschied voneinander besteht. 


ANOVA mit SPSS

Um eine einfaktorielle Varianzanalyse durchzuführen, musst du dir SPSS herunterladen und dann im Menü anklicken:
  • Analysieren
  • Mittelwerte vergleichen
  • Einfaktorielle Varianzanalyse
Wenn das Fenster geöffnet ist, fügst du die Variable Größe als abhängige Variable und die Variable Sport als Faktor hinzu. Um Mittelwerte für die Gruppe zu erhalten, wählst du unter OptionenDeskrptive Statistik aus. Mit einem Klick auf Test und Homogenität der Varianzen findest du heraus, ob die Bedingung für gleiche Varianzen (Homoskedastizität) gegeben ist. Mit OK kannst du eine Analyse durchführen.

Für die zweifaktorielle Varianzanalyse mit klickst du im Menü auf: 
  • Analysieren
  • Allgemeines Lineares Modell
  • Univariat oder Multivariat oder Messwiederholung
Das Fenster ist geöffnet und du wählst die Variable Größe im Feld Abhängige Variable und im Feld Feste Faktoren gibst du die Variablen Geschlecht und Sport ein. Um die Mittelwerte zu berechnen, kannst du unter Geschätzte Randmittel in den Optionen Mittelwerte anzeigen für einfügen. Mit OK aktivierst du die Analyse. 


ANOVA mit Excel

Zur Berechnung der einfaktoriellen Varianzanalyse mit Excel klickst du auf:
  • Extras
  • Datenanalyse
  • ANOVA: Single Factor (einfaktorielle Varianzanalyse)
Mit Input Range kannst du die Daten für alle drei Sportarten und der Labels auswählen, markiere anschließend Labels in first row. Für die Ausgabe der Ergebnisse der ANOVA (Output Range) klickst du in ein Feld neben den Daten.

Um die zweifaktorielle Varianzanalyse mit Excel durchzuführen drückst du auf:
  • Extras
  • Datenanalyse
  • ANOVA: Two-Factor With Replication (zweifaktorielle Varianzanalyse)
Das Markieren aller Daten, inklusive den Labels passiert im Feld Input Range und bei Rows per sample gibst du die Zahl 5 ein, bei Alpha 0,05. Um die Output Range festlegen, klickst du auf ein Feld neben den Daten, die Analyse schließt du mit OK ab. 


Interpretation der ANOVA Ergebnisse

Nach der Durchführung der Analyse bekommst du von jedem Programm Tabellen mit den Ergebnissen, die für die einfaktorielle und zweifaktorielle ANOVA unterschiedlich ausfallen. Mit der Navigation zwischen den Tabs kannst du die Interpretation der jeweiligen Ausgabe sehen.
  • Einfaktorielle Varianzanalyse
Falls du zusätzlich auf gleiche Varianzen testen möchtest, erhältst du zwei relevante Tabellen:
  • Test der Homogenität der Varianzen 
  • Einfaktorielle ANOVA
Ein Test zur Homogenität der Varianzen erklärt, dass die Bedingung gleicher Varianzen für die verschiedenen Gruppen zutrifft. Wenn der Wert der Signifikanz der Zeile Größe – Basiert auf dem Mittelwert größer als 0.050 ist, ist die Voraussetzung gleicher Varianzen gegeben.

Tipp: Sollten es bei den Varianzen für die verschiedenen Gruppen Unterschiede geben, solltest du zum Beispiel den Brown-Forsythe-Test bevorzugen. 

In der zweiten Tabelle findest du das Ergebnis der einfaktoriellen ANOVA, nachdem getestet wurde, ob sich ein signifikanter Teil der Varianz durch die Gruppenvariable ergibt. Dafür verwendest du einen F-Test mit zwei Freiheitsgraden (Anzahl der Gruppen ist drei minus eins) und 27 (Anzahl der Beobachtungen ist 30 minus der Anzahl der Gruppen (drei)). In der Spalte Signifikanz erkennst du die Wahrscheinlichkeit mit einem Wert von 0,001, was auf einen F-Wert von 9.592 oder größer mit diesen Freiheitsgraden schließen lässt. 

Es lässt sich daraus deutlich schließen, dass sich die Gruppenmittelwerte voneinander unterscheiden. Aus dem Mittel der Quadrate erkennst du, wieviel der Varianz zwischen den Gruppen und innerhalb der Gruppen liegt. Wenn eine höhere Varianz zwischen den Gruppen existiert, sagen die Gruppen die Größe besser vorher.
  • Zweifaktorielle Varianzanalyse
Hier erhältst du mehrere Tabellen mit deskriptiven Statistiken, zum Beispiel den Mittelwerten für jede Gruppe, wobei die Tabelle Tests der Zwischensubjekteffekte enorm wichtig ist. Du kannst überprüfen, ob sich ein signifikanter Teil der Varianz durch die Gruppenvariablen erklären lässt. 

Du solltest einen F-Test mit fünf Freiheitsgraden (Anzahl der Gruppen von Athleten ist drei Mal der Anzahl der Geschlechter ist zwei minus eins) und 24 (Zahl der Beobachtungen ist 30 minus der Anzahl der Gruppen der Athleten = drei Mal der Anzahl der Geschlechter (zwei)) durchführen. Aus der Spalte Sig. entnimmst du, dass die Wahrscheinlichkeit einen F-Wert von 22.878 oder größer mit diesen Freiheitsgraden zu erhalten unter dem Wert von 0.001 liegt. Die Mittelwerte der Gruppen unterscheiden sich demnach. 

Beispiel
Es lassen sich signifikante Unterschiede zwischen der durchschnittlichen Größe zwischen Männern und Frauen und den verschiedenen Gruppen von Athleten feststellen (Sig. Kleiner 0,001). Allerdings gibt es keinen speziellen Zusammenhang zwischen Geschlecht und Sport (Geschlecht * Sport = Sig.:0.557). Die Messwerte zeigen, dass sich der Größenunterschied der Sportler nicht durch ihr Geschlecht erklären lässt. 


Statistische Voraussetzungen für ANOVA

Vor der Durchführung von ANOVA musst du für deine Daten bestimmte statistische Bedingungen beachten. Andernfalls könnte das Einfluss auf deine Ergebnisse nehmen, die du dann falsch interpretierst. Unter diesen Bedingungen kannst du Abweichungen vermeiden:
  • Die abhängige Variable ist ratio- oder intervallskaliert.
  • Der Datensatz pro Gruppe wurde einer Zufallsstichprobe entnommen.
  • Es gibt gleiche Varianzen für jede Gruppe, was du mit einem Homogenitätstest der Varianzen überprüfen kannst.
  • Die Daten innerhalb jeder Gruppe sind normalverteilt.
Du hast schon abgestimmt. Danke! like-dislike confetti
War dieser Artikel hilfreich?
author image
Ulrich Güttinger
Ulrich ist ein promovierter Linguist, erfahrener Texter und bloggt seit 4 Jahren über Studium, Karriere und akademisches Schreiben. Er ist immer auf der Suche nach echt guten Ideen und frischer Inspiration für unseren Blog. Ulrich sorgt dafür, dass unseren Lesern das Schreiben der Abschlussarbeit leichter fällt.