Unabhängigkeit von Merkmalen - Grundlagen der Statistik - Fernuni Hagen - Fernstudium4You

Logout
Direkt zum Seiteninhalt

Unabhängigkeit von Merkmalen - Grundlagen der Statistik - Fernuni Hagen

Grundlagen Statistik-Paket > Grundlagen-Statistik > Zweidimensionale Häufigkeitsverteilung

Grundlage der (Un-)Abhängigkeit von Merkmalen:

Zwischen zwei Merkmalen 𝑋 und 𝑌 kann eine Abhängigkeit oder Unabhängigkeit bestehen. Dabei besagt die Abhängigkeit zweier Merkmale 𝑋 und 𝑌, dass ein gewisser Zusammenhang zwischen den beiden Merkmalen besteht. Das bedeutet, dass mittels des Wissens einer Merkmalsausprägung in gewissem Maße auf die Merkmalsausprägung des anderen Merkmals geschlossen werden kann. Die Unabhängigkeit hingegen besagt, dass keinerlei Zusammenhang zwischen den beiden Merkmalen besteht, entsprechend existiert keinerlei Zusammenhang zwischen den Merkmalsausprägungen.
Beispiel der Abhängigkeit zweier Merkmale:
Die beiden Merkmale Körpergröße und Gewicht sind beispielsweise in gewissem Maße abhängig voneinander. So ist davon auszugehen, dass mit steigender Körpergröße auch das Gewicht in gewissem Maße steigt.
Beispiel der Unabhängigkeit zweier Merkmale:
Die beiden Merkmale Geschlecht und Nationalität sind beispielsweise unabhängig voneinander. Mittels des Wissens über das Geschlechts eines Menschen lässt sich keine Aussage über dessen Herkunft treffen.

Mathematische Ermittlung der Unabhängigkeit von Merkmalen:
Die Unabhängigkeit zweier Merkmale lässt sich mittels der bedingten Verteilung prüfen. Denn Unabhängigkeit von Merkmalen liegt genau dann vor, wenn die Verteilung eines Merkmals nicht vom anderen Merkmal beeinflusst wird. Stimmen die bedingten Verteilungen des Merkmals mit der Randverteilung des Merkmals überein, so nimmt das andere Merkmal keinerlei Einfluss auf dessen Verteilung. Für die Unabhängigkeit von Merkmalen muss entsprechend gelten:
Mathematische Bestimmung der Unabhängigkeit von Merkmalen
Für die Unabhängigkeit zweier Merkmale muss allgemein folgendes gelten:
Darstellung der Unabhängigkeit bei bedingter Verteilung

Merke: Stimmt auch nur eine bedingte Verteilung eines Merkmals nicht mit der Randverteilung des Merkmals überein, sind die Merkmale abhängig!

Mathematische Umformung zur Vereinfachung der Ermittlung der Unabhängigkeit von Merkmalen:

Zur Prüfung auf die Unabhängigkeit von Merkmalen haben wir bisher die bedingten Verteilungen mit den Randverteilungen verglichen. Die Gleichung zur Ermittlung der Unabhängigkeit von Merkmalen lässt sich jedoch umformen, sodass wir mittels der Randverteilungen auf die Häufigkeitsverteilung der Merkmalskombinationen schließen können. Diese Vorgehensweise erspart uns gerade bei angegebenen absoluten Häufigkeiten viel Zeit.

Mathematische Umformung der Gleichung für die Unabhängigkeit von Merkmalen:
Für die Ermittlung der Unabhängigkeit von Merkmalen galt folgender mathematischer Zusammenhang:
Formel des mathematischen Zusammenhangs der Unabhängigkeit
Aus den bedingten Verteilungen wissen wir, dass 𝑓(𝑥_𝑗│𝑦_𝑘 )=(𝑓(𝑥_(𝑗, ) 𝑦_𝑘))/(𝑓(𝑦_𝑘)) bzw. das 𝑓(𝑦_𝑘│𝑥_𝑗 )=(𝑓(𝑥_(𝑗, ) 𝑦_𝑘))/(𝑓(𝑥_𝑗)) entspricht. Ersetzen wir die bedingten Verteilungen mit ihrer mathematischen Gleichung, gelangen wir für die Unabhängigkeit von Merkmalen zu folgendem Zusammenhang:
Formel der Unabhängigkeit mit ersetzter bedingter Verteilung
Diese Gleichungen lassen sich nun durch die Multiplikation mit dem Nenner umformen, sodass sich Gleichungen aufgelöst nach der relativen Häufigkeitsverteilung der Merkmalskombinationen ergeben:
Umformung der Formel für die Unabhängigkeit
Da wir wissen, dass die relative Häufigkeit nichts anderes darstellt als die absolute Häufigkeit geteilt durch die Gesamtanzahl aller Merkmalskombinationen 𝑛, können wir schließlich auch die absoluten Häufigkeiten für die Merkmalskombinationen bei Unabhängigkeit der Merkmale mittels der Randverteilungen ermitteln:
Vereinfachte Formel der mathematischen Unabhängigkeit

Vereinfachung der Prüfung auf die Unabhängigkeit von Merkmalen:
Aus der allgemeinen Gleichung zur Ermittlung der Unabhängigkeit von Merkmalen geht hervor, dass man neben dem Vergleich der bedingten Häufigkeiten mit der Randverteilung auch durch Multiplikation der jeweiligen Randverteilungen und ggf. Teilung durch 𝑛 prüfen kann, ob sich die richtige absolute/relative Häufigkeit für eine bestimmte Merkmalskombination ergibt. Stimmt die angegebene absolute/relative Häufigkeit der Merkmalskombination nicht mit dem Ergebnis der Multiplikation der jeweiligen Randverteilungen überein, sind die Merkmalsausprägungen abhängig voneinander.

Video "Unabhängigkeit von Merkmalen":

Das Probe-Video behandelt die Thematik "Unabhängigkeit von Merkmalen" des Kurses "Grundlagen der Statistik" des Moduls "Grundlagen der Wirtschaftsmathematik und Statistik" der Fernuni Hagen. Dieses Video ist ein Ausschnitt aus dem Inhalt des Grundlagen Statistik-Pakets.
Alle Thematiken des vollständigen Videos

Beispiel mittels der Vereinfachung zur Prüfung von Unabhängigkeit bei Merkmalen:

Zur Veranschaulichung der Vereinfachung wollen wir nochmals von unserem vorhergehenden Beispiel ausgehen, mit der gemeinsamen Verteilung des Merkmals 𝑋 Geschlecht und des Merkmals 𝑌 Nationalität:
Datenmaterial zur Überprüfung auf Unabhängigkeit

Die Prüfung, ob die Merkmale voneinander unabhängig sind, erfolgt nun nicht mehr über die bedingte Verteilung, sondern wir wollen prüfen, ob die angegebenen Häufigkeiten der Merkmalskombinationen sich aus der Multiplikation der Randverteilung und anschließender Division durch 𝑛 = 100 ergeben:
Mathematische Überprüfung von Datenmaterial auf die Unabhängigkeit der Merkmalen
Die Häufigkeitsverteilung aller Merkmalskombinationen stimmt mit der Multiplikation der jeweiligen Randverteilung überein. Das bedeutet, dass die Merkmale unabhängig voneinander sind. Wäre nur eine Häufigkeit abgewichen, so wären die Merkmale abhängig voneinander gewesen.

Merke: Welche der beiden Methoden zur Prüfung auf Unabhängigkeit der Merkmale man wählt, bleibt einem selbst überlassen. Jedoch muss man beide Methoden nicht bis zum Ende durchführen, sobald auffällt, dass entweder eine bedingte Verteilung von der Randverteilung abweicht, oder eine angegebene Häufigkeit nicht mit der Multiplikation der Randverteilung übereinstimmt. Auch nur eine Abweichung führt bereits dazu, dass die Merkmale abhängig voneinander sind.

ACHTUNG: Die Prüfung auf Unabhängigkeit trifft keine Aussage darüber, inwieweit bei ermittelter Abhängigkeit die Merkmale voneinander abhängig sind, dafür dient die Korrelation.
Grundlagen Statistik-Paket
Live-Webinare
Übungen (optional)
24 h Lehrvideos
240 Skriptseiten
Formelsammlung
Klausurlösungen
Das Grundlagen Statistik-Paket enthält den gesamten statistischen Teil des Kurses "Grundlagen der Statistik" des Moduls "Grundlagen der Wirtschaftsmathematik und Statistik" der Fernuni Hagen. Das Paket erfordert keinerlei großen statistischen Vorkenntnisse und ist ausgerichtet auf das erfolgreiche Bestehen der Klausur. Der Aufbau folgt den Kursskripten der Fernuni Hagen und behandelt dabei alle wichtigen Themen. Optional zum Paket stehen noch über 160 Übungsaufgaben und Übungsklausuren zur Verfügung.
Zurück zum Seiteninhalt