2 Grundgesamtheit, Stichprobe
2.1 Ausgangslage
2.1.1 Fragestellung
- Wo liegt das Problem? Was möchte ich näher untersuchen?
- durchschnittliche Kalorienaufnahme (Zentrum einer Verteilung)
- Variabilität eines Merkmales
- Auftreten eines Ereignisses (Krankheit, …)
- Zusammenhang (BMI vs Bauchumfang)
- Was ist meine Zielgröße?
- Welche Faktoren beeinflussen meine Zielgröße?
- Welche Daten sind interessant/verfügbar?
- Messbarkeit der einzelnen Größen
- Was ist meine Grundgesamtheit (Population)
2.2 Grundgesamtheit, Population
- Gesamtheit aller gleichartigen Objekte, die hinsichtlich eines Merkmales untersucht werden.
- Beispiele
- alle ÖsterreicherInnen
- charakteristische Teilmenge (Frauen, Männer, WienerInnen, StudenInnen, …)
- Charge einer Produktion
- landwirtschaftliche Flächen, Lebensmittel (Äpfel, Birnen, Weintrauben, …)
- mittels Erhebung möchte man Aufschlüsse über diese Population machen
- Zensus, gesamte Population
- repräsentative Stichprobe aus der Population
2.2.1 Festlegung der Population
Am Anfang der Studie Gedanken darüber machen, was die zu untersuchende Population ist.
- Eingrenzung der Population
- Über welche Teilmenge möchte ich eine Aussage treffen?
- Erreichbarkeit der Untersuchungseinheiten
- Kostenfaktoren
- Zeitfaktoren
- Totalerhebung vs Stichprobenauswahl
2.3 Stichprobe
Eigenschaften des Merkmals (Parameter) der Population sollen anhand der Stichprobe bestimmt (geschätzt) werden.
2.3.1 Repräsentative Stichprobe
- Eine repräsentative Stichprobe soll ein Abbild der Population sein, sie soll die Heterogenität der Population widerspiegeln.
- ÖsterreicherInnen
- Altersstruktur
- Geschlecht
- sozialer Status
- Bildung
- Region
- …
- ÖsterreicherInnen
2.3.2 Einfache Zufallsauswahl
Repräsentative Stichprobe durch einfache Zufallsauswahl
Die Wahrscheinlichkeit (W!) in die Stichprobe gezogen zu werden, ist für jedes Objekt gleich.
Die W! welches Objekt als zweites gezogen wird, ist unabhängig davon, welches Objekt als erstes gezogen wurde (Unabhängigkeit)
Mögliche Vorgehensweise:
- Nummerieren aller Objekte
- Auswahl anhand Zufallszahlen
Auf die praktische Durchführbarkeit achten
2.3.3 Systematische Zufallsauswahl
Jedes x-te Objekt wird ausgewählt
Beispiel
- Jedes 10te Objekt
- Auswahl einer Zufallszahl von \(1\) - \(10\); z.B. \(4\)
- Untersucht wird \(4\)te, \(14\)te, \(24\)te, … Objekt
Auswahlsystematik darf nicht mit einem Faktor, der die Zielgröße beeinflusst, überlagert sein!
2.4 Übungen
Übung 2.1 Was ist eine repräsentative Stichprobe?
Übung 2.2 Welche Möglichkeiten gibt es eine repräsentative Stichprobe zu ziehen?
Übung 2.3 Welche Punkte sind bei der einfachen Zufallsauswahl relevant?
Übung 2.4 Beim Stratified Sampling wird die Grundgesamtheit in Gruppen eingeteilt, nach welchen Kriterien?
Übung 2.5 Beim Cluster Sampling wird die Grundgesamtheit in Gruppen eingeteilt, nach welchen Kriterien?
Übung 2.6 Sie sind für die Qualitätskontrolle von Obst zuständig. Es kommt eine LKW-Lieferung mit 500 Kisten Weintrauben und sie wollen diese bezüglich Pestizidsrückstände untersuchen. Dafür müssen sie eine repräsentative Stichprobe ziehen. Wie gehen sie vor, um eine repräsentative Stichprobe zu erhalten.