Das randomisierte Blockdesign entspricht dem Forschungsdesign einer geschichteten Zufallsstichprobe. Wie bei der geschichteten Abtastung werden randomisierte Blockdesigns erstellt, um Rauschen oder Abweichungen in den Daten zu reduzieren (siehe Klassifizieren der experimentellen Designs). Wie machen sie es? Sie erfordern, dass der Forscher die Stichprobe in relativ homogene Untergruppen oder Blöcke aufteilt (analog zu „Schichten“ in geschichteter Stichprobe). Anschließend wird das experimentelle Design, das Sie implementieren möchten, in jedem Block oder jeder homogenen Untergruppe implementiert., Die Schlüsselidee ist, dass die Variabilität innerhalb jedes Blocks geringer ist als die Variabilität der gesamten Stichprobe. Somit ist jede Schätzung des Behandlungseffekts innerhalb eines Blocks effizienter als Schätzungen über die gesamte Stichprobe hinweg. Und wenn wir diese effizienteren Schätzungen über Blöcke hinweg bündeln, sollten wir eine insgesamt effizientere Schätzung erhalten, als wir es ohne Blockierung tun würden.
Hier sehen wir ein einfaches Beispiel. Nehmen wir an, wir wollten ursprünglich ein einfaches Posttest-Only-randomisiertes experimentelles Design durchführen., Wir erkennen jedoch, dass unsere Stichprobe mehrere intakte oder homogene Untergruppen aufweist. Zum Beispiel können wir in einer Studie von College-Studenten erwarten, dass die Schüler in Bezug auf Klasse oder Jahr relativ homogen sind. Also, Wir beschließen, die Probe in vier Gruppen zu blockieren: Freshman, Sophomore, Junior und Senior. Wenn unsere Vermutung richtig ist, dass die Variabilität innerhalb der Klasse geringer ist als die Variabilität für die gesamte Stichprobe, werden wir wahrscheinlich stärkere Schätzungen des Behandlungseffekts innerhalb jedes Blocks erhalten (siehe die Diskussion über die statistische Potenz)., In jedem unserer vier Blöcke würden wir das einfache Post-Only-randomisierte Experiment implementieren.
Beachten Sie ein paar Dinge über diese Strategie. Erstens kann es für einen externen Beobachter nicht offensichtlich sein, dass Sie blockieren. Sie würden in jedem Block das gleiche Design implementieren. Und es gibt keinen Grund, dass die Menschen in verschiedenen Blöcken voneinander getrennt oder getrennt werden müssen. Mit anderen Worten, das Blockieren wirkt sich nicht unbedingt auf alles aus, was Sie mit den Forschungsteilnehmern tun., Stattdessen ist das Blockieren eine Strategie, um Personen in Ihrer Datenanalyse zu gruppieren, um Lärm zu reduzieren-es ist eine Analysestrategie. Zweitens profitieren Sie nur von einem Blockierungsdesign, wenn Sie in Ihrer Vermutung richtig sind, dass die Blöcke homogener sind als die gesamte Probe. Wenn Sie sich irren – wenn verschiedene Klassen auf College-Ebene in Bezug auf Ihre Maßnahmen nicht relativ homogen sind – werden Sie tatsächlich durch Blockieren verletzt (Sie erhalten eine weniger starke Schätzung des Behandlungseffekts). Woher wissen Sie, ob das Blockieren eine gute Idee ist?, Sie müssen sorgfältig prüfen, ob die Gruppen relativ homogen sind. Wenn Sie zum Beispiel politische Einstellungen messen, ist es vernünftig zu glauben, dass Erstsemester einander ähnlicher sind als Zweitklässler oder Junioren? Wären sie homogener in Bezug auf Maßnahmen im Zusammenhang mit Drogenmissbrauch? Letztendlich beinhaltet die Blockierungsentscheidung ein Urteil des Forschers.
Wie reduziert das Blockieren das Rauschen
Wie funktioniert das Blockieren, um das Rauschen in den Daten zu reduzieren? Um zu sehen, wie es funktioniert, müssen Sie zunächst über die nicht blockierte Studie nachdenken., Die Abbildung zeigt die Pretest-Posttest-Verteilung für ein hypothetisches pre-Post randomisiertes experimentelles Design. Wir verwenden das ‚X‘ – Symbol, um einen Programmgruppenfall und das ‚O‘ – Symbol für ein Vergleichsgruppenmitglied anzugeben. Sie können sehen, dass die Programmgruppe für jeden bestimmten Pretest-Wert dazu neigt, die Vergleichsgruppe beim Posttest um etwa 10 Punkte zu übertreffen. Das heißt, es gibt ungefähr einen mittleren Posttest-Unterschied von 10 Punkten.
Betrachten wir nun ein Beispiel, in dem wir die Probe in drei relativ homogene Blöcke unterteilen., Um zu sehen, was grafisch passiert, verwenden wir das Pretest-Maß zum Blockieren. Dies wird sicherstellen, dass die Gruppen sehr homogen sind. Schauen wir uns an, was im dritten Block passiert. Beachten Sie, dass der mittlere Unterschied immer noch derselbe ist wie für die gesamte Stichprobe – etwa 10 Punkte innerhalb jedes Blocks. Beachten Sie aber auch, dass die Variabilität des Posttests viel geringer ist als bei der gesamten Stichprobe.
Denken Sie daran, dass die Schätzung des Behandlungseffekts ein Signal-Rausch-Verhältnis ist. Das Signal ist in diesem Fall die mittlere Differenz. Das Rauschen ist die Variabilität., Die beiden Zahlen zeigen, dass wir das Signal beim Übergang zum Blockieren nicht geändert haben — es gibt immer noch einen 10-Punkt-Posttest-Unterschied. Aber wir haben das Rauschen geändert — die Variabilität auf dem Posttest ist viel kleiner innerhalb jedes Blocks, dass es für die gesamte Probe ist. Der Behandlungseffekt hat also weniger Rauschen für dasselbe Signal.
Aus den Graphen sollte klar sein, dass das Blockierungsdesign in diesem Fall den stärkeren Behandlungseffekt ergibt. Dies gilt jedoch nur, weil wir gute Arbeit geleistet haben, um sicherzustellen, dass die Blöcke homogen sind., Wenn die Blöcke nicht homogen wären — ihre Variabilität war so groß wie die der gesamten Stichprobe — würden wir tatsächlich schlechtere Schätzungen erhalten als im einfachen randomisierten Experimentalfall. Wir werden sehen, wie Daten aus einem randomisierten Blockdesign in der statistischen Analyse des randomisierten Blockdesigns analysiert werden.