Het gerandomiseerde blokontwerp is het equivalent van een gestratificeerde steekproef. Net als gestratificeerde bemonstering worden gerandomiseerde blokontwerpen geconstrueerd om ruis of variantie in de gegevens te verminderen (zie classificeren van de experimentele ontwerpen). Hoe doen ze dat? Zij vereisen dat de onderzoeker de steekproef in relatief homogene subgroepen of blokken (analoog aan “strata” in gestratificeerde bemonstering) verdeelt. Vervolgens wordt het experimentele ontwerp dat u wilt implementeren geïmplementeerd binnen elk blok of homogene subgroep., Het belangrijkste idee is dat de variabiliteit binnen elk blok kleiner is dan de variabiliteit van de gehele steekproef. Zo is elke schatting van het behandelingseffect binnen een blok efficiënter dan schattingen over de gehele steekproef. En als we deze efficiëntere schattingen over blokken bundelen, moeten we over het algemeen een efficiëntere schatting krijgen dan zonder blokkering.
Hier kunnen we een eenvoudig voorbeeld zien. Laten we aannemen dat we oorspronkelijk bedoeld om een eenvoudige posttest uit te voeren-alleen gerandomiseerd experimenteel ontwerp., Maar we erkennen dat ons monster verschillende intacte of homogene subgroepen heeft. Bijvoorbeeld, in een studie van studenten, kunnen we verwachten dat studenten relatief homogeen zijn ten opzichte van klasse of jaar. Dus, we besluiten om het monster te blokkeren in vier groepen: eerstejaars, tweedejaars, junior en senior. Als ons vermoeden juist is, dat de variabiliteit binnen de klasse kleiner is dan de variabiliteit voor de gehele steekproef, zullen we waarschijnlijk krachtiger schattingen krijgen van het behandelingseffect binnen elk blok (zie de discussie over statistische macht)., Binnen elk van onze vier blokken, zouden we het eenvoudige post-only gerandomiseerde experiment implementeren.
merk een paar dingen op over deze strategie. Ten eerste, voor een externe waarnemer, kan het niet duidelijk zijn dat je blokkeert. Je zou hetzelfde ontwerp in elk blok implementeren. En, er is geen reden dat de mensen in verschillende blokken moeten worden gescheiden of gescheiden van elkaar. Met andere woorden, blokkeren hoeft niet per se invloed op alles wat je doet met de onderzoeksdeelnemers., In plaats daarvan, blokkeren is een strategie voor het groeperen van mensen in uw data – analyse om ruis te verminderen-het is een analyse strategie. Ten tweede profiteert u alleen van een blokkeringsontwerp als u juist bent in uw voorgevoel dat de blokken homogener zijn dan het hele Monster. Als je het mis hebt – als verschillende college-niveau klassen zijn niet relatief homogeen met betrekking tot uw Maatregelen – je zal eigenlijk worden gekwetst door het blokkeren (je krijgt een minder krachtige schatting van de behandeling effect). Hoe weet je of blokkeren een goed idee is?, U moet zorgvuldig overwegen of de groepen relatief homogeen zijn. Als je bijvoorbeeld politieke houdingen meet, is het dan redelijk te geloven dat eerstejaars meer op elkaar lijken dan tweedejaars of Junioren? Zouden zij homogener zijn met betrekking tot maatregelen in verband met drugsmisbruik? Uiteindelijk is de beslissing om te blokkeren een oordeel van de kant van de onderzoeker.
hoe reduceert blokkering ruis
dus hoe werkt blokkering om ruis in de gegevens te verminderen? Om te zien hoe het werkt, moet je beginnen met na te denken over de niet-geblokkeerde studie., De figuur toont de pretest-posttest verdeling voor een hypothetisch pre-post gerandomiseerd experimenteel ontwerp. We gebruiken het’ X ‘ symbool om een geval van een programmagroep aan te geven en het ‘O’ symbool voor een lid van een vergelijkingsgroep. U kunt zien dat Voor een specifieke pretest waarde, de programmagroep de neiging om de vergelijking groep te overtreffen met ongeveer 10 punten op de posttest. Dat wil zeggen, Er is ongeveer een 10-punts posttest gemiddelde verschil.
laten we nu een voorbeeld bekijken waarbij we het monster in drie relatief homogene blokken verdelen., Om te zien wat er grafisch gebeurt, gebruiken we de pretest om te blokkeren. Dit zal ervoor zorgen dat de groepen zeer homogeen zijn. Laten we eens kijken naar wat er binnen het derde blok gebeurt. Merk op dat het gemiddelde verschil is nog steeds hetzelfde als het was voor de gehele steekproef – ongeveer 10 punten binnen elk blok. Maar merk ook op dat de variabiliteit van de posttest veel minder is dan het was voor de gehele steekproef.
onthoud dat de schatting van het behandelingseffect een signaal-ruisverhouding is. Het signaal in dit geval is het gemiddelde verschil. Het geluid is de variabiliteit., De twee cijfers laten zien dat we het signaal niet hebben veranderd in het verplaatsen naar blokkeren — er is nog steeds ongeveer een 10-punt posttest verschil. Maar we hebben de ruis veranderd – de variabiliteit op de posttest is veel kleiner binnen elk blok dat het is voor het hele Monster. Zo, zal het behandelingseffect minder lawaai voor hetzelfde signaal hebben.
uit de grafieken moet duidelijk blijken dat het blokkeringsontwerp in dit geval het sterkere behandelingseffect zal opleveren. Maar dit is alleen waar omdat we goed werk hebben gedaan om ervoor te zorgen dat de blokken homogeen waren., Als de blokken niet homogeen waren — hun variabiliteit was zo groot als die van de gehele steekproef — zouden we eigenlijk slechtere schattingen krijgen dan in het eenvoudige gerandomiseerde experimentele geval. We zullen zien hoe we gegevens van een gerandomiseerd blokontwerp kunnen analyseren in de statistische analyse van het gerandomiseerde blokontwerp.