De theorie achter p-waarden en de nulhypothese lijkt in het begin misschien ingewikkeld, maar het begrijpen van de concepten zal u helpen door de wereld van de statistieken te navigeren. Helaas worden deze termen vaak misbruikt in de populaire wetenschap, dus het zou nuttig zijn voor iedereen om de basis te begrijpen.
Het berekenen van de p-waarde van een model en het bewijzen/weerleggen van de nulhypothese is verrassend eenvoudig met MS Excel. Er zijn twee manieren om het te doen en we behandelen ze allebei. Laten we gaan graven.,
nulhypothese en p-waarde
de nulhypothese is een statement, ook wel een standaardpositie genoemd, dat beweert dat de relatie tussen de waargenomen verschijnselen niet bestaat. Het kan ook worden toegepast op associaties tussen twee waargenomen groepen. Tijdens het onderzoek test je deze hypothese en probeer je het te weerleggen.
bijvoorbeeld, stel dat u wilt observeren of een bepaald fad-dieet significante resultaten heeft. De nulhypothese is in dit geval dat er geen significant verschil is in het gewicht van de proefpersonen voor en na een dieet., De alternatieve hypothese is dat het dieet een verschil maakte. Dit is wat onderzoekers zouden proberen te bewijzen.
De p-waarde is de kans dat de statistische samenvatting gelijk is aan of groter is dan de waargenomen waarde wanneer de nulhypothese waar is voor een bepaald statistisch model. Hoewel het vaak wordt uitgedrukt als een decimaal getal, is het over het algemeen beter om het uit te drukken als een percentage. Bijvoorbeeld, de p-waarde van 0,1 moet worden weergegeven als 10%.
een lage P-waarde betekent dat het bewijs tegen de nulhypothese sterk is. Dit betekent verder dat uw gegevens significant zijn., Aan de andere kant betekent een hoge p-waarde dat er geen sterk bewijs is tegen de hypothese. Om te bewijzen dat de rage dieet werkt, onderzoekers zou moeten vinden van een lage p-waarde.
een statistisch significant resultaat is het resultaat dat hoogst onwaarschijnlijk is als de nulhypothese waar is. Het significantieniveau wordt aangeduid met de Griekse letter alfa en het moet groter zijn dan de p-waarde om het resultaat statistisch significant te laten zijn.
veel onderzoekers in een breed scala van velden gebruiken de p-waarde om een beter en dieper inzicht te krijgen in de gegevens waarmee ze werken., Enkele van de prominente gebieden zijn sociologie, strafrecht, psychologie, financiën en economie.
het vinden van de p-waarde in Excel
u kunt de p-waarde van een gegevensset in MS Excel vinden via de T-Test functie of met behulp van de Data Analysis tool. Eerst kijken we naar de T-testfunctie. We onderzoeken vijf studenten die 30 dagen op dieet waren. We vergelijken hun gewicht voor en na het dieet.
opmerking: voor de doeleinden van dit artikel gebruiken we MS Excel 2010. Hoewel het niet de meest recente is, moeten de stappen over het algemeen ook van toepassing zijn op de nieuwere versies.,
T-testfunctie
volg deze stappen om de p-waarde met de T-testfunctie te berekenen.
- maak en vul de tabel aan. Onze tabel ziet er als volgt uit:
- klik op een cel buiten uw tabel.
- Type in: = T. Test(.
- typ na de geopende haakje het eerste argument in. In dit voorbeeld is het de kolom voor dieet. Het bereik moet B2:B6 zijn. Tot nu toe ziet de functie er als volgt uit: T. Test (B2: B6.,
- vervolgens zullen we het tweede argument invoeren. De kolom na dieet en de resultaten zijn ons tweede argument en het bereik dat we nodig hebben is C2:C6. Laten we het toevoegen aan de formule: T. Test (B2: B6, C2: C6.
- typ een komma na het tweede argument en de eenzijdige distributie-en tweezijdige distributie-opties zullen automatisch verschijnen in een drop-down menu. Laten we de eerste – één-staart distributie kiezen. Dubbelklik erop.
- typ een andere komma.,
- Dubbelklik op de gepaarde optie in het volgende keuzemenu.
- nu u alle elementen hebt die u nodig hebt, sluit u de haakje. De formule voor dit voorbeeld ziet er als volgt uit:=T. Test(B2:B6,C2: C6,1,1)
- druk op Enter. De cel geeft de p-waarde onmiddellijk weer. In ons geval is de waarde 0,133905569 of 13.3905569%.
omdat deze p-waarde hoger is dan 5%, levert deze p-waarde geen sterk bewijs tegen de nulhypothese., In ons voorbeeld heeft het onderzoek niet bewezen dat een dieet de proefpersonen hielp een aanzienlijke hoeveelheid gewicht te verliezen. Dit betekent niet noodzakelijk dat de nulhypothese correct is, alleen dat deze nog niet is weerlegd.
Data Analysis Route
met het Data Analysis tool kunt u veel coole dingen doen, waaronder p-waarde berekeningen. Om het eenvoudiger te maken, gebruiken we dezelfde tabel als in de vorige methode.
Dit is hoe het moet.
- omdat we al de gewichtsverschillen in de kolom D hebben, slaan we de berekening van het verschil over., Gebruik voor de toekomstige tabellen deze formule: = “Cell 1” – “Cell 2”.
- klik vervolgens op het tabblad Data in het hoofdmenu.
- Selecteer de Data Analysis tool.
- Scroll naar beneden in de lijst en klik op de optie T-Test: Paired Two Sample for Means.
- klik op OK.
- Er verschijnt een pop-upvenster. Het ziet er zo uit:
- voer het eerste bereik/argument in. In ons voorbeeld is het B2: B6.,
- voer het tweede bereik/argument in. In dit geval is het C2: C6.
- laat de standaard waarde in het Alpha tekstvak (het is 0,05).
- klik op de keuzerondje Uitvoerbereik en kies waar u het resultaat wilt. Als het de A8 cel is, typ dan in: $a$8.
- klik op OK.
- Excel berekent de p-waarde en verschillende andere parameters., De finaletabel zou er zo uit kunnen zien:
zoals u kunt zien, is de one-tail p-waarde hetzelfde als in het eerste geval – 0.133905569. Omdat het boven 0,05 is, is de nulhypothese van toepassing op deze tabel, en het bewijs tegen het is zwak.
wat u moet weten over de p-waarde
Hier zijn enkele nuttige tips voor P-waardeberekeningen in Excel.
- als de p-waarde gelijk is aan 0,05 (5%), zijn de gegevens in uw tabel significant. Als het minder is dan 0,05 (5%), zijn de gegevens die u hebt zeer significant.
- indien de p-waarde groter is dan 0.,1 (10%), de gegevens in uw tabel zijn onbelangrijk. Als het in de 0,05-0,10 bereik is, heb je marginaal significante gegevens.
- u kunt de alfa-waarde wijzigen, hoewel de meest voorkomende opties 0,05 (5%) en 0,10 (10%) zijn.
- het kiezen van twee-tailed testing kan de betere keuze zijn, afhankelijk van uw hypothese. In het bovenstaande voorbeeld, one-tailed testing betekent dat we onderzoeken of de proefpersonen gewicht verloren na een dieet, en dat is precies wat we nodig hadden om uit te vinden. Maar een twee-tailed test zou ook onderzoeken of ze statistisch significante hoeveelheden gewicht gewonnen.,
- de p-waarde kan geen variabelen identificeren. Met andere woorden, als het een correlatie identificeert, kan het de oorzaken erachter niet identificeren.
de P-waarde gedemystificeerd
elke statisticus die zijn of haar zout waard is, moet de ins en outs van nulhypothese testen kennen en wat de p-waarde betekent. Deze kennis zal ook van pas komen voor onderzoekers op vele andere gebieden.