nollahypoteesi on tarkka selvitys siitä väestöstä, joka yritämme hylkää näytteen tiedot.Emme yleensä usko nollahypoteesiamme (tai H0: tä) todeksi. Tarvitsemme kuitenkin jonkin tarkan lausunnon tilastollisen merkitsevyyden testauksen lähtökohdaksi.
nollahypoteesi Esimerkkejä
Usein -mutta ei aina – nollahypoteesia todetaan, ei ole yhdistyksen tai ero muuttujia tai alaryhmiin., Kuten niin, joitakin tyypillisiä null hypoteesit ovat:
- korrelaatio turhautumista ja aggressiota on nolla (korrelaatio-analyysi);
- keskimääräiset tulot miesten on samanlainen kuin naisten (independent samples t-test);
- Kansalaisuus on (täydellisesti) liity musiikki etusija (khiin neliön riippumattomuus-testiä);
- keskimääräinen väestön tulotaso oli sama vuosien 2012 ja 2016 (toistettujen mittausten ANOVA).
”Null” ei tarkoita ”Nollaa”
yleinen väärinkäsitys on, että ”null” tarkoittaa ”Nollaa”. Näin on usein, mutta ei aina., Esimerkiksi, nollahypoteesi voidaan myös todeta, että korrelaatio turhautumista ja aggresion on 0.5.Ei nolla mukana täällä, ja -vaikka hieman epätavallinen – täysin voimassa.
”null” in ”nolla-hypoteesi” juontuu ”mitätöidä”5: nollahypoteesi on maininta siitä, että yritämme kumota, riippumatta siitä, onko se on ei (ei) määritä nolla vaikutus.
Null Hypoteesitestaus-miten se toimii?
haluan tietää, liittyykö onni vaurauteen hollantilaisten keskuudessa. Yksi tapa selvittää tämä on muodostaa nollahypoteesi., Koska ”sukua” ei ole tarkka, valitsemme nollahypoteesiksemme päinvastaisen väitteen: vaurauden ja onnellisuuden välinen korrelaatio on nolla kaikkien hollantilaisten keskuudessa.Yritämme nyt kumota tämän hypoteesin osoittaaksemme, että onni ja vauraus liittyvät toisiinsa.
Nyt, emme voi kohtuudella kysyä kaikki 17,142,066 hollannin ihmisiä kuinka onnellisia he yleensä tuntevat.
joten kysymme näytteen (vaikkapa 100 ihmistä) varallisuudestaan ja onnellisuudestaan. Onnellisuuden ja varallisuuden välinen korrelaatio osoittautuu otoksessamme 0,25: ksi., Nyt meillä on yksi ongelma: otoksen tulokset poikkeavat jonkin verran populaatiotuloksista. Joten jos korrelaatio todella on nolla väestössämme, saatamme löytää otoksestamme ei-nollakorrelaation. Voit havainnollistaa tätä tärkeää seikkaa vilkaisemalla alla olevaa sirontaa. Se visualisoi nollakorrelaation onnellisuuden ja varallisuuden välillä koko väestölle N = 200.
Nyt me piirtää satunnainen otos N = 20 tästä väestöstä (punaiset pisteet edellisessä scatterplot). Vaikka väestömme korrelaatio on nolla, löysimme huikeat 0.,82 korrelaatio otoksessamme. Alla oleva kuva havainnollistaa tätä jättämällä kaikki muu kuin otokseen valittujen yksiköiden aikaisemmat scatterplot.
Tämä herättää kysymyksen, miten voimme koskaan sanoa mitään väestöstä, jos meillä on vain pieni näyte siitä. Perusvastaus: harvoin voi sanoa mitään 100 prosentin varmuudella. Voimme kuitenkin sanoa paljon 99, 95 tai 90 prosentin varmuudella.
Todennäköisyys
Joten miten se toimii? No, periaatteessa, jotkut näytteen tulokset ovat erittäin epätodennäköisiä, kun otetaan huomioon meidän nollahypoteesi., Kuten niin, alla olevassa kuvassa esitetään todennäköisyydet eri otoskorrelaatioille (N = 100), jos populaatiokorrelaatio todella on nolla.
tietokoneen helposti laskea näitä todennäköisyyksiä. Tämä edellyttää kuitenkin otoksen kokoa (100 meidän tapauksessamme) ja oletettua väestökorrelaatiota ρ (0 meidän tapauksessamme). Siksi tarvitsemme nollahypoteesin.
Jos katsomme tätä näytteenotto jakelu huolellisesti, näemme, että näyte korrelaatiot noin 0 ovat todennäköisesti: ei 0.68 todennäköisyys löytää korrelaatio -0.1 ja 0.1. Mitä se tarkoittaa?, Muista, että todennäköisyydet voidaan nähdä suhteellisina taajuuksina. Kuvitelkaa, että ottaisimme 1000 näytettä sen sijaan, mitä meillä on. Tämä johtaisi 1000 korrelaatiokertoimet ja jotkut 680 niistä -suhteellinen tiheys 0.68 – olisi välillä -0.1 0.1. Samoin on 0.95 (tai 95%) todennäköisyys löytää näyte korrelaatio vuosineljänneksellä -0,2 ja 0,2.
P-arvot
löysimme näytteen korrelaation 0, 25. Kuinka todennäköistä se on, jos väestökorrelaatio on nolla?, Vastaus on tiedossa, koska p-arvo (lyhyt todennäköisyys, arvo):p-arvo on todennäköisyys löytää joitakin näyte tulos tai enemmän äärimmäisiä, jos nollahypoteesi on totta.Koska meidän 0.25 korrelaatio, ”äärimmäisiä” tarkoittaa yleensä suurempi kuin 0,25 tai pienempi kuin -0.25. Emme voi kertoa meidän kaavio, mutta taustalla taulukko kertoo meille, että p ≈ 0,012. Jos nollahypoteesi on totta, on 1,2 prosentin todennäköisyys löytää otoskorrelaatiomme.
johtopäätös?
Jos väestökorrelaatiomme todella on nolla, niin n = 100-otoksesta löytyy otoskorrelaatio 0,25., Todennäköisyys tälle on vain 0,012, joten se on hyvin epätodennäköistä. Järkevä johtopäätös on, että väestökorrelaatiomme ei ollutkaan nolla.
johtopäätös: hylkäämme nollahypoteesin. Kun otetaan huomioon otostuloksemme, emme enää usko, että onnellisuus ja varallisuus eivät liity toisiinsa. Emme voi kuitenkaan sanoa tätä varmuudella.
nollahypoteesi – Rajoitukset
Näin pitkälle, voimme vain päätellä, että väestö korrelaatio ei todennäköisesti ole nolla. Se on ainoa johtopäätös meidän nollahypoteesi lähestymistavasta, eikä se ole kovin mielenkiintoista.,
mitä todella haluamme tietää, on väestökorrelaatio. Otoskorrelaatiomme 0,25 vaikuttaa järkevältä arviota. Kutsumme tällaista yhtä numeroa piste-arvioksi.
nyt uudesta näytteestä saattaa löytyä toisenlainen korrelaatio. Mielenkiintoinen kysymys on, kuinka paljon näytteen korrelaatiomme vaihtelisivat näytteiden suhteen, jos vetäisimme niistä monta. Alla olevassa kuvassa on juuri sitä, oletetaan, että otoksen koko N = 100 ja meidän (piste) arvio 0,25 väestöstä korrelaatio.,
luottamusvälit
– Meidän näyte tulos viittaa siihen, että noin 95% paljon näytteitä pitäisi keksiä korrelaatio 0.06 ja 0,43. Tämä alue tunnetaan luottamusvälinä. Vaikka se ei ole täsmälleen oikea, se on helpoimmin, vaikka kaistanleveys, joka todennäköisesti liittää väestökorrelaation.
Yksi asia on huomata, että kaitselmusväli on melko leveä. Se melkein sisältää nollakorrelaation, juuri sen nollahypoteesin, jonka hylkäsimme aiemmin.,
toinen huomioitava asia on, että näytteenottojakaumamme ja luottamusvälimme ovat hieman epäsymmetriset. Ne ovat symmetrisiä useimmissa muissa tilastoissa (kuten keinoissa tai beetakertoimissa), mutta eivät korrelaatioita.