teoria wartości p i hipotezy zerowej może wydawać się na początku skomplikowana, ale zrozumienie pojęć pomoże Ci poruszać się w świecie statystyki. Niestety, terminy te są często nadużywane w nauce popularnej, więc byłoby przydatne dla wszystkich, aby zrozumieć podstawy.
obliczanie wartości p modelu i udowodnienie / obalenie hipotezy zerowej jest zaskakująco proste z MS Excel. Są dwa sposoby, aby to zrobić i zajmiemy się nimi. Wkopmy się.,
hipoteza zerowa i wartość p
hipoteza zerowa jest stwierdzeniem, określanym również jako pozycja domyślna, która twierdzi, że związek między obserwowanymi zjawiskami nie istnieje. Może być również stosowany do skojarzeń między dwiema obserwowanymi grupami. Podczas badań testujesz tę hipotezę i próbujesz ją obalić.
na przykład, powiedzmy, że chcesz obserwować, czy dana dieta fad ma znaczące wyniki. Hipoteza zerowa, w tym przypadku, jest to, że nie ma znaczącej różnicy w masie badanych osób przed i po diecie., Alternatywną hipotezą jest to, że dieta zrobiła różnicę. To właśnie badacze chcieliby udowodnić.
wartość p stanowi szansę, że podsumowanie statystyczne będzie równe lub większe niż wartość obserwowaną, gdy hipoteza zerowa jest prawdziwa dla pewnego modelu statystycznego. Chociaż często jest wyrażana jako liczba dziesiętna, ogólnie lepiej jest wyrazić ją jako procent. Na przykład wartość p wynosząca 0,1 powinna być reprezentowana jako 10%.
niska wartość p oznacza, że dowód przeciwko hipotezie zerowej jest silny. Oznacza to również, że Twoje dane są znaczące., Z drugiej strony, wysoka wartość p oznacza, że nie ma mocnych dowodów przeciwko tej hipotezie. Aby udowodnić, że dieta fad działa, naukowcy musieliby znaleźć niską wartość P.
statystycznie istotny wynik jest taki, który jest bardzo mało prawdopodobny, jeśli hipoteza zerowa jest prawdziwa. Poziom istotności jest oznaczony grecką literą alfa i musi być większy niż wartość p, aby wynik był statystycznie istotny.
wielu badaczy w wielu dziedzinach wykorzystuje wartość p, aby uzyskać lepszy i głębszy wgląd w dane, z którymi pracują., Niektóre z ważnych dziedzin obejmują socjologię, wymiar sprawiedliwości, psychologię, Finanse i ekonomię.
Wyszukiwanie wartości p w programie Excel
wartość p zestawu danych w programie MS Excel można znaleźć za pomocą funkcji t-Test lub za pomocą narzędzia do analizy danych. Najpierw przyjrzymy się funkcji testu T. Zbadamy pięciu studentów, którzy przeszli 30-dniową dietę. Porównamy ich wagę przed i po diecie.
uwaga: do celów tego artykułu użyjemy programu MS Excel 2010. Chociaż nie jest to najnowsza wersja, kroki te powinny mieć zastosowanie również do nowszych wersji.,
funkcja t-Test
wykonaj następujące kroki, aby obliczyć wartość p za pomocą funkcji t-Test.
- Tworzenie i wypełnianie tabeli. Nasza tabela wygląda tak:
- kliknij dowolną komórkę poza tabelą.
- wpisz: = T. Test(.
- po otwartym nawiasie wpisz pierwszy argument. W tym przykładzie jest to kolumna przed dietą. Zakres powinien wynosić B2: B6. Do tej pory funkcja wygląda tak: T. Test (B2: B6.,
- następnie wpisujemy drugi argument. Kolumna po diecie i jej wyniki są naszym drugim argumentem, a zakres, którego potrzebujemy, to C2: C6. Dodajmy go do wzoru: T. Test (B2: B6,C2: C6.
- wpisz przecinek po drugim argumencie, a opcje dystrybucji jednotarczowej i dwuotarczowej pojawią się automatycznie w rozwijanym menu. Wybierzmy pierwszy rozkład z jednym ogonem. Kliknij dwukrotnie.
- wpisz kolejny przecinek.,
- Kliknij dwukrotnie opcję sparowaną w następnym rozwijanym menu.
- teraz, gdy masz wszystkie potrzebne elementy, Zamknij wspornik. Formuła dla tego przykładu wygląda następująco: = T. Test(B2:B6,C2: C6, 1,1)
- naciśnij Enter. Komórka natychmiast wyświetli wartość P. W naszym przypadku wartość wynosi 0,133905569 lub 13,3905569%.
jest wyższa niż 5%, ta wartość p nie zapewnia silnych dowodów przeciwko hipotezie zerowej., W naszym przykładzie badania nie udowodniły, że dieta pomogła osobom badanym schudnąć w znacznym stopniu. To nie musi oznaczać, że hipoteza zerowa jest poprawna, tylko, że nie został jeszcze obalony.
trasa analizy danych
narzędzie do analizy danych pozwala wykonać wiele fajnych rzeczy, w tym obliczenia wartości P. Aby uprościć, użyjemy tej samej tabeli, co w poprzedniej metodzie.
oto jak to się robi.
- ponieważ mamy już różnice wagowe w kolumnie D, pominiemy obliczanie różnicy., Dla przyszłych tabel, użyj tej formuły: = „Komórka 1” – „Komórka 2”.
- następnie kliknij kartę Dane w menu głównym.
- wybierz narzędzie do analizy danych.
- Przewiń listę i kliknij opcję T-Test: sparowane dwie próbki dla opcji Means.
- kliknij OK.
- pojawi się wyskakujące okno. Wygląda to tak:
- podaj pierwszy zakres/argument. W naszym przykładzie jest to B2: B6.,
- podaj drugi zakres/argument. W tym przypadku jest to C2: C6.
- Zostaw domyślną wartość w polu tekstowym Alfa (jest to 0.05).
- kliknij przycisk opcji Output Range i wybierz, gdzie chcesz uzyskać wynik. Jeśli jest to komórka A8, wpisz: $a$8.
- kliknij OK.
- Excel obliczy wartość p i kilka innych parametrów., Tabela końcowa może wyglądać następująco:
Jak widać, wartość P z jednym ogonem jest taka sama jak w pierwszym przypadku-0.133905569. Ponieważ jest powyżej 0,05, hipoteza zerowa ma zastosowanie do tej tabeli, a dowody przeciwko niej jest słaby.
co warto wiedzieć o wartości p
oto kilka przydatnych wskazówek dotyczących obliczeń wartości p w programie Excel.
- Jeśli wartość p jest równa 0,05 (5%), DANE w tabeli są znaczące. Jeśli jest to mniej niż 0,05 (5%), Dane, które posiadasz, są bardzo znaczące.
- w przypadku, gdy wartość p jest większa niż 0.,1 (10%), DANE w tabeli są nieistotne. Jeśli jest w zakresie 0.05 – 0.10, masz marginalnie istotne dane.
- można zmienić wartość alfa, choć najczęściej spotykane opcje to 0.05 (5%) i 0.10 (10%).
- wybór testu dwuogonowego może być lepszym wyborem, w zależności od hipotezy. W powyższym przykładzie, testowanie z jednym ogonem oznacza, że badamy, czy badani schudli po diecie, i to jest dokładnie to, czego potrzebowaliśmy, aby się dowiedzieć. Ale test na dwóch ogonach zbadałby również, czy uzyskali statystycznie istotne ilości wagi.,
- wartość p nie może zidentyfikować zmiennych. Innymi słowy, jeśli identyfikuje korelację, nie może zidentyfikować przyczyn leżących za nią.
wartość P Demystified
każdy statystyk wart swojej soli musi znać tajniki testowania hipotezy zerowej i co oznacza wartość P. Wiedza ta przyda się również badaczom z wielu innych dziedzin.