Akaike information criterion (AIC) on matemaattinen menetelmä, jolla arvioidaan, kuinka hyvin malli sopii aineistoon, että se oli peräisin. Tilastoissa AIC: tä käytetään vertailemaan erilaisia mahdollisia malleja ja määrittämään, mikä niistä sopii parhaiten aineistoon. AIC lasketaan:

  • mallin rakentamiseen käytettyjen riippumattomien muuttujien lukumäärästä.
  • mallin suurin todennäköisyysarvio (kuinka hyvin malli toistaa tiedot).,

-best-fit malli mukaan AIC on yksi, joka kertoo suurimman määrän vaihtelu käyttäen vähiten mahdollista riippumattomia muuttujia.

Esimerkki
haluat tietää, onko juominen sokerilla makeutettujen juomien vaikuttaa kehon paino. Olet kerännyt toissijaisia tietoja kansallisesta terveyskyselystä, joka sisältää havaintoja sokeroitujen juomien kulutuksesta, iästä, sukupuolesta ja BMI: stä (painoindeksi).,

selvittää, mitkä näistä muuttujista ovat tärkeitä ennustaa suhdetta sokerilla makeutettujen juomien kulutus ja painon, voit luoda useita mahdollisia malleja ja verrata niitä käyttäen AIC.

Kun käyttää AIC

tilastot, AIC on useimmiten käytetty malli valinta. Laskemalla ja vertaamalla useiden mahdollisten mallien AIC-pistemääriä voit valita sen, joka sopii parhaiten tietoihin.,

hypoteesia testatessa saattaa kerätä tietoja muuttujista, joista ei ole varmuutta, varsinkin jos tutkii uutta ideaa. Haluat tietää, mitkä mittaamistasi riippumattomista muuttujista selittävät riippuvaisen muuttujan vaihtelun.

hyvä tapa selvittää on luoda joukko malleja, joista jokainen sisältää eri yhdistelmä riippumattomat muuttujat on mitattu., Nämä yhdistelmät olisi perustuttava:

  • Oman tiedon ja tutkimuksen järjestelmä – välttää käyttämällä parametreja, jotka eivät ole loogisesti kytketty, koska voit löytää näennäisiä korrelaatioita lähes mitään!
  • kokeellinen suunnittelu – esimerkiksi, jos sinulla on split kaksi hoitoja kesken koehenkilöt, sitten ei varmaan ole syytä testata, että vuorovaikutus kahden hoitoja.

Kun olet luonut useita mahdollisia malleja, voit käyttää AIC vertailla niitä. Alemmat AIC-pisteet ovat parempia, ja AIC rankaisee malleja, jotka käyttävät enemmän parametreja., Joten, jos kaksi mallia selittää saman määrän vaihtelu, jossa on vähemmän muuttujia on pienempi AIC-pisteet ja on parasta-fit malli.

Mallin valinta esimerkki
tutkimuksessa, miten tunnit opiskelu ja testin muodossa (voit valita useita vaihtoehtoja vs. kirjalliset vastaukset) vaikuttaa testin tulokset, voit luoda kaksi mallia:

  1. Lopullinen testi pisteet vastauksena tuntia opiskeluun
  2. Lopullinen testi pisteet vastauksena tuntia viettänyt opiskelu + testin muodossa

löydät r2 0,45 p-arvo alle 0,05 malli 1 ja r2 0.,46, jonka p-arvo on alle 0,05 mallissa 2. Malli 2 sopii dataan hieman paremmin – mutta kannattiko siihen lisätä toinen parametri vain, jotta tämä pieni lisäys malliin mahtuisi?

suorita AIC testi selvittää, mikä osoittaa, että malli 1 on pienempi AIC-pisteet, koska se vaatii vähemmän tietoja ennustaa lähes saman tason tarkkuus. Toinen tapa ajatella tätä on se, että model 2: n lisääntynyt tarkkuus olisi voinut tapahtua sattumalta.

AIC-testistä päätätte, että malli 1 on paras malli opiskeluun.,

Miten vertailla malleja käyttäen AIC

AIC määrittää suhteellinen tiedon arvon mallia käyttäen suurimman uskottavuuden estimaatti ja parametrien määrä (riippumattomia muuttujia) malli. Kaava AIC on:

K on useita riippumattomia muuttujia käytetään ja L on log-todennäköisyys estimaatti (a.k.a. todennäköisyys, että malli voisi olla tuotetun oman havaittu y-arvot)., Oletuksena K on aina 2, joten jos malli käyttää yksi riippumaton muuttuja K on 3, jos se käyttää kaksi riippumatonta muuttujaa K on 4, ja niin edelleen.

jotta malleja voidaan vertailla AIC: n avulla, on laskettava kunkin mallin AIC. Jos malli on yli 2 AIC-yksikköä pienempi kuin toinen, sitä pidetään huomattavasti tätä mallia parempana.

Voit helposti laskea AIC käsin, jos sinulla on log-todennäköisyys malli, mutta laskettaessa log-todennäköisyys on monimutkainen! Useimmat tilastolliset ohjelmistot sisältävät funktion AIC: n laskemiseksi., Käytämme R: ää tehdäksemme AIC-analyysimme.

Mikä on plagiointia pisteet?

vertaa lehteäsi yli 60 miljardiin verkkosivuun ja 30 miljoonaan julkaisuun.,

  • Paras plagiointi checker 2020 mennessä
  • Plagiointia mietintö & prosenttiosuus
  • Suurin plagiointia tietokantaan

Scribbr Plagiointi Checker

AIC T

verrata useita malleja, voit ensin luoda koko joukko malleja, joita haluat vertailla, ja sitten ajaa aictab() asetettu.,

sokerin makeutettu juoma tiedot, voimme luoda joukon malleja, jotka sisältävät kolme ennustaja muuttujat (ikä, sukupuoli, ja juoma kulutus) erilaisia yhdistelmiä. Lataa dataset ja suorita linjat koodin R kokeilla sitä itse.

Lataa näyte aineisto

Luoda malleja

Ensimmäinen, voimme testata, miten kukin muuttuja suorittaa erikseen.,

age.mod <- lm(bmi ~ age, data = bmi.data)sex.mod <- lm(bmi ~ sex, data = bmi.data)consumption.mod <- lm(bmi ~ consumption, data = bmi.data)

Seuraavaksi haluamme tietää, jos yhdistelmä ikä ja sukupuoli ovat paremmin kuvaavat vaihtelua BMI omasta, ilman lukien juomien kulutus.

age.sex.mod <- lm(bmi ~ age + sex, data = bmi.data)

haluamme myös tietää, onko yhdistelmä ikä, sukupuoli, ja juomien kulutus on paremmin kuvaavat vaihtelua BMI kuin aikaisemmat mallit.,

combination.mod <- lm(bmi ~ age + sex + consumption, data = bmi.data)

Lopuksi, voimme tarkistaa, onko vuorovaikutus ikä, sukupuoli, ja juomien kulutus voi selittää BMI paremmin kuin aikaisemmat mallit.

interaction.mod <- lm(bmi ~ age*sex*consumption, data = bmi.data)

Vertaile malleja

vertailla näitä malleja ja löytää yksi, joka on parhaiten sopii tietojen, voit laittaa ne yhteen luetteloon ja käyttää aictab() komento vertailla niitä kaikkia kerralla. Käytä aictabia () lataamalla ensin kirjasto AICcmodavg.,

install.packages("AICcmodavg")library(AICcmodavg)

Sitten laittaa malleja osaksi luetteloon (”malleja”) ja nimi jokainen niistä niin AIC taulukossa on helpompi lukea (’malli.nimi’).

lopulta juokse aictab() tekemään vertailu.

aictab(cand.set = models, modnames = model.names)

tuloksia Tulkittaessa

yllä Oleva koodi tuottaa seuraavan tulosteen taulukko:

-best-fit malli on aina luettelossa ensimmäisenä., Mallin valinta taulukko sisältää tiedot:

  • K: parametrien määrä mallissa. Oletus K on 2, joten yhden parametrin mallilla K on 2 + 1 = 3.
  • AICc: tieto pisteet-malli (lower-case ” c ” osoittaa, että arvo on laskettu AIC-testi korjattu pieni otoskoko). Mitä pienempi AIC-arvo, sitä parempi malli on.
  • Delta_AICc: AIC-pistemäärän ero parhaan mallin ja vertailtavan mallin välillä. Tässä taulukossa seuraavaksi parhaan mallin delta-AIC on 6.,69 verrattuna huippumalliin, ja kolmanneksi parhaan mallin delta-AIC on huippumalliin verrattuna 15,96.
  • AICcWt: AICc paino, joka on osuus kokonaismäärästä ennusteita esittänyt koko joukko malleja, jotka sisältyvät mallin arvioidaan. Tällöin huippumalli sisältää 97 prosenttia kokonaisselityksestä, joka löytyy koko mallistosta.
  • Cum.Wt: AICc-painojen summa. Tässä kaksi parasta mallia sisältävät 100% kumulatiivisesta AICc-painosta.
  • LL: Log-todennäköisyys., Tämä on arvo, joka kuvaa, kuinka todennäköinen malli on, kun otetaan huomioon tiedot. AIC-pistemäärä lasketaan LL ja K.

tästä taulukosta voimme nähdä, että paras malli on yhdistelmä malli – malli, joka sisältää jokaisen parametrin, mutta ei vuorovaikutus (bmi ~ ikä + sukupuoli + kulutus).

malli on paljon parempi kuin kaikki muut, koska se hoitaa 96% kumulatiivinen malli paino ja on pienin AIC-pisteet. Toiseksi paras malli on enemmän kuin 2 AIC-yksikköä korkeampi kuin paras malli (6.33 yksikköä) ja kuljettaa vain 4% kumulatiivinen malli paino.,

tämän vertailun perusteella valitsisimme yhdistelmämallin käytettäväksi data-analyysissämme.

tulosten raportointi

Jos käytät AIC-mallivalikoimaa tutkimuksessasi, voit ilmoittaa tämän menetelmäosiossa. Ilmoita käyttäneesi AIC-mallivalikoimaa, selitä lyhyesti löytämäsi paras malli ja ilmoita mallin AIC-paino.,

Esimerkki menetelmiä
Me käytetään AIC mallin valinta erotella joukko mahdollisia malleja, jotka kuvaavat suhdetta ikä, sukupuoli, makeutettu juoma kulutus, ja painoindeksi. Best-fit-malli, jossa on 97% kumulatiivisesta mallin painosta, sisälsi jokaisen parametrin, jolla ei ole vuorovaikutusvaikutuksia.

Kun löytää best-fit malli, voit mennä eteenpäin ja suorittaa malli ja arvioida tuloksia. Malliarviointisi tuotokset voi ilmoittaa paperisi tulososiossa.,

Usein kysyttyjä kysymyksiä AIC

Mikä on Akaike tiedot kriteeri?

Akaike tiedot kriteeri on matemaattinen testi, jota käytetään arvioimaan, kuinka hyvin malli sopii aineistoon on tarkoitus kuvata. Se rankaisee malleja, jotka käyttävät enemmän riippumattomia muuttujia (parametrejä) keinona välttää ylisovitus.

AIC on useimmiten käytetty verrata suhteellinen hyvyys-of-fit eri malleja harkitaan ja sitten valita malli, joka parhaiten sopii aineistoon.

Mikä on malli?,

tilastot, malli on kokoelma yhden tai useamman riippumattoman muuttujat ja niiden ennustettu vuorovaikutus, että tutkija käyttää yrittää selittää vaihtelua niiden riippuva muuttuja.

voit testata mallia tilastollisella testillä. Verrata, kuinka hyvin eri mallit sopivat sinun tiedot, voit käyttää Akaike tiedot kriteeri mallin valinta.

mitä mallivalinnalla tarkoitetaan?,

tilastot, malli valinta on prosessi, tutkijat käyttävät vertailla suhteellinen arvo eri tilastollisia malleja ja määrittää, mikä niistä on paras sovi havaittu data.

akaiken informaatiokriteeri on yksi yleisimmistä mallivalintamenetelmistä. AIC painottaa mallin kykyä ennustaa havaitut tiedot suhteessa niiden parametrien määrään, joita malli vaatii saavuttaakseen tämän tarkkuustason.

AIC mallin valinta voi auttaa tutkijoita löytämään malli, joka selittää havaitut erot niiden tietojen välttäen overfitting.,

miten AIC lasketaan?

akaiken informaatiokriteeri lasketaan mallin suurimmasta log-todennäköisyydestä ja tämän todennäköisyyden saavuttamiseen käytettyjen parametrien lukumäärästä (K). AIC-funktio on 2K-2 (log-todennäköisyys).

Pienempi AIC-arvot osoittavat parempaa-fit malli, ja malli delta-AIC (ero AIC-arvot ovat verrattuna) yli -2 pidetään huomattavasti parempi kuin malli se on verrattuna.

Articles

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *