Akaike information criterion (AIC) er en matematisk metode til at evaluere, hvor godt en model passer til de data, der blev genereret fra. I statistikker bruges AIC til at sammenligne forskellige mulige modeller og bestemme, hvilken der passer bedst til dataene. AIC beregnes ud fra:
- antallet af uafhængige variabler, der bruges til at opbygge modellen.
- den maksimale sandsynlighedsestimat for modellen (hvor godt modellen gengiver dataene).,
den bedst egnede model ifølge AIC er den, der forklarer den største mængde variation ved hjælp af de færrest mulige uafhængige variabler.
Hvornår skal AIC bruges
i statistikker bruges AIC oftest til modelvalg. Ved at beregne og sammenligne AIC-scoringerne fra flere mulige modeller kan du vælge den, der passer bedst til dataene.,
Når du tester en hypotese, kan du indsamle data om variabler, som du ikke er sikker på, især hvis du udforsker en ny ide. Du ønsker at vide, hvilke af de uafhængige variabler, du har målt forklare variationen i din afhængige variabel.
en god måde at finde ud af er at oprette et sæt modeller, der hver indeholder en anden kombination af de uafhængige variabler, du har målt., Disse kombinationer skal baseres på:
- din viden om studiesystemet – undgå at bruge parametre, der ikke er logisk forbundet, da du kan finde falske sammenhænge mellem næsten alt!
- dit eksperimentelle design – for eksempel hvis du har delt to behandlinger op blandt testpersoner, er der sandsynligvis ingen grund til at teste for en interaktion mellem de to behandlinger.
Når du har oprettet flere mulige modeller, kan du bruge AIC til at sammenligne dem. Lavere AIC-score er bedre, og AIC straffer modeller, der bruger flere parametre., Så hvis to modeller forklarer den samme mængde variation, vil den med færre parametre have en lavere AIC-score og vil være den bedre fit-model.
sådan sammenlignes Modeller ved hjælp af AIC
AIC bestemmer den relative informationsværdi for modellen ved hjælp af det maksimale sandsynlighedsestimat og antallet af parametre (uafhængige variabler) i modellen. Formlen for AIC er:
K er antallet af uafhængige variable, der anvendes, og L er log-likelihood estimatet (en.k.en. sandsynligheden for, at den model kunne have produceret din observerede y-værdier)., Standard K er altid 2, så hvis din model bruger en uafhængig variabel din K vil være 3, hvis den bruger to uafhængige variabler, din K vil være 4, og så videre.
for at sammenligne modeller ved hjælp af AIC skal du beregne AIC for hver model. Hvis en model er mere end 2 AIC-enheder lavere end en anden, betragtes den som væsentligt bedre end den model.
Du kan nemt beregne AIC for hånd, hvis du har log-sandsynligheden for din model, men beregning af log-sandsynligheden er kompliceret! De fleste statistiske soft .are vil indeholde en funktion til beregning af AIC., Vi vil bruge R til at køre vores AIC analyse.
AIC i R
for At sammenligne flere modeller, kan du først oprette det fulde sæt af modeller, som du ønsker at sammenligne og derefter køre aictab()
on.,
for de sukkersødede drikkevaredata opretter vi et sæt modeller, der inkluderer de tre forudsigelsesvariabler (alder, køn og drikkevareforbrug) i forskellige kombinationer. Do .nload datasættet og kør linjerne med kode i R for at prøve det selv.
do .nload eksempeldatasættet
Opret modellerne
først kan vi teste, hvordan hver variabel fungerer separat.,
Næste, vi ønsker at vide, hvis kombinationen af alder og køn er bedre til at beskrive variationen i BMI på deres egen, uden at drikke forbrug.
Vi vil også gerne vide, om kombinationen af alder, køn og drikke forbrug, er bedre til at beskrive variationen i BMI end nogen af de tidligere modeller.,
Endelig, vi kan kontrollere, om samspillet mellem alder, køn og drikke forbrug, kan forklare BMI bedre end nogen af de tidligere modeller.
Sammenligne modeller
for At sammenligne disse modeller, og finde ud af, hvilken en der er bedst egnet til de data, kan du sætte dem sammen til en liste og bruge aictab() kommandoen for at sammenligne dem alle på én gang. For at bruge aictab(), først indlæse biblioteket aiccmodavg.,
sæt derefter modellerne på en liste (‘modeller’) og navngiv hver af dem, så AIC-tabellen er lettere at læse (‘model.navn’).
endelig Kør aictab()
for at gøre sammenligningen.
Fortolke resultaterne
ovenstående kode vil give følgende output-tabellen:
Den bedste-fit model er altid først på listen., Modelvalgstabellen indeholder oplysninger om:
- K: antallet af parametre i modellen. Standard K er 2, så en model med en parameter vil have en K på 2 + 1 = 3.
- AICc: modellens informationsresultat (med små bogstaver c angiver, at værdien er beregnet ud fra AIC-testen korrigeret for små stikprøvestørrelser). Jo mindre AIC-værdien er, desto bedre passer modellen.
- Delta_AICc: forskellen i AIC-score mellem den bedste model og den model, der sammenlignes. I denne tabel har den næstbedste model en delta-AIC på 6.,69 sammenlignet med topmodellen, og den tredje bedste model har en delta-AIC på 15,96 sammenlignet med topmodellen.
- AICC :t: AICC-vægt, som er andelen af den samlede mængde forudsigelseseffekt, der leveres af det fulde sæt modeller indeholdt i den model, der vurderes. I dette tilfælde indeholder topmodellen 97% af den samlede forklaring, der findes i det komplette sæt modeller.
- Sperm.Wt: summen af AICc vægte. Her indeholder de to øverste modeller 100% af den kumulative AICC-vægt.
- LL: Log-Sandsynlighed., Dette er den værdi, der beskriver, hvor sandsynligt modellen er i betragtning af dataene. AIC-scoren beregnes ud fra LL og K.
fra denne tabel kan vi se, at den bedste model er kombinationsmodellen – den model, der inkluderer hver parameter, men ingen interaktioner (BMI ~ alder + køn + forbrug).
modellen er meget bedre end alle de andre, da den bærer 96% af den kumulative modelvægt og har den laveste AIC-score. Den næstbedste model er mere end 2 AIC-enheder højere end den bedste model (6.33 enheder) og bærer kun 4% af den kumulative modelvægt.,
baseret på denne sammenligning ville vi vælge den kombinationsmodel, der skal bruges i vores dataanalyse.
rapportering af resultaterne
Hvis du bruger AIC-modelvalg i din forskning, kan du angive dette i afsnittet metoder. Rapporter, at du brugte AIC-modelvalg, forklar kort den bedst egnede model, du fandt, og angiv AIC-vægten af modellen.,
Når du har fundet den bedst egnede model, kan du gå videre og køre modellen og evaluere resultaterne. Resultatet af din modelevaluering kan rapporteres i afsnittet Resultater i dit papir.,
Ofte stillede spørgsmål om AIC
Akaike-informationskriteriet er en matematisk test, der bruges til at evaluere, hvor godt en model passer til de data, den er beregnet til at beskrive. Det straffer modeller, der bruger mere uafhængige variabler (parametre) som en måde at undgå overmontering.
AIC bruges oftest til at sammenligne den relative godhed mellem forskellige modeller, der er under overvejelse, og derefter vælge den model, der bedst passer til dataene.
i statistikker er en model samlingen af en eller flere uafhængige variabler og deres forudsagte interaktioner, som forskere bruger til at forsøge at forklare variation i deres afhængige variabel.
Du kan teste en model ved hjælp af en statistisk test. For at sammenligne, hvor godt forskellige modeller passer til dine data, kan du bruge akaikes informationskriterium til modelvalg.
i statistik er modelvalg en proces, som forskere bruger til at sammenligne den relative værdi af forskellige statistiske modeller og bestemme, hvilken der passer bedst til de observerede data.
Akaike-informationskriteriet er en af de mest almindelige metoder til modelvalg. AIC vægter modellens evne til at forudsige de observerede data mod antallet af parametre, som modellen kræver for at nå dette præcisionsniveau.AIC-modelvalg kan hjælpe forskere med at finde en model, der forklarer den observerede variation i deres data, samtidig med at man undgår overfitting.,
Akaike-informationskriteriet beregnes ud fra den maksimale log-Sandsynlighed for modellen og antallet af parametre (K), der bruges til at nå denne sandsynlighed. AIC-funktionen er 2K-2 (log-Sandsynlighed).
lavere AIC-værdier indikerer en bedre fit-model, og en model med en delta-AIC (forskellen mellem de to AIC-værdier, der sammenlignes) på mere end -2, betragtes som signifikant bedre end den model, den sammenlignes med.