Akaike information criterion (AIC) är en matematisk metod för att utvärdera hur väl en modell som passar de uppgifter som den skapades från. I statistiken används AIC för att jämföra olika möjliga modeller och bestämma vilken som passar bäst för data. AIC beräknas från:
- antalet oberoende variabler som används för att bygga modellen.
- den maximala sannolikheten uppskattning av modellen (hur väl modellen återger data).,
den bäst anpassade modellen enligt AIC är den som förklarar den största variationen med hjälp av minsta möjliga oberoende variabler.
när man ska använda AIC
i statistiken används AIC oftast för modellval. Genom att beräkna och jämföra AIC-poängen för flera möjliga modeller kan du välja den som passar bäst för data.,
När du testar en hypotes kan du samla in data om variabler som du inte är säker på, särskilt om du utforskar en ny idé. Du vill veta vilka av de oberoende variablerna du har mätt förklara variationen i din beroende variabel.
ett bra sätt att ta reda på är att skapa en uppsättning modeller, som var och en innehåller en annan kombination av de oberoende variabler du har mätt., Dessa kombinationer bör baseras på:
- din kunskap om studiesystemet – undvik att använda parametrar som inte är logiskt anslutna, eftersom du kan hitta falska korrelationer mellan nästan vad som helst!
- din experimentella design – till exempel om du har delat upp två behandlingar bland försökspersoner, så finns det förmodligen ingen anledning att testa för en interaktion mellan de två behandlingarna.
När du har skapat flera möjliga modeller kan du använda AIC för att jämföra dem. Lägre AIC poäng är bättre, och AIC straffar modeller som använder fler parametrar., Så om två modeller förklarar samma mängd variation, kommer den med färre parametrar att ha en lägre AIC-poäng och blir den bättre passande modellen.
hur man jämför modeller med AIC
AIC bestämmer modellens relativa informationsvärde med hjälp av den maximala sannolikhetsuppskattningen och antalet parametrar (oberoende variabler) i modellen. Formeln för AIC är:
K är antalet oberoende variabler som används och L är Log-likelihood-uppskattningen (Alias sannolikheten för att modellen kunde ha producerat dina observerade y-värden)., Standard K är alltid 2, Så om din modell använder en oberoende variabel kommer din K att vara 3, om den använder två oberoende variabler kommer din K att vara 4 och så vidare.
för att jämföra modeller med AIC måste du beräkna AIC för varje modell. Om en modell är mer än 2 AIC-enheter lägre än en annan, anses den vara betydligt bättre än den modellen.
Du kan enkelt beräkna AIC för hand om du har log-sannolikheten för din modell, men beräkning log-sannolikheten är komplicerad! De flesta statistiska program kommer att innehålla en funktion för att beräkna AIC., Vi kommer att använda R för att köra vår AIC-analys.
AIC i r
för att jämföra flera modeller kan du först skapa den fullständiga uppsättningen modeller du vill jämföra och sedan köraaictab()
på uppsättningen.,
för de sockerhaltiga dryckesdata skapar vi en uppsättning modeller som inkluderar de tre prediktorvariablerna (ålder, kön och dryckesförbrukning) i olika kombinationer. Ladda ner datauppsättningen och kör kodraderna i R för att prova det själv.
ladda ner provdatauppsättningen
skapa modellerna
först kan vi testa hur varje variabel presterar separat.,
därefter vill vi veta om kombinationen av ålder och kön är bättre på att beskriva variation i BMI på egen hand, utan att inkludera dryckesförbrukning.
vi vill också veta om kombinationen av ålder, kön och dryckesförbrukning är bättre på att beskriva variationen i BMI än någon av de tidigare modellerna.,
slutligen kan vi kontrollera om interaktionen mellan ålder, kön och dryckesförbrukning kan förklara BMI bättre än någon av de tidigare modellerna.
jämför modellerna
för att jämföra dessa modeller och hitta vilken som passar bäst för data, kan du sätta ihop dem i en lista och använda kommandot aictab() för att jämföra dem alla på en gång. För att använda aictab(), ladda först biblioteket AICcmodavg.,
lägg sedan modellerna i en lista (’modeller’) och namnge var och en av dem så att AIC-tabellen är lättare att läsa (’modell.namn’).
kör slutligenaictab()
för att göra jämförelsen.
tolka resultaten
koden ovan kommer att producera följande utdatatabell:
modellen med bästa passform listas alltid först., Tabellen för modellval innehåller information om:
- K: antalet parametrar i modellen. Standard K är 2, Så en modell med en parameter kommer att ha en K på 2 + 1 = 3.
- AICc: modellens informationspoäng (det lägre fallet ” c ” indikerar att värdet har beräknats från AIC-testet korrigerat för små provstorlekar). Ju mindre AIC-värdet desto bättre passar modellen.
- Delta_AICc: skillnaden i AIC-poäng mellan den bästa modellen och modellen som jämförs. I den här tabellen har den näst bästa modellen en delta-AIC på 6.,69 jämfört med toppmodellen, och den tredje bästa modellen har en delta-AIC på 15,96 jämfört med toppmodellen.
- AICcWt: AICc vikt, vilket är andelen av den totala mängden prediktiv effekt som tillhandahålls av den fullständiga uppsättningen modeller som ingår i modellen som bedöms. I det här fallet innehåller toppmodellen 97% av den totala förklaringen som finns i hela uppsättningen modeller.
- Cum.Wt: summan av AICc vikter. Här innehåller de två bästa modellerna 100% av den kumulativa AICc-vikten.
- LL: Log-Sannolikhet., Detta är värdet som beskriver hur sannolikt modellen är, med tanke på data. AIC-poängen beräknas från LL och K.
från den här tabellen kan vi se att den bästa modellen är kombinationsmodellen – modellen som innehåller varje parameter men inga interaktioner (BMI ~ ålder + kön + konsumtion).
modellen är mycket bättre än alla andra, eftersom den bär 96% av den kumulativa modellvikten och har den lägsta AIC-poängen. Den näst bästa modellen är mer än 2 AIC-enheter högre än den bästa modellen (6,33 enheter) och bär endast 4% av den kumulativa modellvikten.,
baserat på denna jämförelse skulle vi välja den kombinationsmodell som ska användas i vår dataanalys.
rapportera resultaten
om du använder AIC-modellval i din forskning kan du ange detta i avsnittet metoder. Rapportera att du använde AIC-modellval, förklara kortfattat den bäst anpassade modellen du hittade och ange modellens AIC-vikt.,
Efter att ha hittat den bäst anpassade modellen kan du gå vidare och köra modellen och utvärdera resultaten. Resultatet av din modellutvärdering kan rapporteras i resultatavsnittet i ditt papper.,
vanliga frågor om AIC
Akaike informationskriteriet är ett matematiskt test som används för att utvärdera hur väl en modell passar de data den är tänkt att beskriva. Det straffar modeller som använder mer oberoende variabler (parametrar) som ett sätt att undvika övermontering.
AIC används oftast för att jämföra den relativa godheten mellan olika modeller som behandlas och sedan välja den modell som bäst passar data.
i statistiken är en modell en samling av en eller flera oberoende variabler och deras förväntade interaktioner som forskare använder för att försöka förklara variation i deras beroende variabel.
Du kan testa en modell med hjälp av ett statistiskt test. För att jämföra hur väl olika modeller passar dina data kan du använda Akaikes informationskriterium för modellval.
i statistiken är modellval en processforskare använder för att jämföra det relativa värdet av olika statistiska modeller och bestämma vilken som passar bäst för de observerade uppgifterna.
Akaike informationskriteriet är en av de vanligaste metoderna för modellval. AIC vikter förmågan hos modellen att förutsäga de observerade data mot antalet parametrar som modellen kräver för att nå den nivån av precision.
AIC-modellval kan hjälpa forskare att hitta en modell som förklarar den observerade variationen i deras data samtidigt som man undviker överfittning.,
Informationskriteriet Akaike beräknas utifrån den maximala log-sannolikheten för modellen och antalet parametrar (K) som används för att nå denna sannolikhet. AIC-funktionen är 2K-2 (log-Sannolikhet).
lägre AIC-värden indikerar en bättre passform, och en modell med en delta-AIC (skillnaden mellan de två AIC-värdena som jämförs) på mer än -2 anses vara betydligt bättre än den modell som den jämförs med.