The Akaike information criterion (AIC) is a mathematical method for evaluating how well a model fits the data it was generated from. Em estatística, AIC é usada para comparar diferentes modelos possíveis e determinar qual é o melhor ajuste para os dados. A AIC é calculada a partir de:

  • o número de variáveis independentes utilizadas para construir o modelo.
  • a estimativa da probabilidade máxima do modelo (a forma como o modelo reproduz os dados).,

o modelo mais adequado de acordo com a AIC é aquele que explica a maior quantidade de variação usando as variáveis independentes menos possíveis.

exemplo
você quer saber se Beber bebidas açucaradas influencia o peso corporal. Recolheu dados secundários de um inquérito nacional de saúde que contém observações sobre o consumo de bebidas açucaradas, idade, sexo e IMC (Índice de massa corporal).,

para descobrir quais dessas variáveis são importantes para prever a relação entre o consumo de bebidas açucaradas e o peso corporal, você cria vários modelos possíveis e compará-los usando AIC.

quando usar AIC

nas estatísticas, AIC é mais frequentemente usado para a seleção de modelos. Calculando e comparando as pontuações AIC de vários modelos possíveis, você pode escolher o que é o melhor ajuste para os dados.,

ao testar uma hipótese, você pode coletar dados sobre variáveis que você não tem certeza sobre, especialmente se você está explorando uma nova ideia. Você quer saber qual das variáveis independentes que você mediu explica a variação na sua variável dependente.

uma boa maneira de descobrir é criar um conjunto de modelos, cada um contendo uma combinação diferente das variáveis independentes que você mediu., Estas combinações devem basear – se em:

  • o seu conhecimento do sistema de estudo-evite utilizar parâmetros que não estão logicamente ligados, uma vez que pode encontrar correlações espúrias entre quase tudo!
  • seu projeto experimental – por exemplo, se você dividiu dois tratamentos entre os sujeitos de teste, então provavelmente não há razão para testar uma interação entre os dois tratamentos.

Uma vez que você criou vários modelos possíveis, você pode usar AIC para compará-los. Escores AIC mais baixos são melhores, e AIC penaliza modelos que usam mais parâmetros., Assim, se dois modelos explicarem a mesma quantidade de variação, o que tiver menos parâmetros terá uma pontuação AIC mais baixa e será o modelo mais adequado.

seleção de Modelo de exemplo
Em um estudo de como horas passei a estudar e formato de testes (múltipla escolha vs. respostas por escrito) afetam as pontuações do teste, você pode criar dois modelos:

  1. Final de pontuação do teste em resposta a horas passei a estudar
  2. Final de pontuação do teste em resposta a horas passei a estudar + formato de teste

Você encontrar um r2 de 0,45, com um valor de p inferior a 0,05 para o modelo 1, e um r2 de 0.,46 com um valor p inferior a 0,05 para o modelo 2. Modelo 2 Se encaixa os dados um pouco melhor-mas valeu a pena adicionar outro parâmetro apenas para obter este pequeno aumento no ajuste do modelo?

Você executa um teste AIC para descobrir, o que mostra que o modelo 1 tem a pontuação AIC mais baixa porque requer menos informação para prever com quase o mesmo nível de precisão. Outra maneira de pensar nisso é que o aumento da precisão no modelo 2 poderia ter acontecido por acaso.

a partir do teste AIC, você decide que o modelo 1 é o melhor modelo para o seu estudo.,

Como comparar modelos usando AIC

AIC determina o relativo o valor da informação da modelo usando o máximo de probabilidade de estimativa e o número de parâmetros (variáveis independentes) no modelo. A fórmula para o AIC é:

K é o número de variáveis independentes utilizadas e L é o de log-probabilidade estimada (uma.k.um. a probabilidade de que o modelo poderia ter produzido o seu observados valores de y)., O K predefinido é sempre 2, por isso se o seu modelo usar uma variável independente o seu K será 3, se usar duas variáveis independentes o seu K será 4, e assim por diante.

para comparar modelos usando AIC, você precisa calcular a AIC de cada modelo. Se um modelo é mais de 2 unidades AIC abaixo do outro, então ele é considerado significativamente melhor do que aquele modelo.

pode facilmente calcular AIC manualmente se tiver a probabilidade logarítmica do seu modelo, mas calcular a probabilidade logarítmica é complicado! A maioria dos softwares estatísticos irá incluir uma função para calcular AIC., Usaremos o R para fazer a análise AIC.

Qual é a sua pontuação de plágio?Compare o seu trabalho com mais de 60 mil milhões de páginas web e 30 milhões de publicações.,

  • o Melhor verificador de plágio de 2020
  • Plágio relatório & porcentagem
  • Maior plágio de banco de dados

Scribbr Verificador de Plágio

AIC em R

Para comparar vários modelos, você pode primeiro criar o conjunto completo de modelos que você deseja comparar e, em seguida, executar o aictab() no set.,

para os dados da bebida açucarada, vamos criar um conjunto de modelos que incluem as três variáveis predictor (idade, sexo e consumo de bebidas) em várias combinações. Baixe o conjunto de dados e execute as linhas de código em R para tentar você mesmo.

baixar o conjunto de dados da amostra

criar os modelos

primeiro, podemos testar como cada variável funciona separadamente.,

age.mod <- lm(bmi ~ age, data = bmi.data)sex.mod <- lm(bmi ~ sex, data = bmi.data)consumption.mod <- lm(bmi ~ consumption, data = bmi.data)

em seguida, nós queremos saber se a combinação de idade e sexo, é melhor descrever a variação no IMC por conta própria, sem, incluindo o consumo de bebidas.

age.sex.mod <- lm(bmi ~ age + sex, data = bmi.data)

Nós também queremos saber se a combinação de idade, o sexo e o consumo de bebidas é melhor descrever a variação no IMC do que qualquer dos modelos anteriores.,

combination.mod <- lm(bmi ~ age + sex + consumption, data = bmi.data)

Finalmente, podemos verificar se a interação de idade, o sexo e o consumo de bebidas pode explicar IMC melhor do que qualquer dos modelos anteriores.

interaction.mod <- lm(bmi ~ age*sex*consumption, data = bmi.data)

Comparar os modelos

Para comparar os modelos e encontrar qual é o melhor ajuste para os dados, você pode colocá-los juntos em uma lista e usar a aictab() comando para comparar todos eles de uma vez. Para usar o aictab (), primeiro carregue a biblioteca aiccmodavg.,

install.packages("AICcmodavg")library(AICcmodavg)

em Seguida, colocar os modelos em uma lista (“modelos”) e o nome de cada um deles para o AIC de mesa seja mais fácil de ler (‘modelo.nome’).

finalmente, execute aictab() para fazer a comparação.

aictab(cand.set = models, modnames = model.names)

a Interpretação dos resultados

O código acima irá produzir a seguinte tabela de saída:

O melhor ajuste do modelo é sempre listado primeiro., A tabela de seleção do modelo inclui informações sobre:

  • K: o número de parâmetros no modelo. O K padrão é 2, então um modelo com um parâmetro terá um K de 2 + 1 = 3.
  • AICc: a Pontuação da Informação do modelo (a minúscula ” c ” indica que o valor foi calculado a partir do teste AIC corrigido para pequenas dimensões da amostra). Quanto menor o valor AIC, melhor o modelo se encaixa.
  • Delta_AICc: a diferença na pontuação AIC entre o melhor modelo e o modelo a ser comparado. Nesta tabela, o próximo melhor modelo tem um delta-AIC de 6.,69 em comparação com o top model, e o terceiro melhor modelo tem um delta-AIC de 15,96 em comparação com o top model.
  • AICcWt: peso AICc, que é a proporção da quantidade total de potência preditiva fornecida pelo conjunto completo de modelos contidos no modelo a ser avaliado. Neste caso, o modelo de topo contém 97% da explicação total que pode ser encontrada no conjunto completo de modelos.Cum.Wt: a soma dos pesos AICc. Aqui os dois modelos de topo contêm 100% do peso cumulativo da AICc.
  • LL: probabilidade logarítmica., Este é o valor que descreve a probabilidade do modelo, dados os dados. A pontuação AIC é calculada a partir do LL e K.

a partir desta tabela podemos ver que o melhor modelo é o modelo combinado – o modelo que inclui todos os parâmetros mas não interações (bmi ~ idade + sexo + consumo).

O modelo é muito melhor do que todos os outros, uma vez que carrega 96% do peso cumulativo do modelo e tem a menor pontuação AIC. O próximo melhor modelo é mais de 2 unidades AIC acima do melhor modelo (6,33 unidades) e carrega apenas 4% do peso cumulativo do modelo.,com base nesta comparação, escolheríamos o modelo de combinação para usar em nossa análise de dados.

relatar os resultados

Se estiver a utilizar a selecção do modelo AIC na sua investigação, pode indicar isto na sua secção de métodos. Informe que você usou a seleção do modelo AIC, explique brevemente o modelo mais adequado que você encontrou, e indique o peso AIC do modelo.,

Example methods
We used AIC model selection to distinguish among a set of possible models describing the relationship between age, sex, sweetened beverage consumption, and body mass index. O modelo mais adequado, com 97% do peso acumulado do modelo, incluía todos os parâmetros sem efeitos de interação.

Depois de encontrar o modelo mais adequado você pode ir em frente e executar o modelo e avaliar os resultados. O resultado da avaliação do seu modelo pode ser relatado na seção de resultados do seu trabalho.,

Perguntas Mais Frequentes sobre AIC

Qual é o critério de informação Akaike?

o critério de informação de Akaike é um teste matemático usado para avaliar quão bem um modelo se encaixa com os dados que ele pretende descrever. Penaliza modelos que usam variáveis mais independentes (parâmetros) como forma de evitar sobreprodução.

AIC é mais frequentemente usado para comparar a bondade relativa entre os diferentes modelos em consideração e então escolher o modelo que melhor se adapta aos dados.o que é um modelo?,

em Estatística, um modelo é a coleção de uma ou mais variáveis independentes e suas interações previstas que os pesquisadores usam para tentar explicar a variação em sua variável dependente.

pode testar um modelo utilizando um teste estatístico. Para comparar quão bem diferentes modelos se encaixam seus dados, você pode usar o critério de Informação da Akaike para a seleção de modelos.

O que se entende por selecção de modelos?,

em estatística, seleção de Modelos é um processo que os pesquisadores usam para comparar o valor relativo de diferentes modelos estatísticos e determinar qual é o melhor ajuste para os dados observados.

o critério de informação Akaike é um dos métodos mais comuns de seleção de modelos. A AIC pondera a capacidade do modelo de prever os dados observados em relação ao número de parâmetros que o modelo requer para atingir esse nível de precisão.

A selecção de modelos AIC pode ajudar os investigadores a encontrar um modelo que explique a variação observada nos seus dados, evitando ao mesmo tempo sobrepor-se.,como é calculada AIC?

o critério de informação Akaike é calculado a partir da log-probabilidade máxima do modelo e do número de parâmetros (K) utilizados para atingir essa probabilidade. A função AIC é 2K-2 (probabilidade logarítmica).

valores AIC mais baixos indicam um modelo mais adequado, e um modelo com um delta-AIC (a diferença entre os dois valores AIC sendo comparados) de mais de -2 é considerado significativamente melhor do que o modelo a que está sendo comparado.

Articles

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *