Estatística Bayesiana com R e Stan

Companion para a disciplina de Estatística Bayesiana para alunos de Mestrado e Doutorado da UNINOVE

Jose Storopoli https://scholar.google.com/citations?user=xGU7H1QAAAAJ&hl=en (UNINOVE)https://www.uninove.br
August 1, 2021

CC BY-SA 4.0

A disciplina toda foi gravada e disponibilizada no YouTube na playlist abaixo:

Bayesian for Everyone!

Figure 1: Bayesian for Everyone!

A Estatística Bayesiana é uma abordagem de Estatística inferencial que não usa hipóteses nulas (\(H_0\)) e \(p\)-valores. Se você não sabe o que é um \(p\)-valor, recomendo olhar O que é Estatística Bayesiana. Muitos cientistas e pesquisadores acreditam que sabe o que é um \(p\)-valor, mas sua compreensão é falha e imperfeita, por isso, mesmo que você acredite que saiba o que é um \(p\)-valor, eu ainda recomendo que veja O que é Estatística Bayesiana.

Stan

Stan (Carpenter et al., 2017) é uma plataforma para modelagem e computação estatística de alto desempenho. Milhares de usuários contam com Stan para modelagem estatística, análise de dados e previsão nas ciências sociais, biológicas e físicas, engenharia e negócios. Stan tem mais de 3.600 citações no Google Scholar1. Além disso, Stan tem o suporte financeiro da NumFOCUS, uma fundação sem fins lucrativos que dá apoio financeiro à projetos de softwares opensource. Dentre os patrocinadores da NumFOCUS podemos citar AWS Amazon, Bloomberg, Microsoft, IBM, RStudio, Facebook, NVIDIA, Netflix, entre outras.

Os modelos em Stan são especificados pela sua própria linguagem (similar à C++) e são compilados em um arquivo executável que gera inferências estatísticas Bayesiana com amostragem Monte Carlo de correntes Markov (Markov Chain Monte Carlo – MCMC) de alto desempenho. Stan possui interfaces para as seguintes linguagens de programação2:

A linguagem Stan possui uma curva de aprendizagem bem desafiadora, por isso Stan possui um ecossistema de pacotes de interfaces que muitas vezes ajudam e simplificam a sua utilização:

Stan4 usa um amostrador MCMC que utiliza dinâmica Hamiltoniana (Hamiltonian Monte Carlo – HMC) para guiar as propostas de amostragem de novos parâmetros no sentido do gradiente da densidade de probabilidade da posterior. Isto implica em um amostrador mais eficiente e que consegue explorar todo o espaço amostral da posterior com menos iterações; e também mais eficaz que consegue tolerar diferentes geometrias de espaços amostrais da posterior. Em outras palavras, Stan usa técnicas de amostragem avançadas que permite com que modelos complexos Bayesianos atinjam convergência de maneira rápida. No Stan, raramente deve-se ajustar os parâmetros do algoritmo HMC, pois geralmente os parâmetros padrões (out-of-the-box) funcionam muito bem. Assim, o usuário foca no que é importante: a especificação dos componentes probabilísticos do seu modelo Bayesiano.

Como usar esse conteúdo?

Este conteúdo possui licença livre para uso (CC BY-SA). Caso queira utilizar o conteúdo para um curso ou estudos, por favor colabore nesse repositório quaisquer aprimorações que foram realizadas. O propósito do conteúdo não é o rigor matemático geralmente adotado em disciplinas e tutoriais de estatística Bayesiana, mas gerar uma forte intuição deixando de lado o rigor matemático e focar no ferramental (primariamente rstanarm e um pouco de brms).

Para configurar um ambiente local:

  1. Clone o repositório do GitHub: git clone https://github.com/storopoli/Estatistica-Bayesiana.git
  2. Acesse o diretório: cd Estatistica-Bayesiana
  3. Instale os pacotes necessários: Rscript .binder/install.R

Aulas

Conteúdos Primários:

  1. Comandos Básicos de R
  2. Distribuições Estatísticas
  3. rstanarm e brms
  4. Priors
  5. Markov Chain Montecarlo (MCMC)
  6. Regressão Linear
  7. Regressão Logística Bayesiana
  8. Regressão de Poisson Bayesiana
  9. Regressão Robusta Bayesiana
  10. Modelos Multiníveis

Conteúdos Auxiliares:

O que esta disciplina não é

Não será coberto conteúdos sobre leitura, manipulação e exportação de dados com R. Para isso recomendo fortemente o livro R para Data Science (Figura 2) que pode ser encontrado gratuitamente aqui e possui uma versão impressa em português5.

R for Data Science

Figure 2: R for Data Science

RStudio na Núvem Gratuito

Clique no ícone abaixo para abrir uma sessão do RStudio no Projeto Binder.

Binder

Professor

Prof. Dr. José Eduardo Storopoli

Como usar esse conteúdo?

Este conteúdo possui licença livre para uso (CC BY-SA). Caso queira utilizar o conteúdo para um curso ou estudos, por favor colabore nesse repositório quaisquer aprimorações que foram realizadas.

Para configurar um ambiente local:

  1. Clone o repositório do GitHub: git clone https://github.com/storopoli/Estatistica-Bayesiana.git
  2. Acesse o diretório: cd Estatistica-Bayesiana
  3. Instale os pacotes necessários: Rscript .binder/install.R

Referências

Livros

Artigos

Básicos

Complementares

Conteúdos Similares

Existem alguns conteúdos em português similares que eu indico:

Como citar esse conteúdo

Para citar o conteúdo use:

Storopoli (2021). Estatística Bayesiana com R e Stan. Disponível em: https://storopoli.github.io/Estatistica-Bayesiana.

Ou em formato BibTeX para LaTeX:

@misc{storopoli2021estatisticabayesianaR,
  author = {Storopoli, Jose},
  title = {Estatística Bayesiana com R e Stan},
  url = {https://storopoli.github.io/Estatistica-Bayesiana},
  year = {2021}
}

Licença

Este obra está licenciado com uma Licença Creative Commons Atribuição-CompartilhaIgual 4.0 Internacional.

CC BY-SA 4.0


  1. conforme consulta em 14 de Março de 2021.↩︎

  2. estou riscando as linguagens que não são opensource por uma questão de princípios.↩︎

  3. e geralmente a amostragem é um pouco mais rápida que o rstanarm.↩︎

  4. e consequentemente todas suas interfaces com diversas linguagens de programação e todos os pacotes do seu ecossistema.↩︎

  5. Não temos nada a ver com a Amazon. Caso queira comprar em qualquer outra loja fique à vontade, ou algum sebo… Jeff Bezos nem sabe que eu existo…↩︎

References

Corrections

If you see mistakes or want to suggest changes, please create an issue on the source repository.

Reuse

Text and figures are licensed under Creative Commons Attribution CC BY-SA 4.0. Source code is available at https://github.com/storopoli/Estatistica-Bayesiana, unless otherwise noted. The figures that have been reused from other sources don't fall under this license and can be recognized by a note in their caption: "Figure from ...".

Citation

For attribution, please cite this work as

Storopoli (2021, Aug. 1). Estatística Bayesiana com R e Stan. Retrieved from https://storopoli.github.io/Estatistica-Bayesiana

BibTeX citation

@misc{storopoli2021estatisticabayesianaR,
  author = {Storopoli, Jose},
  title = {Estatística Bayesiana com R e Stan},
  url = {https://storopoli.github.io/Estatistica-Bayesiana},
  year = {2021}
}