Companion para a disciplina de Estatística Bayesiana para alunos de Mestrado e Doutorado da UNINOVE
A disciplina toda foi gravada e disponibilizada no YouTube na playlist abaixo:
A Estatística Bayesiana é uma abordagem de Estatística inferencial que não usa hipóteses nulas (\(H_0\)) e \(p\)-valores. Se você não sabe o que é um \(p\)-valor, recomendo olhar O que é Estatística Bayesiana. Muitos cientistas e pesquisadores acreditam que sabe o que é um \(p\)-valor, mas sua compreensão é falha e imperfeita, por isso, mesmo que você acredite que saiba o que é um \(p\)-valor, eu ainda recomendo que veja O que é Estatística Bayesiana.
Stan (Carpenter et al., 2017) é uma plataforma para modelagem e computação estatística de alto desempenho. Milhares de usuários contam com Stan para modelagem estatística, análise de dados e previsão nas ciências sociais, biológicas e físicas, engenharia e negócios. Stan tem mais de 3.600 citações no Google Scholar1. Além disso, Stan tem o suporte financeiro da NumFOCUS, uma fundação sem fins lucrativos que dá apoio financeiro à projetos de softwares opensource. Dentre os patrocinadores da NumFOCUS podemos citar AWS Amazon, Bloomberg, Microsoft, IBM, RStudio, Facebook, NVIDIA, Netflix, entre outras.
Os modelos em Stan são especificados pela sua própria linguagem (similar à C++) e são compilados em um arquivo executável que gera inferências estatísticas Bayesiana com amostragem Monte Carlo de correntes Markov (Markov Chain Monte Carlo – MCMC) de alto desempenho. Stan possui interfaces para as seguintes linguagens de programação2:
RStan
e CmdStanR
PyStan
e CmdStanPy
CmdStan
Stan.jl
ScalaStan
MatlabStan
StataStan
MathematicaStan
A linguagem Stan possui uma curva de aprendizagem bem desafiadora, por isso Stan possui um ecossistema de pacotes de interfaces que muitas vezes ajudam e simplificam a sua utilização:
rstanarm
: ajuda o usuário a especificar modelos usando a sintaxe familiar de fórmulas do R.brms
: similar ao rstanarm
pois usa a sintaxe familiar de fórmulas do R, mas dá maior flexibilidade na especificação de modelos mais complexos3.Stan4 usa um amostrador MCMC que utiliza dinâmica Hamiltoniana (Hamiltonian Monte Carlo – HMC) para guiar as propostas de amostragem de novos parâmetros no sentido do gradiente da densidade de probabilidade da posterior. Isto implica em um amostrador mais eficiente e que consegue explorar todo o espaço amostral da posterior com menos iterações; e também mais eficaz que consegue tolerar diferentes geometrias de espaços amostrais da posterior. Em outras palavras, Stan usa técnicas de amostragem avançadas que permite com que modelos complexos Bayesianos atinjam convergência de maneira rápida. No Stan, raramente deve-se ajustar os parâmetros do algoritmo HMC, pois geralmente os parâmetros padrões (out-of-the-box) funcionam muito bem. Assim, o usuário foca no que é importante: a especificação dos componentes probabilísticos do seu modelo Bayesiano.
Este conteúdo possui licença livre para uso (CC BY-SA). Caso queira utilizar o conteúdo para um curso ou estudos, por favor colabore nesse repositório quaisquer aprimorações que foram realizadas. O propósito do conteúdo não é o rigor matemático geralmente adotado em disciplinas e tutoriais de estatística Bayesiana, mas gerar uma forte intuição deixando de lado o rigor matemático e focar no ferramental (primariamente rstanarm
e um pouco de brms
).
Para configurar um ambiente local:
git clone https://github.com/storopoli/Estatistica-Bayesiana.git
cd Estatistica-Bayesiana
Rscript .binder/install.R
Conteúdos Primários:
rstanarm
e brms
Conteúdos Auxiliares:
Não será coberto conteúdos sobre leitura, manipulação e exportação de dados com R. Para isso recomendo fortemente o livro R para Data Science (Figura 2) que pode ser encontrado gratuitamente aqui e possui uma versão impressa em português5.
Clique no ícone abaixo para abrir uma sessão do RStudio no Projeto Binder.
Prof. Dr. José Eduardo Storopoli
Este conteúdo possui licença livre para uso (CC BY-SA). Caso queira utilizar o conteúdo para um curso ou estudos, por favor colabore nesse repositório quaisquer aprimorações que foram realizadas.
Para configurar um ambiente local:
git clone https://github.com/storopoli/Estatistica-Bayesiana.git
cd Estatistica-Bayesiana
Rscript .binder/install.R
Existem alguns conteúdos em português similares que eu indico:
Marco Inácio — Apostila de Stan
Um dos desenvolvedores da equipe do Stan. A apostila está um pouco desatualizada (2018). O foco é o rigor matemático e a linguagem Stan. Muito bem escrita e com bons exemplos.
Ricardo Ehlers (USP) — Inferência Bayesiana (Notas de Aula)
Notas de uma disciplina da USP pelo professor Ricardo Ehlers. O foco é o rigor matemática e as ferramentas utilizadas são desatualizadas (BUGS e JAGS). Também muito bem escrita e com bons exemplos.
Luís Gustavo Esteves, Rafael Izbicki e Rafael Bassi Stern (UFSCar) — Inferência Bayesiana (Notas de Aula)
Notas de uma disciplina da UFSCar pelos professores Luís Gustavo Esteves, Rafael Izbicki e Rafael Bassi Stern. O foco é o rigor matemático, mas o conteúdo é um pouco mais acessível com uma forte introdução à lógica Bayesiana. Fala um pouco da linguagem Stan e sua interface do R (rstan
) no finalzinho.
Para citar o conteúdo use:
Storopoli (2021). Estatística Bayesiana com R e Stan. Disponível em: https://storopoli.github.io/Estatistica-Bayesiana.
Ou em formato BibTeX para LaTeX:
@misc{storopoli2021estatisticabayesianaR,
author = {Storopoli, Jose},
title = {Estatística Bayesiana com R e Stan},
url = {https://storopoli.github.io/Estatistica-Bayesiana},
year = {2021}
}
Este obra está licenciado com uma Licença Creative Commons Atribuição-CompartilhaIgual 4.0 Internacional.
conforme consulta em 14 de Março de 2021.↩︎
estou riscando as linguagens que não são opensource por uma questão de princípios.↩︎
e geralmente a amostragem é um pouco mais rápida que o rstanarm
.↩︎
e consequentemente todas suas interfaces com diversas linguagens de programação e todos os pacotes do seu ecossistema.↩︎
Não temos nada a ver com a Amazon. Caso queira comprar em qualquer outra loja fique à vontade, ou algum sebo… Jeff Bezos nem sabe que eu existo…↩︎
If you see mistakes or want to suggest changes, please create an issue on the source repository.
Text and figures are licensed under Creative Commons Attribution CC BY-SA 4.0. Source code is available at https://github.com/storopoli/Estatistica-Bayesiana, unless otherwise noted. The figures that have been reused from other sources don't fall under this license and can be recognized by a note in their caption: "Figure from ...".
For attribution, please cite this work as
Storopoli (2021, Aug. 1). Estatística Bayesiana com R e Stan. Retrieved from https://storopoli.github.io/Estatistica-Bayesiana
BibTeX citation
@misc{storopoli2021estatisticabayesianaR, author = {Storopoli, Jose}, title = {Estatística Bayesiana com R e Stan}, url = {https://storopoli.github.io/Estatistica-Bayesiana}, year = {2021} }