class: center, middle, inverse, title-slide # Estatística ## O que é que eu estou fazendo aqui? ### Jose Storopoli ### Leonardo Vils ###
### 2021-04-01
--- class: animated, fadeIn layout: true --- class: inverse, middle, Center
# Por quê estou aqui? <img src="images/starwars-trap.gif" width="100%" /> --- # Calma! Somos profissionais... -- .pull-left[ * Tentativas de **Homicídio**: 0 * Atentados à **Imagem** e **Honra**: 0 * **Mandatos de Segurança**: 0 ] -- .pull-right[ <img src="images/borat-success.gif" width="100%" /> ] --- class: Large # Princípios -- * **"Dúvidas Idiotas"** * A única dúvida idiota é aquela que não é perguntada... -- * **Acesso ao conteúdo e instrutor** * E-mails, WhatsApp e Conteúdo Aberto -- * **_Peer Instruction_** * Seminários dos Alunos -- * **_Opensource_** * <svg viewBox="0 0 496 512" style="fill:currentColor;position:relative;display:inline-block;top:.1em;height:2em;" xmlns="http://www.w3.org/2000/svg"> <path d="M248 8C111 8 0 119 0 256s111 248 248 248 248-111 248-248S385 8 248 8zm0 448c-110.3 0-200-89.7-200-200S137.7 56 248 56s200 89.7 200 200-89.7 200-200 200zm-80-216c17.7 0 32-14.3 32-32s-14.3-32-32-32-32 14.3-32 32 14.3 32 32 32zm160-64c-17.7 0-32 14.3-32 32s14.3 32 32 32 32-14.3 32-32-14.3-32-32-32zm-80 128c-40.2 0-78 17.7-103.8 48.6-8.5 10.2-7.1 25.3 3.1 33.8 10.2 8.4 25.3 7.1 33.8-3.1 16.6-19.9 41-31.4 66.9-31.4s50.3 11.4 66.9 31.4c8.1 9.7 23.1 11.9 33.8 3.1 10.2-8.5 11.5-23.6 3.1-33.8C326 321.7 288.2 304 248 304z"></path></svg> SPSS, Stata ou Excel <svg viewBox="0 0 496 512" style="fill:currentColor;position:relative;display:inline-block;top:.1em;height:2em;" xmlns="http://www.w3.org/2000/svg"> <path d="M247.6 8C387.4 8 496 115.9 496 256c0 147.2-118.5 248-248.4 248C113.1 504 0 393.2 0 256 0 123.1 104.7 8 247.6 8zM55.8 189.1c-7.4 20.4-11.1 42.7-11.1 66.9 0 110.9 92.1 202.4 203.7 202.4 122.4 0 177.2-101.8 178.5-104.1l-93.4-41.6c-7.7 37.1-41.2 53-68.2 55.4v38.1h-28.8V368c-27.5-.3-52.6-10.2-75.3-29.7l34.1-34.5c31.7 29.4 86.4 31.8 86.4-2.2 0-6.2-2.2-11.2-6.6-15.1-14.2-6-1.8-.1-219.3-97.4zM248.4 52.3c-38.4 0-112.4 8.7-170.5 93l94.8 42.5c10-31.3 40.4-42.9 63.8-44.3v-38.1h28.8v38.1c22.7 1.2 43.4 8.9 62 23L295 199.7c-42.7-29.9-83.5-8-70 11.1 53.4 24.1 43.8 19.8 93 41.6l127.1 56.7c4.1-17.4 6.2-35.1 6.2-53.1 0-57-19.8-105-59.3-143.9-39.3-39.9-87.2-59.8-143.6-59.8z"></path></svg> * <svg viewBox="0 0 496 512" style="fill:currentColor;position:relative;display:inline-block;top:.1em;height:2em;" xmlns="http://www.w3.org/2000/svg"> <path d="M248 8C111 8 0 119 0 256s111 248 248 248 248-111 248-248S385 8 248 8zm0 448c-110.3 0-200-89.7-200-200S137.7 56 248 56s200 89.7 200 200-89.7 200-200 200zm-80-216c17.7 0 32-14.3 32-32s-14.3-32-32-32-32 14.3-32 32 14.3 32 32 32zm160 0c17.7 0 32-14.3 32-32s-14.3-32-32-32-32 14.3-32 32 14.3 32 32 32zm4 72.6c-20.8 25-51.5 39.4-84 39.4s-63.2-14.3-84-39.4c-8.5-10.2-23.7-11.5-33.8-3.1-10.2 8.5-11.5 23.6-3.1 33.8 30 36 74.1 56.6 120.9 56.6s90.9-20.6 120.9-56.6c8.5-10.2 7.1-25.3-3.1-33.8-10.1-8.4-25.3-7.1-33.8 3.1z"></path></svg> JASP, Jamovi, R <svg viewBox="0 0 512 512" style="fill:currentColor;position:relative;display:inline-block;top:.1em;height:2em;" xmlns="http://www.w3.org/2000/svg"> <path d="M505.12019,19.09375c-1.18945-5.53125-6.65819-11-12.207-12.1875C460.716,0,435.507,0,410.40747,0,307.17523,0,245.26909,55.20312,199.05238,128H94.83772c-16.34763.01562-35.55658,11.875-42.88664,26.48438L2.51562,253.29688A28.4,28.4,0,0,0,0,264a24.00867,24.00867,0,0,0,24.00582,24H127.81618l-22.47457,22.46875c-11.36521,11.36133-12.99607,32.25781,0,45.25L156.24582,406.625c11.15623,11.1875,32.15619,13.15625,45.27726,0l22.47457-22.46875V488a24.00867,24.00867,0,0,0,24.00581,24,28.55934,28.55934,0,0,0,10.707-2.51562l98.72834-49.39063c14.62888-7.29687,26.50776-26.5,26.50776-42.85937V312.79688c72.59753-46.3125,128.03493-108.40626,128.03493-211.09376C512.07526,76.5,512.07526,51.29688,505.12019,19.09375ZM384.04033,168A40,40,0,1,1,424.05,128,40.02322,40.02322,0,0,1,384.04033,168Z"></path></svg> --- # Open Science .pull-left[ <img src="images/osf_example.png" width="85%" /> ] .pull-right[ <img src="images/osf_logo.jpeg" width="100%" /> ] .footnote[[Repositório de dados da OSF](https://osf.io/ypbf6/) do artigo: Storopoli, J., da Silva Neto, W. L. B., & Mesch, G. S. (2020). Confidence in social institutions, perceived vulnerability and the adoption of recommended protective behaviors in Brazil during the COVID-19 pandemic. Social Science & Medicine, 265, 113477.] --- class: inverse, middle, center # Como a ciência avança? <img src="images/science.png" width="80%" /> --- # Como a Ciência Avança? **Método Científico Hipótetico Dedutivo**
.footnote[[Wikipedia - Método hipotético-dedutivo](https://pt.wikipedia.org/wiki/Método_hipotético-dedutivo).] --- class: center, middle # Método Científico <video width="600" height="400" controls> <source src="images/feynman.mp4" type="video/mp4"> </video> .footnote[[Richard Feynman](https://en.wikipedia.org/wiki/Richard_Feynman) - Universidade de Cornell, 9 de Novembro de 1964] --- # Teoria vs Realidade .washed-blue.bg-blue.b--navy.ba.bw2.br3.shadow-5.ph4.mt5[ Se sua teoria discordar da realidade, sua teoria está errada. Não importa o quão bela ela é, o quão inteligente você é, quem você é. Se ela discorda da realidade ela está errada! ] .footnote[[Richard Feynman](https://en.wikipedia.org/wiki/Richard_Feynman) - Universidade de Cornell, 9 de Novembro de 1964] --- # Teoria vs Realidade <img src="images/teoria-vs-realidade.jpg" width="100%" /> --- # Teoria vs Realidade .pull-left[ Objetos pesados caem mais rápido que objetos leves. <img src="images/aristotle.png" width="60%" /> ] -- .pull-right[ <img src="images/galileo_pisa.jpg" width="70%" /> ] --- # Teoria vs Realidade .pull-left[ A gravidade afeta não só a materia mas também a luz. <img src="images/einstein.jpg" width="50%" /> ] -- .pull-right[ <img src="images/einstein_eclipse.jpg" width="500" /> ] .footnote[ [Eclipse Solar de 29 de Maio de 1919](https://en.wikipedia.org/wiki/Solar_eclipse_of_May_29,_1919) ] ??? A previsão de Albert Einstein da curvatura da luz pela gravidade do Sol, um dos componentes de sua teoria geral da relatividade, pode ser testada durante um eclipse solar, quando estrelas com posição aparente perto do sol se tornam visíveis. --- # Como que a Ciência Avança? .pull-left[ ### Hierarquia de Evidências * RCT - Ensaio Clínico Randomizado * Estudo de Coorte * Estudo de Caso-controle ] .pull-right[ <div class="figure"> <img src="images/lancet-evidences.png" alt="Lancet, 2017" width="80%" /> <p class="caption">Lancet, 2017</p> </div> ] .footnote[Djulbegovic, B., & Guyatt, G. H. (2017). Progress in evidence-based medicine: a quarter century on. The Lancet, 390(10092), 415-423.] ??? Os **estudos de coorte** são um tipo específico de desenho de estudo observacional que apresenta um nível de evidência maior que os outros observacionais, mas menor nível de evidência que os estudos experimentais. Compara a experiência de um grupo exposto e outro não exposto ao longo do tempo, para a identificação dos efeitos da exposição na incidência do evento de interesse. --- class: inverse, middle # Estatística <img src="images/statistics.jpg" width="80%" /> --- # O que é estatística? -- .pull-left[ **Descritiva**
] -- .pull-right[ **Inferencial**
] --- class: top # Machine Learning vs Estatística -- .pull-left[ **Estatística** <img src="0-Slides-Estatistica_files/figure-html/estatistica-plot-1.png" width="504" /> ] -- .pull-right[ **Machine Learning** <img src="0-Slides-Estatistica_files/figure-html/ml-plot-1.png" width="504" /> ] --- # Distribuições Normais e não-Normais -- .pull-left[ <img src="0-Slides-Estatistica_files/figure-html/dist-normal-1.png" width="504" /> ] -- .pull-right[ <img src="0-Slides-Estatistica_files/figure-html/dist-not-normal-1.png" width="504" /> ] --- # Pressupostos vs Realidade <img src="images/assumptions-vs-reality.jpeg" width="100%" /> .footnote[Figura de [Katherine Hoffman](https://www.khstats.com/blog/tmle/tutorial/). Reprodução Autorizada.] ??? **Katherine Hoffman**: Biostatistician at Weill Cornell Medicine in New York City --- class: inverse, middle, center # Estatística Descritiva <svg viewBox="0 0 544 512" style="fill:currentColor;position:relative;display:inline-block;top:.1em;height:5em;" xmlns="http://www.w3.org/2000/svg"> <path d="M527.79 288H290.5l158.03 158.03c6.04 6.04 15.98 6.53 22.19.68 38.7-36.46 65.32-85.61 73.13-140.86 1.34-9.46-6.51-17.85-16.06-17.85zm-15.83-64.8C503.72 103.74 408.26 8.28 288.8.04 279.68-.59 272 7.1 272 16.24V240h223.77c9.14 0 16.82-7.68 16.19-16.8zM224 288V50.71c0-9.55-8.39-17.4-17.84-16.06C86.99 51.49-4.1 155.6.14 280.37 4.5 408.51 114.83 513.59 243.03 511.98c50.4-.63 96.97-16.87 135.26-44.03 7.9-5.6 8.42-17.23 1.57-24.08L224 288z"></path></svg> --- # Estatística Descritiva .washed-blue.bg-blue.b--navy.ba.bw2.br3.shadow-5.ph4.mt5[ "Sumariza e quantifica as características de uma amostra de dados observados". ] -- ## Geralmente divide-se em: * **Medidas de Centralidade**: média, mediana, moda ... * **Medidas de Dispersão**: desvio padrão, variância, correlação, percentis, quartis ... --- class: middle # Medidas de Centralidade .pull-left[ ### Média ### Mediana ### Moda ] .pull-right[ <img src="images/media_mediana_moda.png" width="75%" /> ] --- # Média vs Mediana .washed-blue.bg-blue.b--navy.ba.bw2.br3.shadow-5.ph4.mt5[ O que acontece quando o <u>Bill Gates</u> entra em um restaurante? ] -- .washed-blue.bg-red.b--dark-red.ba.bw2.br3.shadow-5.ph4.mt5[ A <u>média salarial</u> dos consumidores do restaurante sobe 50 mil dólares! ] --- # Medidas de Dispersão ## Desvio Padrão .pull-left[ É importante porque, **em uma distribuição normal**, os intervalos contém um percentual da população * `\(\mu \pm 1 \times \sigma \approx 68\%\)` * `\(\mu \pm 2 \times \sigma \approx 95\%\)` * `\(\mu \pm 3 \times \sigma \approx 99.7\%\)` ] .pull-right[ <img src="images/desvio_padrao.png" width="100%" /> ] --- # Medidas de Dispersão - Percentil e IQR <img src="images/percentil-IQR.png" width="50%" style="display: block; margin: auto;" /> --- class: inverse, middle, center # Estatística Inferencial <svg viewBox="0 0 512 512" style="fill:currentColor;position:relative;display:inline-block;top:.1em;height:5em;" xmlns="http://www.w3.org/2000/svg"> <path d="M496 384H64V80c0-8.84-7.16-16-16-16H16C7.16 64 0 71.16 0 80v336c0 17.67 14.33 32 32 32h464c8.84 0 16-7.16 16-16v-32c0-8.84-7.16-16-16-16zM464 96H345.94c-21.38 0-32.09 25.85-16.97 40.97l32.4 32.4L288 242.75l-73.37-73.37c-12.5-12.5-32.76-12.5-45.25 0l-68.69 68.69c-6.25 6.25-6.25 16.38 0 22.63l22.62 22.62c6.25 6.25 16.38 6.25 22.63 0L192 237.25l73.37 73.37c12.5 12.5 32.76 12.5 45.25 0l96-96 32.4 32.4c15.12 15.12 40.97 4.41 40.97-16.97V112c.01-8.84-7.15-16-15.99-16z"></path></svg> --- # Estatística Inferencial "Conjunto de técnicas e procedimentos para testar hipóteses sobre uma amostra generalizando para uma população-alvo" ## Mistureba de coisas -- * **Testes Estatísticos** - Pearson & Student -- * `\(p\)`-**valor** - Fisher -- * **Hipótese Nula** (inclusive o tal dos 5%) - Neyman -- * **Intervalos de Confiança** - Neyman .footnote[Além disso eles brigavam entre si...] --- class: inverse, center, middle <img src="0-Slides-Estatistica_files/figure-html/statisticians-1.png" width="504" /> .footnote[Figuras da [.white[Wikipedia]](https://www.wikipedia.org/).] --- # Teste de Hipóteses .washed-blue.bg-blue.b--navy.ba.bw2.br3.shadow-5.ph4.mt5[ Forma de <u>inferência estatística</u> que usa dados de uma <u>amostra</u> para tirar conclusões sobre um <u>parâmetro populacional</u> ou uma <u>distribuição de probabilidade populacional</u>. ] -- .washed-blue.bg-red.b--dark-red.ba.bw2.br3.shadow-5.ph4.mt5[ .small[Exemplo: Uma amostra de 40 pessoas separadas de maneira aleatória em dois grupos na qual testamos qual a <u>diferença</u> entre o tempo de internação na UTI (<u>parâmetro populacional</u>) para quem toma cloroquina (tratamento) ou comprimido de farinha (placebo). ] ] --- # Hipótese Nula - `\(H_0\)` .washed-blue.bg-blue.b--navy.ba.bw2.br3.shadow-5.ph4.mt5[ Uma hipótese padrão de que uma quantidade a ser medida é **zero** (nula). Normalmente, a quantidade a ser medida é a **diferença entre duas situações**, ou que um **efeito é inexistente** (nulo). ] --- class:center, middle <img src="images/stats-philosophy.png" width="80%" /> ??? * Hospital Mata * Bombeiro faz Fogo * Brancos são mais inteligentes --- # Quando é que as coisas dão errado? -- * **Amostra não representa a população** -- * Ex: Pesquisa de Intenção de Voto apenas na Avenida Paulista ao meio-dia. -- * **Os dados não são independentes** -- * Ex: Dois sujeitos conhecidos são abordados ao mesmo tempo numa pesquisa de intenção de voto. -- * **Principais fontes de dependência?** * Temporal * Espacial * E qualquer outra 🤷 --- class: inverse, middle, center # `\(p\)`-valor <svg viewBox="0 0 576 512" style="fill:currentColor;position:relative;display:inline-block;top:.1em;height:5em;" xmlns="http://www.w3.org/2000/svg"> <path d="M569.517 440.013C587.975 472.007 564.806 512 527.94 512H48.054c-36.937 0-59.999-40.055-41.577-71.987L246.423 23.985c18.467-32.009 64.72-31.951 83.154 0l239.94 416.028zM288 354c-25.405 0-46 20.595-46 46s20.595 46 46 46 46-20.595 46-46-20.595-46-46-46zm-43.673-165.346l7.418 136c.347 6.364 5.609 11.346 11.982 11.346h48.546c6.373 0 11.635-4.982 11.982-11.346l7.418-136c.375-6.874-5.098-12.654-11.982-12.654h-63.383c-6.884 0-12.356 5.78-11.981 12.654z"></path></svg> ## `\(p\)`-valores são de difícil entendimento, `\(p<0.05\)`. --- # O que é o `\(p\)`-valor? * `\(p\)`-valor é a probabilidade dos dados que você obteve condicionado que a hipótese nula é verdadeira. -- * No mundo paralelo da Hipótese Nula, `\(p\)`-valor é a probabilidade de você obter dados como os quais da sua amostra. -- * Para os que gostam do formalismo matemático: `$$p = P(D|H_0).$$` --- # O que *não* é o `\(p\)`-valor? -- * `\(p\)`-valor **não** é a probabilidade da Hipótese nula: `\(P(D|H_0) \neq P(H_0|D)\)`. Exemplo: `$$P(\text{tosse} | \text{COVID}) \neq P(\text{COVID} | \text{tosse}).$$` -- * `\(p\)`-valor **não** é a probabilidade dos dados serem produzidos pelo acaso. -- * `\(p\)`-valor **não** mensura o tamanho do efeito de um teste estatístico. --- # Tamanho do Efeito .pull-left[ Todos esses resultados atingem `\(p\)`-valores menores que 5% se conseguirmos uma amostra grande o suficiente ] .pull-right[ <img src="0-Slides-Estatistica_files/figure-html/plot_effectsize-1.png" width="504" /> ] --- class: Large # Como fazer um seminário? -- 1. O que é o **método/técnica**? -- 2. **Quando** usar? O que está sendo **"testado"**? * Hipótese nula `\(H_0\)`? -- 3. Como **interpretar os resultados**? -- 4. Quais os **pressupostos** do método/técnica? -- 5. **Parte Prática** * Como aplicar o método no JASP * Dados reais --- # Linguagem é importante $$Y = \beta_0 + \beta_1 X_1 + \dots + \beta_n X_n + \epsilon $$ onde `\(\mathbf{E}(\epsilon | X) = 0\)` e `\(\mathbf{V}(\epsilon | X) = \sigma^2\)` -- .washed-blue.bg-blue.b--navy.ba.bw2.br3.shadow-5.ph4.mt5[ Regressão Linear é uma técnica para estimar coeficientes de associação `\(\beta\)` entre um conjunto de variáveis independentes `\(X\)` e uma variável dependente `\(Y\)` e os erros `\(\epsilon\)` do modelo pressupõem-se que possui média `\(\mu\)` 0 e desvio padrão qualquer `\(\sigma^2\)` ] --- class: inverse, center, middle <img src="0-Slides-Estatistica_files/figure-html/complex-jargon-1.png" width="504" /> .footnote[ Oppenheimer, D. M. (2006). Consequences of erudite vernacular utilized irrespective of necessity: Problems with using long words needlessly. Applied Cognitive Psychology, 20(2), 139–156. https://doi.org/10.1002/acp.1178 ] --- ### O que são modelos e por quê precisamos deles?
.footnote[**Uma boa referência**: Smaldino, P. E. (2017). Models Are Stupid, and We Need More of Them. In Computational Social Psychology (Issue March, pp. 311–331). Routledge. https://doi.org/10.4324/9781315173726-14] --- # Vamos formar os grupos? .pull-left[ ![](images/trab-grupo.gif)<!-- --> ] .pull-right[ Acesse [http://bit.ly/s2estatistica](http://bit.ly/s2estatistica) * Email * Nome * RA * Linha de Pesquisa ]
02
:
00
.footnote[Se você cair em um grupo que não goste, culpe o script R e a seed do gerador de números aleatórios. Coisas ruins acontecem, você pode escolher se isso vai ser uma oportunidade de crescimento ou não...] --- # Créditos! Slides criado pelo pacote R [`xaringan`](https://github.com/yihui/xaringan). Código Fonte dos Slides disponível no GitHub [storopoli/Estatistica](https://github.com/storopoli/Estatistica). .pull-left[ <img src="images/UNINOVE_CIS.png" width="173" /> ] .pull-right[ <img src="images/UNINOVE_PPGA.png" width="173" /> ] [![CC BY-SA 4.0][cc-by-sa-image]][cc-by-sa] [cc-by-sa]: http://creativecommons.org/licenses/by-sa/4.0/ [cc-by-sa-image]: https://licensebuttons.net/l/by-sa/4.0/88x31.png [cc-by-sa-shield]: https://img.shields.io/badge/License-CC%20BY--SA%204.0-lightgrey.svg