Introdução ao R e aos comandos básicos do R.
Este arquivo é um documento R Markdown. Ele é uma proposta de prosa com código em R, além de ser o formato preferido nosso de comunicar nossas análises. Quando renderizamos o documento no formato desejado. Todo código que é inserido nele é executado e as saídas são incorporadas no documento final. Isto vale para tabelas e gráficos. Por exemplo, podemos pedir para o R imprimir algo com a função print()
e o resultado será o código que foi executado e o seu resultado.
print("Você executou um código")
[1] "Você executou um código"
O formato R Markdown é muito flexível. Podemos fazer relatórios (em PDF, Word e HTML), apresentações (em PDF, PowerPoint e HTML), artigos acadêmicos, livros, websites1, blogs, CVs, etc.
Com o R conseguimos ler diversos tipo de arquivos de dados: CSV, texto, HTML, Excel, Stata, SPSS, Planilhas Google, Banco de Dados Relacionais, entre outros… Vamos demonstrar como ler arquivos de dados dos dois formatos mais comuns: CSV e Excel.
Para ler um arquivo CSV (.csv
) no R execute a função read.csv()
para arquivos CSV formato americano (vírgula como separador e decimais como ponto) ou a função read.csv2()
para arquivos CSV formato europeu/brasileiro (ponto-e-vírgula como separador e decimais como vírgula). Não esqueça de designar a leitura para uma variável com o designador <-
.
mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1
Para ler um arquivo Excel (.xls
ou .xlsx
) no R é necessário importar um pacote chamado readxl
que contem a função read_excel
. Para importar um pacote no R executamos o comando library()
com um argumento único sendo o nome do pacote. Caso não tenha o pacote instalado, deve instalar ele com o comando install.packages()
. Não esqueça de colocar o nome do pacote entre aspas "nome_do_pacote"
dentro do parênteses da função.
# install.packages("readxl")
library(readxl)
df <- read_excel("datasets/mtcars.xlsx")
head(df)
[90m# A tibble: 6 x 12[39m
...1 mpg cyl disp hp drat wt qsec vs am gear
[3m[90m<chr>[39m[23m [3m[90m<dbl>[39m[23m [3m[90m<dbl>[39m[23m [3m[90m<dbl>[39m[23m [3m[90m<dbl>[39m[23m [3m[90m<dbl>[39m[23m [3m[90m<dbl>[39m[23m [3m[90m<dbl>[39m[23m [3m[90m<dbl>[39m[23m [3m[90m<dbl>[39m[23m [3m[90m<dbl>[39m[23m
[90m1[39m Mazda R… 21 6 160 110 3.9 2.62 16.5 0 1 4
[90m2[39m Mazda R… 21 6 160 110 3.9 2.88 17.0 0 1 4
[90m3[39m Datsun … 22.8 4 108 93 3.85 2.32 18.6 1 1 4
[90m4[39m Hornet … 21.4 6 258 110 3.08 3.22 19.4 1 0 3
[90m5[39m Hornet … 18.7 8 360 175 3.15 3.44 17.0 0 0 3
[90m6[39m Valiant 18.1 6 225 105 2.76 3.46 20.2 1 0 3
[90m# … with 1 more variable: carb [3m[90m<dbl>[90m[23m[39m
Geralmente no R você pode plotar mostrar graficamente diversos objetos com o comando plot()
. Quando você plota um dataset (conjunto de dados lido de um aquivo), o R retorna um gráfico chamado Pair Plot:
Exemplo: na figura 1 veja a relação entre disp
(cilindrada) e hp
(cavalos de potência). Ela é uma relação positiva. Quanto maior disp
maior hp
.
plot(mtcars)
R version 4.0.3 (2020-10-10)
Platform: x86_64-apple-darwin17.0 (64-bit)
Running under: macOS Catalina 10.15.7
Matrix products: default
BLAS: /Library/Frameworks/R.framework/Versions/4.0/Resources/lib/libRblas.dylib
LAPACK: /Library/Frameworks/R.framework/Versions/4.0/Resources/lib/libRlapack.dylib
locale:
[1] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8
attached base packages:
[1] stats graphics grDevices utils datasets methods
[7] base
other attached packages:
[1] readxl_1.3.1
loaded via a namespace (and not attached):
[1] Rcpp_1.0.6 highr_0.8 cellranger_1.1.0
[4] compiler_4.0.3 pillar_1.4.7 tools_4.0.3
[7] digest_0.6.27 downlit_0.2.1 lubridate_1.7.9.2
[10] jsonlite_1.7.2 evaluate_0.14 tibble_3.0.6
[13] lifecycle_0.2.0 lattice_0.20-41 pkgconfig_2.0.3
[16] rlang_0.4.10 Matrix_1.2-18 cli_2.3.0
[19] rstudioapi_0.13 distill_1.2 yaml_2.2.1
[22] xfun_0.21 stringr_1.4.0 xml2_1.3.2
[25] knitr_1.31 generics_0.1.0 vctrs_0.3.6
[28] rprojroot_2.0.2 grid_4.0.3 reticulate_1.18
[31] glue_1.4.2 fansi_0.4.2 rmarkdown_2.6
[34] bookdown_0.21 magrittr_2.0.1 htmltools_0.5.1.1
[37] ellipsis_0.3.1 assertthat_0.2.1 utf8_1.1.4
[40] stringi_1.5.3 crayon_1.4.1
esse website foi todo feito com R↩︎
If you see mistakes or want to suggest changes, please create an issue on the source repository.
Text and figures are licensed under Creative Commons Attribution CC BY-SA 4.0. Source code is available at https://github.com/storopoli/Estatistica, unless otherwise noted. The figures that have been reused from other sources don't fall under this license and can be recognized by a note in their caption: "Figure from ...".
For attribution, please cite this work as
Storopoli & Vils (2021, Jan. 11). Estatística com R: Comandos Básicos de R. Retrieved from https://storopoli.github.io/Estatistica/1-Comandos_Basicos.html
BibTeX citation
@misc{storopoli2021comandosbasicosR, author = {Storopoli, Jose and Vils, Leonardo}, title = {Estatística com R: Comandos Básicos de R}, url = {https://storopoli.github.io/Estatistica/1-Comandos_Basicos.html}, year = {2021} }