Capítulo5 Boxplot
Neste capítulo você irá aprender a criar boxplots no R utilizando o ggplot2.
5.1 Boxplot (simples)
Utilize o banco de dados iris
, para plotar um diagrama de caixa (boxplot). A função geom_boxplot()
plota uma variável contínua (Sepal.Length) no eixo y em função de uma variável categórica no eixo x (Species). A definição de qual coluna do bando de dados é a x e qual é a y é feita dentro do comendo aes()
.
# Carrgue um banco de dados
data("iris")
# Boxplot
ggplot(iris, aes(y = Sepal.Length, x = Species)) +
geom_boxplot()
5.2 Destque para os outliers
Utilize o argumento outlier.color
para definir a cor dos outliers.
ggplot(iris, aes(y = Sepal.Length, x = Species)) +
geom_boxplot(outlier.color = "red")
Utilize o argumento notch = T
para produzir diagramas de caixa entalhados (notched). Estes diagramas são úteis para inferir de forma aproximada se exite diferença significativa entre as medias dos grupos.
ggplot(iris, aes(y = Sepal.Length, x = Species)) +
geom_boxplot(notch = T)
5.3 Colorindo por categoria
No exemplo abaixo, utilizamos cores diferentes para ilustrar espécies diferentes através do argumento fill = Species
.
# Histograma com cores para diferentes categorias com sobreposição
ggplot(iris, aes(y = Sepal.Length, x = Species, fill = Species)) +
geom_boxplot()
5.4 Histograma (bonito)
Todo o final de capítulo temos a demonstração de um gráfico mais elegante. Veja o capítulo XXX para mais detalhes de como manipular cada detalhe do seu gráfico com o ggplot2, mas ao observar o script abaixo você pode ir aprendendo com cada exemplo.
ggplot(iris, aes(y = Sepal.Length, x = Species, fill = Species)) +
geom_boxplot(show.legend = F, alpha = .5) +
scale_y_continuous(limits = c(4,8), breaks = seq(4,8,1)) +
theme_classic(base_size = 18) +
xlab("Espécie") +
ylab("Comprimento da sépala (mm)")