Capítulo5 Boxplot

Neste capítulo você irá aprender a criar boxplots no R utilizando o ggplot2.

5.1 Boxplot (simples)

Utilize o banco de dados iris, para plotar um diagrama de caixa (boxplot). A função geom_boxplot() plota uma variável contínua (Sepal.Length) no eixo y em função de uma variável categórica no eixo x (Species). A definição de qual coluna do bando de dados é a x e qual é a y é feita dentro do comendo aes().

# Carrgue um banco de dados
data("iris")

# Boxplot
ggplot(iris, aes(y = Sepal.Length, x = Species)) +
  geom_boxplot()

5.2 Destque para os outliers

Utilize o argumento outlier.color para definir a cor dos outliers.

ggplot(iris, aes(y = Sepal.Length, x = Species)) +
  geom_boxplot(outlier.color = "red")

Utilize o argumento notch = T para produzir diagramas de caixa entalhados (notched). Estes diagramas são úteis para inferir de forma aproximada se exite diferença significativa entre as medias dos grupos.

ggplot(iris, aes(y = Sepal.Length, x = Species)) +
  geom_boxplot(notch = T)

5.3 Colorindo por categoria

No exemplo abaixo, utilizamos cores diferentes para ilustrar espécies diferentes através do argumento fill = Species.

# Histograma com cores para diferentes categorias com sobreposição
ggplot(iris, aes(y = Sepal.Length, x = Species, fill = Species)) +
  geom_boxplot() 

5.4 Histograma (bonito)

Todo o final de capítulo temos a demonstração de um gráfico mais elegante. Veja o capítulo XXX para mais detalhes de como manipular cada detalhe do seu gráfico com o ggplot2, mas ao observar o script abaixo você pode ir aprendendo com cada exemplo.

ggplot(iris, aes(y = Sepal.Length, x = Species, fill = Species)) +
  geom_boxplot(show.legend = F, alpha = .5) +
  scale_y_continuous(limits = c(4,8), breaks = seq(4,8,1)) +
  theme_classic(base_size = 18) +
  xlab("Espécie") + 
  ylab("Comprimento da sépala (mm)")