Capítulo2 Histogramas
Neste capítulo você irá aprender a criar histogramas no R utilizando o ggplot2.
2.1 Histograma (simples)
Utilize o banco de dados iris
, para plotar a distribuição da variável Sepal.Length em um gráfico de histograma. A função geom_hitogram()
plota uma variável contínua no eixo x e a frequência de cada categoria no eixo y.
# Carrgue um banco de dados
data("iris")
# Histograma de uma variável contínua
ggplot(iris, aes(x = Sepal.Length)) +
geom_histogram()
2.2 Número de classes
Utilize o argumento bins
para definir em quantas classes a variável x deve ser dividida.
# Histograma com 10 classes:
ggplot(iris, aes(x = Sepal.Length)) +
geom_histogram(bins = 10) +
ggtitle("10 classes")
# Histograma com 30 classes:
ggplot(iris, aes(x = Sepal.Length)) +
geom_histogram(bins = 30) +
ggtitle("30 classes")
2.3 Múltiplas categorias
Se você quiser comparar a distribuição de uma variável contínua entre diferentes categorias, você pode utilizar o argumento fill
para colorir o gráfico. No exemplo abaixo, utilizamos cores diferentes para ilustrar a distribuição da variável x entre espécies diferentes (fill = Species)
# Histograma com cores para diferentes categorias com sobreposição
ggplot(iris, aes(x = Sepal.Length, fill = Species)) +
geom_histogram() +
ggtitle("Com sobreposiçao")
# Histograma com cores para diferentes categorias sem sobreposição
ggplot(iris, aes(x = Sepal.Length, fill = Species)) +
geom_histogram(position = "dodge") +
ggtitle("Sem sobreposiçao")
2.4 Histograma (bonito)
Todo o final de capítulo temos a demonstração de um gráfico mais elegante. Veja o capítulo XXX para mais detalhes de como manipular cada detalhe do seu gráfico com o ggplot2, mas ao observar o script abaixo você pode ir aprendendo com cada exemplo.
ggplot(iris, aes(x = Sepal.Length)) +
geom_histogram(color = "white", fill = "lightblue") +
theme_classic(base_size = 18) +
scale_x_continuous(breaks = seq(from = 4,to = 8,by = 1), limits = c(4,8)) +
xlab("Comprimento da sépala (mm)") +
ylab("Frequência")