Box Plot - O que é, definição e conceito - 2021

Índice:

Box Plot - O que é, definição e conceito - 2021
Box Plot - O que é, definição e conceito - 2021
Anonim

Um boxplot, do inglês, boxplot, é uma representação de uma variável quantitativa ou categórica com o propósito de identificar rapidamente os quartis do conjunto de dados.

Em outras palavras, um boxplot é um gráfico que representa uma variável quantitativa ou qualitativa por meio dos quartis.

Em estatística, é uma ferramenta útil para representar conjuntos de dados discretos e contínuos.

É importante ter em mente que as variáveis ​​de variáveis ​​qualitativas ou que se destinam a representar uma ordem ou uma categoria devem estar sempre associadas a um índice numérico maior que 0 para que possam aparecer no gráfico e possam ser calculadas as estatísticas correspondentes.

Gráfico de caixa e histograma

Um gráfico de caixa nada mais é do que um histograma visto de cima e, da mesma forma, um histograma é um gráfico de caixa visto de lado. Um exemplo pode ser visto a seguir.

A primeira característica que ambos os gráficos compartilham é o mínimo e o máximo do conjunto de dados. As barras finais após os travessões indicam o mínimo (barra inferior) e máximo (barra superior). Outliers seriam representados fora do intervalo de máximo e mínimo. Ou seja, além das barras após os hífens. Também podemos encontrar boxplots horizontais.

À primeira vista, você pode ver que a maioria dos dados está centrada nas observações perto do mínimo em ambos os gráficos. Isso é indicado pelo gráfico de caixa em que a caixa está mais próxima do mínimo do que do máximo. Se olharmos para o histograma, veremos que as observações mais frequentes são as que estão próximas do mínimo e longe do máximo.

Informação do box plot

As informações fornecidas pelo box plot são as seguintes:

  1. A parte inferior da caixa é o primeiro quartil (Q1).
  2. A barra no meio da caixa é a mediana ou segundo quartil (Q2).
  3. O topo da caixa é o terceiro quartil (Q3).
  4. O intervalo interquartil ou IQR seria a altura da caixa, ou seja, a diferença entre Q3 e Q1.

Chave do box plot

Esta representação gráfica é chamada de box plot porque se parece com uma caixa. Portanto, para nos lembrarmos desse gráfico, teríamos apenas que pensar em um objeto quadrado ou uma caixa.

Para os leitores que estão familiarizados com o preço dos ativos financeiros, eles verão mais semelhanças com uma vela. As velas que você vê na cotação são diagramas de caixa ajustados para a janela de tempo escolhida.

Vantagens e desvantagens do box plot

Entre as vantagens e desvantagens deste diagrama, encontramos o seguinte:

Vantagem

  • Visão globalizada da frequência absoluta de uma variável quantitativa ou qualitativa.
  • Conhecimento do mínimo, máximo e quartis do conjunto de dados sem ter que calculá-los.
  • Reconhecimento de valores extremos mais rápido do que com um histograma porque os valores extremos são indicados com círculos fora do máximo e mínimo.

Desvantagens

  • Se o conjunto de dados for pequeno, fazer um gráfico de caixa para expressar esses dados tornará mais difícil de entender.

Exemplo de box plot

Supomos que queremos representar o número de ciclistas que passam por nossa casa ao longo de um ano. Primeiro, contamos os ciclistas e coletamos as informações em uma tabela.

Através de alguns programas como R ou Excel podemos gerar o gráfico mostrado a seguir.

Graças a representar o número de ciclistas através do box plot, podemos rapidamente intuir onde está a mediana, os outros quartis, o máximo e o mínimo. Neste caso não temos dados atípicos, pois além do máximo e mínimo não há nada.

A aplicação deste tipo de gráfico é muito comum devido à sua simplicidade e utilidade em muitas áreas além de finanças e economia.