Um histograma é uma espécie de gráfico de barras que demonstra uma distribuição de frequências. No histograma, a base de cada uma das barras representa uma classe e a altura representa a quantidade ou frequência absoluta com que o valor de cada classe ocorre. Ao mesmo tempo, ele pode ser utilizado como um indicador de dispersão de processos. Show Esse é um exemplo de histograma: Quando você precisa apresentar ou tirar conclusões de um grande conjunto de dados e está trabalhando com conceitos envolvendo frequências, sejam absolutas ou relativas, o histograma é o melhor caminho a se tomar. Ele nos auxilia com a representação gráfica dos conjuntos de dados de forma mais amigável, tornando mais fácil a visualização de onde a maioria dos valores se concentram. É útil construir um histograma quando você deseja:
Assim que coletamos os dados, o primeiro passo que vamos dar é obter o melhor entendimento deles, já que nosso cérebro pode ter dificuldade para compreender um extenso conjunto de dados de forma automática. Dessa forma, nossa missão é deixar a visualização dos dados mais inteligível e explícita. É aqui que entra o histograma, pois permitirá a obtenção das seguintes informações sobre o nosso processo:
Os histogramas às vezes são confundidos com gráficos de barras. Um histograma é usado para dados contínuos, em que os intervalos de classe representam a extensão dos dados. Já um gráfico de barra é um gráfico de variáveis categóricas ou discretas. Alguns autores recomendam que os gráficos de barras tenham espaços entre os retângulos para esclarecer a diferença. O objetivo de um histograma é ilustrar como uma determinada amostra de dados ou população está distribuída, dispondo as informações de modo a facilitar a visualização da distribuição dos dados. Ao mesmo tempo, ressalta a localização do valor central e da distribuição dos dados em torno deste valor central. Agora que já vimos o que é um histograma, será que eles serão sempre iguais, de um único tipo? A resposta é não. Temos diferentes tipos de histogramas, e conhecê-los melhor pode fazer com que você ganhe tempo e eficiência na sua análise. Vamos explorar os principais tipos aqui. SimétricoUm histograma simétrico (ou unimodal) centraliza os dados na média (medida central) e possui características por meio da distribuição da média e do desvio padrão. Uma característica do histograma simétrico é conter a partir do centro do gráfico o maior número de dados. Em estatística, este modelo é chamado de normal e permite analisar o quanto outros dados se afastam desse modelo. Distorcido à direitaUm histograma é distorcido à direita quando a distribuição de dados indica a ocorrência de altos valores com baixa frequência. Este modelo também é comumente chamado de modelo com “cauda à direita”, pois ele vai “afinando” conforme percorremos o eixo x, indicando que a frequência vai diminuindo. Portanto, se você se deparar com um gráfico desse tipo, rapidamente vai ser capaz de identificar o comportamento dos dados. Distorcido à esquerdaDessa vez vamos chamar o histograma de distorcido à esquerda quando a frequência dos dados está concentrada nos altos valores, do lado esquerdo, conforme percorremos o eixo x. Podemos, então, também chamá-lo de histograma com “cauda à esquerda”, pelo mesmo motivo anterior, já que à esquerda formamos uma espécie de cauda devido à baixa frequência dos dados no início. Observa-se que há mais informações acima da média devido a falta de simetria. BimodalVamos chamar o histograma de bimodal quando há o aparecimento de dois picos. Dessa forma sabemos que em dois momentos diferentes há uma concentração de frequência que se destaca. MultimodalUm histograma é multimodal quando há o aparecimento de vários picos. Os picos vão nos indicar o maior número de ocorrências. Platô (Achatado)Muito tem se falado atualmente do “efeito platô”. Essa palavra, “platô”, nos remete a um certo tipo de achatamento, de igualdade constante dos dados. Um histograma tem o formato Platô quando suas barras têm praticamente as mesmas alturas. Isto ocorre quando existem várias distribuições juntas com médias diferentes. Para plotarmos um histograma com Python, vamos utilizar a biblioteca Pandas dentro de um notebook no Google Collab. Imprimimos somente o cabeçalho, para facilitar a visualização. Agora, vamos plotar o histograma para visualizar melhor a distribuição dos salários na nossa base de dados, utilizando outra biblioteca do Python conhecida como seaborn. Temos a opção de usar o código sns.histplot para trabalharmos com o histograma. Só de olharmos para a imagem do histograma somos capazes de identificar, rapidamente, que ele é do tipo distorcido à direita ( ou com cauda à direita). Isso nos indica que a maior parte da concentração dos dados está no início da distribuição. Analisando os dados então, temos uma rápida e fácil visualização da concentração dos salários, que estão na sua maioria entre $50.000 e $100.000 dólares anuais. Agora nós conseguimos analisar visualmente o comportamento da distribuição da frequência. Isso vai te ajudar a ganhar tempo e qualidade na análise. Para curiosos(as): Se quiser saber mais sobre esse tema você pode consultar a formação de Estatística com Python: https://cursos.alura.com.br/formacao-estatistica-python E também o curso de Data Analysis: Previsões com Google Sheets: https://cursos.alura.com.br/course/data-analysis-previsoes-google-sheets Para conhecer mais sobre a biblioteca do seaborn para gerar histogramas consulte essa documentação. O que é gráfico populacional?As pirâmides etárias são representações gráficas da estrutura populacional de um lugar dividida por faixa etária e sexo. Os gráficos são formados por barras superpostas e possuem topo, corpo e base. As barras inferiores correspondem à população mais jovem, e as barras superiores correspondem à população mais velha.
Quais são os nomes dos gráficos?Existe uma grande variedade de tipos de gráficos, dentre os quais podemos destacar os de coluna, em barras, pizza, área, linha e rede.. Gráficos de coluna.. Gráficos em barra.. Gráficos em pizza.. Gráficos em linhas.. Gráfico de áreas.. Gráfico em rede.. Como se chama o gráfico onde costuma se representar a estrutura de uma determinada população?Uma Pirâmide Etária é um gráfico que representa a quantidade da população de um determinado território em relação às diferentes faixas etárias, sendo um lado para os habitantes do sexo masculino e o outro representando os habitantes do sexo feminino.
Qual o nome do gráfico que representa os dados sobre a população brasileira?A pirâmide etária da população brasileira indica o perfil demográfico do país, que atualmente é caracterizado como “adulto”.
|