2.2.4. Histograma
Histogramas são diagramas de freqüência para um conjunto de dados, onde o eixo das abscissas ou eixo horizontal ou eixo dos X representa o conjunto dos possíveis valores ou faixas (classes) de valores de uma variável. No eixo das ordenadas ou eixo vertical ou eixo dos Y temos a informação de freqüência dos valores desta variável.
As formas mais populares de histogramas são os representativos de gaussianas ou curvas normais e possuem um formato característico de sino. Histogramas normalmente utilizam agrupamento de dados para compor as suas faixas ou classes.
Os histogramas em si são apenas representações gráficas do comportamento de uma variável, mas podem auxiliar na interpretação deste comportamento. Através destes gráficos fica imediata a identificação do valor da moda ou da classe moda da amostra ou população.
Medidas de simetria como skewness e medidas achatamento como kurtosis também são informações visíveis em um histograma.
Outra informação bastante útil dos histogramas está no uso das freqüências acumuladas, que originam as funções de densidade de probabilidade.
2.2.4.1. Comando Histograma
Acesso:
- Menu - Metrixus | Histograma
- Barra de ferramentas Metrixus
Descrição:
Monta um gráfico do tipo histograma para o intervalo de células marcado. Permite cálculos amostrais (n-1) ou populacionais (n) e ainda a inclusão de indicadores de médias e desvio padrão para cada faixa do histograma. Através da opção de normalização, é possível criar histogramas para modelagem da função de densidade de probabilidade. Este comando gera um novo arquivo contendo os resultados.
A região ou intervalo de dados deve ser uma região contígua e com pelo menos dois campos numéricos. Campos com formato texto ou vazios são desconsiderados. O intervalo de dados deve ser selecionado antes de chamar este comando.
O número máximo de faixas para o histograma depende do total de dados, não ultrapassando 50 faixas (ou classes). O padrão são 15 classes ou metade do número de dados, o que for menor.
Histogramas são utilizados para representar dados graficamente, mas quando estes dados são preços ou cotações de um ativo financeiro, é interessante plotar o histograma dos retornos destes ativos. Hipóteses sobre tipo de distribuição do retorno de um ativo são baseadas nestes histogramas, daí sua utilidade. A partir da opção de Gerar histograma dos retornos para cotações, todos os dados analisados são considerados cotações de ativos e transformados em retornos ao longo do tempo, devendo os dados, portanto, estarem ordenados no tempo.
Importante:
No caso do histograma dos retornos, para a determinação dos parâmetros estatísticos dos dados - como média e desvio padrão - não é aplicado nenhum operador logarítmico ao retorno das cotações. Desta forma, a média apresentada deve ser entendida como a esperança dos retornos e não o retorno médio, bem como o desvio padrão deve ser entendido como a volatilidade da esperança dos retornos!
|
Importante:
Ainda para histograma dos retornos, os dados devem estar ordenados. Caso haja mais de uma coluna no intervalo de células, os dados devem estar ordenados dentro das linhas e das colunas. Qualquer dado na coluna A vem antes de qualquer dado na coluna B! Dados na linha 1 da coluna A vem antes de dados na linha 2 da coluna A!
|
A geração de gráficos e planilhas sem cores permite uma impressão fácil dos dados além de representar ganhos de performance de execução.
O resultado da geração de um histograma é uma nova planilha com dados estáticos, isto é, sem vínculos com a base dados que originou o resultado. Nesta nova planilha há as seguintes informações, onde n é o total de dados válidos (ou total de dados –1 para o histograma dos retornos):
- Média: média dos dados.

- Mediana: valor central dos dados. Se houver dois valores centrais, indica a média aritmética destes valores.
- Moda: valor médio da faixa ou classe com maior freqüência ou ocorrências. Se houver mais de uma moda, informa vazio.
- Máximo: valor máximo dos dados.
- Mínimo: valor mínimo dos dados. Texto e células em branco são desconsiderados.
- DP: desvio padrão dos dados. Se houver apenas um dado na faixa, informa vazio.
- População:

- Amostra:

- Skewness: medida de simetria dos dados. Resumidamente, uma medida negativa indica dados deslocados para a direita e uma medida positiva indica dados deslocados para a esquerda. Se n for menor do que 3, informa vazio.
- População:

- Amostra:

- Exc. Kurt.: medida de achatamento dos dados em relação à curva normal (kurtosis=0). Também chamada de excesso de kurtosis. Resumidamente, uma medida negativa indica achatamento em relação à normal e uma medida positiva indica picos em relação à normal. Se n for menor do que 4, informa vazio.
- População:

- Amostra:

A opção de normalização do histograma resulta em um segundo histograma onde a freqüência de cada faixa ou classe é dividida pelo total de dados e pela largura das faixas. Desta forma, obtém-se um histograma com área (integral) total igual a 1. Uma linha de freqüência acumulada também é mostrada e, em função da normalização, corresponde à função densidade de probabilidade acumulada. Embora seja menos intuitivo representar a normalizações do histograma desta forma ao invés de percentuais ou proporções em cada faixa, esta normalização é a indicada para desenhar funções de densidade de probabilidade.
A opção de indicadores para faixas acrescenta ao histograma uma linha que representa o desvio padrão de cada faixa, permitindo analisar a dispersão dos dados dentro das classes.
Exemplo de utilização com dados:
Histograma de dados – parâmetros:
- Intervalo de dados D7:M16 (100 dados)
- Faixas (ou classes) 15
- Amostra
- Incluir indicadores estatísticos
- Apresentar normalização
- Gráficos coloridos
- Dados
| 7,92713 | 6,71029 | 10,25132 | 12,07287 | 9,22936 | 9,74868 | 8,65102 | 10,77064 | 11,34898 | 13,28971 |
| 8,01109 | 6,89046 | 10,30194 | 12,16064 | 9,28308 | 9,79913 | 8,71331 | 10,82493 | 11,41260 | 13,50137 |
| 8,09167 | 7,04842 | 10,35275 | 12,25278 | 9,33629 | 9,84946 | 8,77437 | 10,87983 | 11,47769 | 13,76158 |
| 7,83936 | 6,49863 | 10,20087 | 11,98891 | 9,17507 | 9,69806 | 8,58740 | 10,71692 | 11,28669 | 13,10954 |
| 8,24421 | 7,31849 | 10,45509 | 12,45306 | 9,44136 | 9,94986 | 8,89323 | 10,99170 | 11,61284 | 14,65268 |
| 7,74722 | 6,23842 | 10,15054 | 11,90833 | 9,12017 | 9,64725 | 8,52231 | 10,66371 | 11,22563 | 12,95158 |
| 8,16927 | 7,18985 | 10,40379 | 12,34998 | 9,38904 | 9,89969 | 8,83432 | 10,93540 | 11,54439 | 14,10750 |
| 7,54694 | 5,34732 | 10,05014 | 11,75579 | 9,00830 | 9,54491 | 8,38716 | 10,55864 | 11,10677 | 12,68151 |
| 8,31676 | 7,43690 | 10,50669 | 12,56310 | 9,49331 | 10,00000 | 8,95120 | 11,04880 | 11,68324 | 6,71029 |
| 7,65002 | 5,89250 | 10,10031 | 11,83073 | 9,06460 | 9,59621 | 8,45561 | 10,61096 | 11,16568 | 12,81015 |
Resultados:
| Amostra | 100 |
| Média | 9,967 |
| Mediana | 9,975 |
| Moda | 10,000 |
| Máximo | 14,653 |
| Mínimo | 5,347 |
| DP | 1,949 |
| Skewness | 0,002 |
| Exc. Kurt. | -0,363 |
|
| Faixas | <= Inf. | < Sup.* | Freq. | Méd Fx | DP Fx | | Norm. | Freq. N. | Acum. |
1 | 5,35 | 5,97 | 2 | 5,62 | 0,39 | | 1 | 0,032 | 0,032 |
2 | 5,97 | 6,59 | 2 | 6,37 | 0,18 | | 2 | 0,032 | 0,064 |
3 | 6,59 | 7,21 | 5 | 6,91 | 0,21 | | 3 | 0,081 | 0,145 |
4 | 7,21 | 7,83 | 5 | 7,54 | 0,17 | | 4 | 0,081 | 0,226 |
5 | 7,83 | 8,45 | 8 | 8,12 | 0,19 | | 5 | 0,129 | 0,355 |
6 | 8,45 | 9,07 | 11 | 8,77 | 0,20 | | 6 | 0,177 | 0,532 |
7 | 9,07 | 9,69 | 11 | 9,39 | 0,17 | | 7 | 0,177 | 0,709 |
8 | 9,69 | 10,31 | 13 | 10,00 | 0,20 | | 8 | 0,210 | 0,919 |
9 | 10,31 | 10,93 | 11 | 10,61 | 0,17 | | 9 | 0,177 | 1,096 |
10 | 10,93 | 11,55 | 11 | 11,23 | 0,20 | | 10 | 0,177 | 1,273 |
11 | 11,55 | 12,17 | 8 | 11,88 | 0,19 | | 11 | 0,129 | 1,402 |
12 | 12,17 | 12,79 | 5 | 12,46 | 0,17 | | 12 | 0,081 | 1,483 |
13 | 12,79 | 13,41 | 4 | 13,04 | 0,21 | | 13 | 0,064 | 1,547 |
14 | 13,41 | 14,03 | 2 | 13,63 | 0,18 | | 14 | 0,032 | 1,580 |
15 | 14,03 | 14,65 | 2 | 14,38 | 0,39 | | 15 | 0,032 | 1,612 |
|
|
*Para a última faixa <= Sup.
|
Histograma contendo a indicação das faixas e o desvio padrão de cada faixa.
Histograma normalizado.
A linha de freqüência acumulada (eixo à esquerda) representa a função densidade de probabilidade acumulada e a área sob a linha é igual a 1, considerando a largura das faixas igual ao valor máximo das faixas menos o valor mínimo das faixas dividido pelo número total de faixas.
Exemplo de utilização com cotações:
Histograma de retornos de cotações – parâmetros:
- Intervalo de dados C18:M37 (220 cotações)
- Faixas (ou classes) 15
- Amostra
- Incluir indicadores estatísticos
- Apresentar normalização
- Gráficos em preto e branco
- Gerar histograma dos retornos
- Dados – cotações de um ativo no tempo ordenadas por linhas e depois por colunas
| 58,20 | 58,00 | 47,00 | 46,50 | 44,00 | 46,00 | 57,50 | 57,00 | 35,50 | 34,01 | 41,30 |
| 59,90 | 58,00 | 48,50 | 45,50 | 41,50 | 46,00 | 57,50 | 53,80 | 35,50 | 36,31 | 41,30 |
| 61,20 | 52,00 | 48,00 | 43,00 | 44,50 | 46,00 | 56,50 | 52,70 | 32,50 | 37,00 | 40,50 |
| 61,00 | 47,00 | 48,55 | 45,50 | 42,50 | 47,00 | 55,00 | 53,80 | 34,60 | 35,70 | 41,00 |
| 61,00 | 50,00 | 50,00 | 45,00 | 43,00 | 47,50 | 53,60 | 54,50 | 38,00 | 35,50 | 39,50 |
| 60,00 | 45,50 | 53,51 | 47,00 | 43,00 | 47,70 | 54,61 | 44,50 | 36,00 | 36,40 | 40,00 |
| 63,00 | 43,00 | 55,00 | 48,00 | 44,00 | 49,00 | 55,00 | 44,50 | 36,80 | 36,50 | 40,00 |
| 61,50 | 46,99 | 53,50 | 48,50 | 44,00 | 50,00 | 56,00 | 46,00 | 39,50 | 37,50 | 39,00 |
| 61,00 | 48,00 | 54,00 | 50,50 | 46,00 | 49,50 | 57,20 | 45,00 | 38,00 | 38,00 | 39,00 |
| 59,50 | 50,00 | 53,00 | 50,50 | 44,50 | 49,00 | 56,10 | 45,50 | 39,50 | 38,50 | 36,50 |
| 59,00 | 49,00 | 54,00 | 48,00 | 45,50 | 50,50 | 57,00 | 44,00 | 39,00 | 40,00 | 36,50 |
| 60,50 | 45,00 | 52,60 | 45,00 | 47,50 | 51,50 | 56,50 | 41,90 | 38,00 | 40,00 | 36,00 |
| 59,80 | 45,00 | 51,00 | 41,00 | 48,00 | 51,99 | 57,00 | 41,00 | 36,00 | 42,00 | 34,80 |
| 60,00 | 43,50 | 49,80 | 38,00 | 47,99 | 52,00 | 58,50 | 40,01 | 33,00 | 43,80 | 33,00 |
| 60,00 | 41,00 | 48,00 | 43,20 | 48,00 | 51,00 | 57,50 | 39,00 | 32,50 | 43,00 | 33,00 |
| 61,00 | 38,50 | 45,50 | 48,00 | 48,00 | 52,00 | 57,00 | 39,00 | 32,50 | 44,00 | 30,01 |
| 60,00 | 38,11 | 47,50 | 45,00 | 47,40 | 54,99 | 56,00 | 38,00 | 33,00 | 44,50 | 33,00 |
| 60,00 | 44,98 | 46,00 | 44,00 | 46,50 | 56,10 | 58,00 | 38,00 | 34,50 | 45,50 | 33,00 |
| 60,51 | 43,00 | 50,00 | 44,70 | 45,50 | 57,99 | 57,50 | 37,50 | 34,40 | 44,00 | 32,00 |
| 61,28 | 43,49 | 48,50 | 46,50 | 46,00 | 57,29 | 57,00 | 36,00 | 33,21 | 42,00 | 32,50 |
Resultados:
| Amostra | 219 |
| Média | -0,177% |
| Mediana | 0,000% |
| Moda | -0,161% |
| Máximo | 18,027% |
| Mínimo | -18,349% |
| DP | 4,220% |
| Skewness | 0,190 |
| Exc. Kurt. | 3,017 |
|
O número de dados para retornos é igual ao número de dados para cotações –1.
Todos os para retornos têm saída no formato percentual.
|
| Faixas | <= Inf. | < Sup.* | Freq. | Méd Fx | DP Fx | | Norm. | Freq. N. | Acum. |
| 1 | -18,349% | -15,924% | 1 | -18,349% | 0,000% | | 1 | 0,188 | 0,188 |
| 2 | -15,924% | -13,499% | 0 | 0,000% | 0,000% | | 2 | 0,000 | 0,188 |
| 3 | -13,499% | -11,074% | 0 | 0,000% | 0,000% | | 3 | 0,000 | 0,188 |
| 4 | -11,074% | -8,649% | 5 | -9,382% | 0,607% | | 4 | 0,941 | 1,130 |
| 5 | -8,649% | -6,223% | 7 | -7,311% | 1,011% | | 5 | 1,318 | 2,448 |
| 6 | -6,223% | -3,798% | 19 | -5,108% | 0,577% | | 6 | 3,578 | 6,025 |
| 7 | -3,798% | -1,373% | 47 | -2,476% | 0,663% | | 7 | 8,850 | 14,875 |
| 8 | -1,373% | 1,052% | 59 | -0,207% | 0,625% | | 8 | 11,109 | 25,985 |
| 9 | 1,052% | 3,477% | 51 | 1,992% | 0,659% | | 9 | 9,603 | 35,588 |
| 10 | 3,477% | 5,902% | 16 | 4,494% | 0,626% | | 10 | 3,013 | 38,601 |
| 11 | 5,902% | 8,327% | 7 | 7,038% | 0,582% | | 11 | 1,318 | 39,919 |
| 12 | 8,327% | 10,752% | 4 | 9,441% | 0,578% | | 12 | 0,753 | 40,672 |
| 13 | 10,752% | 13,177% | 1 | 11,111% | 0,000% | | 13 | 0,188 | 40,860 |
| 14 | 13,177% | 15,602% | 1 | 13,684% | 0,000% | | 14 | 0,188 | 41,048 |
| 15 | 15,602% | 18,027% | 1 | 18,027% | 0,000% | | 15 | 0,188 | 41,237 |
|
|
*Para a última faixa <= Sup.
|
Histograma dos retornos das cotações informadas.
|