|
Ok… Vencemos a etapa de montar o questionário, tratar as respostas, filtrar respostas coerentes e etc. Agora precisamos começar nossa análise. Em geral começamos sempre por uma análise exploratória do nosso conjunto de dados.
Em uma análise exploratória buscamos sintetizar a informação presente nos dados por meio de tabelas e gráficos.
Cuidados devem ser tomados no que diz respeito à escolha do tipo de representação. Devemos, por exemplo, evitar que o gráfico fique desproporcional ou privilegiando determinados valores a fim de induzir conclusões àqueles que utilizam o gráfico como forma de visualização.
A escolha do gráfico está diretamente ligada ao tipo das variáveis. Além disso, existem gráficos que permitem análises de mais de uma variável simultâneamente a fim de verificar como uma influencia a outra(s).
Existem dois tipos de variáveis: as numéricas (quantitativas) e as não numéricas (qualitativas):
Variáveis Quantitativas: assumem valores numéricos.
Podem ser:
Discretas: características mensuráveis que podem assumir apenas um número finito ou infinito contável de valores e, assim, somente fazem sentido valores inteiros.
Contínuas: características mensuráveis que assumem valores em uma escala contínua, isto é, na reta real.
Variáveis Qualitativas: são as características definidas categorias, ou seja, representam uma classificação dos indivíduos e não uma característica numérica.
Podem ser:
Nominais: não existe ordenação nem peso entre as categorias.
Ordinais: existe uma ordenação entre as categorias.
Tendo isso em mente podemos começar a pensar em que medidas e gráficos podemos utilizar para representar nossas variáveis (análises univariadas) e também estudar a relação entre estas variáveis (análises bi, tri e multivariadas)
Algumas possibilidades de gráficos para cada tipo de variável são:
Qualitativa nominal ou ordinal: setores, barras, linhas.
Quantitativa discreta: barras, linhas, histograma, boxplot, densidade.
Quantitativas contínuas: histograma, densidade, boxplot.
Considere um conjunto de dados genérico, composto por uma variável quantitativa discreta, duas variáveis quantitativas contínuas e duas variáveis qualitativas nominais. Veja alguns exemplos das representações mencionadas:
Niveis | Frequencia | Frequencia.relativa |
---|---|---|
a | 30 | 0.3 |
b | 37 | 0.37 |
c | 33 | 0.33 |
Niveis | Frequencia | Frequencia.relativa |
---|---|---|
0 | 1 | 0.01 |
1 | 3 | 0.03 |
2 | 10 | 0.1 |
3 | 19 | 0.19 |
4 | 16 | 0.16 |
5 | 24 | 0.24 |
6 | 7 | 0.07 |
7 | 9 | 0.09 |
8 | 3 | 0.03 |
9 | 5 | 0.05 |
10 | 1 | 0.01 |
11 | 1 | 0.01 |
13 | 1 | 0.01 |
Classes | Frequencia | Frequencia relativa |
---|---|---|
[15,20] | 5 | 0.05 |
(20,25] | 7 | 0.07 |
(25,30] | 13 | 0.13 |
(30,35] | 16 | 0.16 |
(35,40] | 14 | 0.14 |
(40,45] | 18 | 0.18 |
(45,50] | 9 | 0.09 |
(50,55] | 8 | 0.08 |
(55,60] | 8 | 0.08 |
(60,65] | 2 | 0.02 |
Minimo | Quartil_1 | Media | Mediana | Quartil_3 | Maximo |
---|---|---|---|---|---|
16.02 | 30.04 | 38.53 | 38.29 | 45.22 | 63.01 |
Amplitude | Variancia | Desvio_padrao |
---|---|---|
47 | 121.8 | 11.04 |