|     | 
Ok… Vencemos a etapa de montar o questionário, tratar as respostas, filtrar respostas coerentes e etc. Agora precisamos começar nossa análise. Em geral começamos sempre por uma análise exploratória do nosso conjunto de dados.
Em uma análise exploratória buscamos sintetizar a informação presente nos dados por meio de tabelas e gráficos.
Cuidados devem ser tomados no que diz respeito à escolha do tipo de representação. Devemos, por exemplo, evitar que o gráfico fique desproporcional ou privilegiando determinados valores a fim de induzir conclusões àqueles que utilizam o gráfico como forma de visualização.
A escolha do gráfico está diretamente ligada ao tipo das variáveis. Além disso, existem gráficos que permitem análises de mais de uma variável simultâneamente a fim de verificar como uma influencia a outra(s).
Existem dois tipos de variáveis: as numéricas (quantitativas) e as não numéricas (qualitativas):
Variáveis Quantitativas: assumem valores numéricos.
Podem ser:
Discretas: características mensuráveis que podem assumir apenas um número finito ou infinito contável de valores e, assim, somente fazem sentido valores inteiros.
Contínuas: características mensuráveis que assumem valores em uma escala contínua, isto é, na reta real.
Variáveis Qualitativas: são as características definidas categorias, ou seja, representam uma classificação dos indivíduos e não uma característica numérica.
Podem ser:
Nominais: não existe ordenação nem peso entre as categorias.
Ordinais: existe uma ordenação entre as categorias.
Tendo isso em mente podemos começar a pensar em que medidas e gráficos podemos utilizar para representar nossas variáveis (análises univariadas) e também estudar a relação entre estas variáveis (análises bi, tri e multivariadas)
Algumas possibilidades de gráficos para cada tipo de variável são:
Qualitativa nominal ou ordinal: setores, barras, linhas.
Quantitativa discreta: barras, linhas, histograma, boxplot, densidade.
Quantitativas contínuas: histograma, densidade, boxplot.
Considere um conjunto de dados genérico, composto por uma variável quantitativa discreta, duas variáveis quantitativas contínuas e duas variáveis qualitativas nominais. Veja alguns exemplos das representações mencionadas:
| Niveis | Frequencia | Frequencia.relativa | 
|---|---|---|
| a | 30 | 0.3 | 
| b | 37 | 0.37 | 
| c | 33 | 0.33 | 
| Niveis | Frequencia | Frequencia.relativa | 
|---|---|---|
| 0 | 1 | 0.01 | 
| 1 | 3 | 0.03 | 
| 2 | 10 | 0.1 | 
| 3 | 19 | 0.19 | 
| 4 | 16 | 0.16 | 
| 5 | 24 | 0.24 | 
| 6 | 7 | 0.07 | 
| 7 | 9 | 0.09 | 
| 8 | 3 | 0.03 | 
| 9 | 5 | 0.05 | 
| 10 | 1 | 0.01 | 
| 11 | 1 | 0.01 | 
| 13 | 1 | 0.01 | 
| Classes | Frequencia | Frequencia relativa | 
|---|---|---|
| [15,20] | 5 | 0.05 | 
| (20,25] | 7 | 0.07 | 
| (25,30] | 13 | 0.13 | 
| (30,35] | 16 | 0.16 | 
| (35,40] | 14 | 0.14 | 
| (40,45] | 18 | 0.18 | 
| (45,50] | 9 | 0.09 | 
| (50,55] | 8 | 0.08 | 
| (55,60] | 8 | 0.08 | 
| (60,65] | 2 | 0.02 | 
| Minimo | Quartil_1 | Media | Mediana | Quartil_3 | Maximo | 
|---|---|---|---|---|---|
| 16.02 | 30.04 | 38.53 | 38.29 | 45.22 | 63.01 | 
| Amplitude | Variancia | Desvio_padrao | 
|---|---|---|
| 47 | 121.8 | 11.04 | 














|   |   |   |