Dicas sobre a visualização de dados fácil com o Excel – Versta Research

Na sua essência, a visualização de dados é sobre o uso de técnicas visuais como atalhos para entender os padrões nos dados. Você não precisa de ferramentas sofisticadas ou assinaturas de “dados viz” para fazê -lo. Ferramentas disponíveis em programas comuns como o Excel fornecem um excelente meio para visualizar dados. Isso pode economizar tempo e pode apontar na direção certa para uma análise rigorosa.

Aqui está um exemplo do nosso trabalho recente. Tivemos um conjunto de dados de trabalho com 107 variáveis. Queríamos saber se poderíamos reduzi -los em um conjunto menor de variáveis ​​usando técnicas como análise fatorial e escala. Também estávamos planejando usar técnicas de regressão linear, por isso queríamos estar cientes de quaisquer problemas de colinearidade.

Nosso primeiro passo para se familiarizar com os dados foi executar uma matriz de correlação bivariada. Isso resultou em uma matriz de 11.449 coeficientes. Altas correlações sugeririam colinearidade potencial e oportunidades para redução de dados. A revisão de tantos coeficientes em uma única matriz pode ser um esboço difícil, mas usar regras de cores no Excel para criar um “mapa de calor” torna isso possível:

Matriz de correlação do mapa de calor de pesquisa versta

Matriz de correlação de 107 × 107 com regras de cores do Excel usadas para sinalizar correlações mais altas

Os grupos de laranja mostram grupos lógicos de variáveis ​​altamente correlacionadas, tornando -as candidatos à redução de dados através da análise fatorial. As longas seqüências de laranja (em linhas ou colunas) apontam para variáveis ​​específicas que estão altamente correlacionadas com muitos itens da pesquisa, sugerindo redundância, colinearidade ou talvez até uma descoberta valiosa.

Aqui estão algumas dicas para criar esse tipo de mapa visualizado:

  • Mantenha seus dados definidos em uma ordem lógica (provavelmente a ordem em que as perguntas da pesquisa foram feitas) para que os clusters representem relacionamentos lógicos, em vez de aleatórios
  • Execute uma matriz completa de correlações bivariadas (usamos SPSS)
  • Exportar a saída para o Excel
  • No Excel, remova as linhas mostrando n-contagens e valores p (o SPSS os gerará por padrão)
  • Selecione a folha inteira e crie uma regra de preenchimento de células (nossa regra era encher a célula com laranja se o valor da célula for maior que 0,1)

A visualização de dados não se trata apenas de gráficos sofisticados (ou da compra de software caro para fabricá -los), mas sobre técnicas gráficas simples para funcionar mais inteligente e com mais eficiência. Nesse caso, também foi apenas um primeiro passo em direção a técnicas estatísticas avançadas, que incluíram análise fatorial, análise de confiabilidade, regressão linear, regressão logística, CHAID e análise de cluster. E técnicas estatísticas avançadas são, obviamente, apenas um passo provisório para entender os dados e Transformando tudo em história clara e convincente.

Precisa de ajuda para classificar todos os seus dados, entender e transformá -los em uma história? É isso que fazemos, então fique à vontade para alcançar.

Joe HopperPh.D.

Deixe um comentário