Gráficos com ou sem muitos detalhes?

Sempre tive um pé atrás com relação ao exagero em qualquer tipo de apresentação. Seja na minha dissertação de mestrado, que teve 33 páginas, ou nas apresentações no trabalho, onde evitava encher slides com muitas informações, preferia apresentar algo enxuto que focava no que importava. Por estes motivos, meus gráficos sempre foram os mais simples possíveis. Achava inclusive que encher de detalhes, legendas e outras anotações, iria tirar o foco do leitor. Mas o que diz a literatura sobre isso?

Quando pensamos em gráfico na Estatística, pensamos em Edward Tufte. Uma breve busca na internet ou uma passada rápida em seu site (https://www.edwardtufte.com/) e fica claro o motivo do cara ser uma referência no assunto. Sendo assim, sinto certa satisfação quando vejo sua crítica com relação ao excesso de detalhes. Um conceito criado pelo estatístico é o data-ink ratio que é a razão entre a tinta utilizada para representar os dados e o total de tinta utilizado no gráfico:

data-ink-ratio-formula.png

Esta razão deveria ser a menor possível, ou seja, você deveria minimizar o gasto com tinta que não fosse para representar algum dado. Em outras palavras, o gráfico deveria ter o menor número de detalhes possível, evitar o que é chamado por alguns de chart junk. No exemplo abaixo, temos um gráfico com baixo data-ink ratio à esquerda e um com alto à direita:

 

No entanto, a ideia de Tufte parece não ter tanto respaldo assim da literatura. Um experimento feito na Universidade de Saskatchewan, Canadá, testou justamente a diferença entre o quanto nos recordamos de um gráfico com baixo data-ink ratio em comparação com um gráfico com diversos detalhes, com alto data-ink ratio. Aqui, quando falamos de detalhes não estamos nos referindo somente a algumas legendas adicionais, mas sim à inclusão de desenhos e outras artes que podem ajudar ou atrapalhar na hora de se recordar dos dados. Veja dois exemplos utilizados no artigo:

Captura de Tela 2019-06-13 às 17.22.22.png

O experimento contou com 20 participantes, sendo que a maioria lidava com gráficos de forma rotineira. Os participantes então precisavam visualizar um dos gráficos – um mais simples, com menor data-ink ratio (Plain/Standard Chart) e outro mais detalhado, com mais “enfeites” e maior data-ink ratio (Holmes Chart) – e passar primeiro por uma fase em que descreviam a informação obtida e em seguida por uma atividade que envolvia recordar os gráficos. A atividade de recordar poderia ser imediatamente a fase de descrição, a qual vamos chamar de ‘recordação imediata’, ou alguns dias depois, a qual vamos chamar de ‘recordação a longo prazo’. Adicionalmente, havia um rastreador para monitorar o movimento dos olhos.

As perguntas feitas nas atividades foram:

  1. Tema: Sobre o que é o gráfico? Conte-me sobre o assunto básico do gráfico.
  2. Valor: Quais são as categorias e valores apresentados?
  3. Tendência: Qual é a tendência básica do gráfico? Conte-me se o gráfico apresenta alguma mudança e descreva as mudanças.
  4. Valor da Mensagem: O autor está tentando transmitir alguma mensagem através do gráfico? O autor está tentando passar um ponto específico ou está meramente apresentando informações objetivas?

Os resultados para o teste descritivo demonstraram que não houve nenhuma diferença significativa na quantidade de acertos dos dois grupos para as três primeiras perguntas, nem no tempo gasto para as respostas. Entretanto, para os gráficos mais detalhados a pergunta referente ao valor da mensagem teve mais acertos. Para a atividade de recordação imediata, o mesmo ocorreu, somente para valor da mensagem tivemos uma diferença no número de acertos com os que visualizaram o gráfico com maior data-ink ratio, o mais detalhado, acertando mais. Já para a atividade de recordação a longo prazo, para todas as categorias houve diferença significativa, com os participantes que visualizaram os gráficos mais enfeitados acertando mais (sendo mais precisos).

Curiosamente, mesmo o monitoramento dos olhos tendo mostrado que os participantes que visualizaram o gráfico com mais detalhes acabavam se distraindo e olhando menos para partes que continham somente dados, isto não atrapalhou na memorização das informações. Veja a diferença na proporção que cada grupo olhou para determinadas partes dos gráficos:

Captura de Tela 2019-06-13 às 18.01.19

Em outras palavras, parece não haver diferença na precisão da interpretação para os dois gráficos. No entanto, após um longo período, os participantes que visualizaram os gráficos mais detalhados, com mais enfeites, recordaram-se de mais informações que os que visualizaram os gráficos minimalistas, mais simples. Há várias hipóteses para isto, como o fato dos diferentes desenhos ajudarem a distinguir melhor as informações dos diferentes gráficos ou por causa da resposta emocional. O ponto aqui é que talvez mais seja mais aqui e que poderíamos ter menos aversão aos gráficos espalhafatosos. Para algumas situações, eles parecem ser úteis.

Leia o artigo completo: http://hci.usask.ca/uploads/173-pap0297-bateman.pdf

Leitura Adicional Recomendada: The Visual Display of Quantitative Information (1983) de Edward Tufte

 

E se você gostou do post, não vá embora sem deixar uma curtida ou um comentário. Eu sei que não parece relevante, mas faz diferença para mim e custa pouco para você. Se encontrou algum erro ou tem alguma sugestão, dúvida, elogio ou crítica, pode escrever nos comentários ou me enviar uma mensagem diretamente em Sobre o Estatsite. E visite também a conta do Twitter @EstatSite.

Forte abraço e bons estudos!

Anúncios

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google

Você está comentando utilizando sua conta Google. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s