Como Mentir Com Estatística
Você vai aprender a identificar e combater manipulações estatísticas usadas por jornalistas, profissionais de marketing e até mesmo cientistas, com o objetivo de confundir e enganar o público.
É possível mentir usando Estatística? Sim. Inclusive isso é mais comum do que se possa imaginar.
Mas então, como mentir com estatística? Ou, melhor, como não cair nessas mentiras?
Há várias técnicas apresentadas aqui e destrinchadas na referência em questão.
Saiba como jornalistas, marqueteiros e até mesmo cientistas podem usar estatísticas, figuras, tabelas e gráficos para apresentar informações de forma a confundir e enganar o público. Não caia nestas mentiras!
O Problema
Todos hão de concordar que o fato de usarmos dados estatísticos na apresentação de alguma informação, automaticamente gera para o leitor uma certa sensação de confiabilidade.
Isso é esperado e evidencia a importância e o respeito das pessoas para com uma ciência tão nobre quanto a Estatística.
Os aproveitadores sabem disso e muitas vezes nos apresentam informações falsas, mas que parecem verdadeiras, pois foram baseadas em dados estatísticos inventados ou bem “maquiados”.
Quando expostos, no entanto, estas informações são muito frágeis, quando não completamente falsas.
Neste artigo, apresentamos informações e literatura essencial para quem realiza análise de dados, mas também para qualquer um que não queira mais ser enganado.
São muitos os exemplos de manipulações estatísticas em diversos setores fundamentais para a sociedade — o impacto destas manipulações em nossa vida é enorme.
Uma simples combinação entre pesquisas de intenção, jornalismo e marketing com manipulação de informação, pode decidir o resultado de uma eleição, por exemplo.
Conheça agora as técnicas utilizadas para que você nunca caia em tais mentiras.
Título do Anúncio
Descrição do anúncio. Lorem ipsum dolor sit amet, consectetur adipiscing elit.
A Solução
No ano de 1954 Darrell Huff publicou o livro intitulado How to Lie With Statistics ou Como Mentir Com Estatística.
“Peça por peça, Huff desmonta o modo como os marqueteiros usam estatísticas, tabelas e gráficos para apresentar números que confundem e enganam o público” The Wall Street Journal.
“Quando foi publicado pela primeira vez, em 1954, o livro de Darrell Huff foi saudado como pioneiro em conjugar linguagem simples e ilustrações para tratar de um tema polêmico e controverso: o mau uso da estatística para maquiar dados e abalizar opiniões. Hoje, em tempos de internet e big data, o livro continua genuinamente subversivo e ainda mais relevante. Qual é, afinal, o grau de confiança que devemos depositar nas análises estatísticas? Segundo Huff, vale ter sempre um pé atrás. Amostras enviesadas, gráficos dúbios, listagens incompletas: item por item o autor apresenta os vilões da interpretação de dados. Em um capítulo, ele aponta como os gráficos estatísticos, mesmo matematicamente corretos, podem não representar em nada a realidade. Em outro, vemos que uma mesma projeção pode mostrar um futuro positivo ou alarmante, dependendo da amplitude de dados que ela cobre. O livro termina com um brilhante passo a passo para o leitor aprender a diferenciar informação de enrolação. Escrito com humor e repleto de advertências tão atemporais quanto a ciência matemática, Como Mentir Com Estatística é uma leitura agradável e absolutamente acessível. Indispensável para quem se vê bombardeado diariamente, seja pela mídia ou pela timeline do Facebook, por infográficos e estatísticas que se pretendem verdades incontestáveis.”
Mais de meio século após seu lançamento, suas ideias são mais atuais e relevantes do que nunca, como disse Bill Gates.
Os principais insights de cada um dos dez capítulos são tratados separadamente em cada tópico abaixo.
Caso tenha se interessado e queira adquirir o livro “Como Mentir Com Estatística”, clique aqui!
01. A amostra com tendenciosidade embutida
Neste capítulo o conceito de amostra tendenciosa é apresentado.
Você pode ter o resultado que quiser, se fez uma seleção da amostra de forma enviesada, para corroborar seus interesses.
Nestes casos, a aleatoriedade na seleção dos dados é colocada de lado.
Normalmente, cada elemento deveria ter a mesma probabilidade de ser amostrado! Mas não é o que acontece!
Falando de forma prática, você direciona sua amostragem de acordo com o resultado que deseja que ocorra.
A forma em que uma entrevista foi elaborada e aplicada pelo entrevistador pode, por exemplo, induzir determinadas respostas.
Neste ponto, as possibilidades de manipulação e fraude são enormes.
02. A média bem escolhida
Aqui, caso queira, pode escolher a medida de tendência central que retorne o valor que mais se encaixe no que quer provar.
Exemplos das principais medidas de tendência central são média aritmética, mediana e moda.
Por exemplo, em determinado bar há nove clientes com renda anual de:
15, 15, 16, 18, 20, 20, 21, 21 e 84 mil dólares
média = 26 mil dólares & mediana = 20 mil dólares
Se o Bill Gates, que tem renda anual de 10 milhões de dólares entra no bar, temos agora:
média = 1 milhão de dólares & mediana = 20 mil dólares.
O dono do bar pode dizer que seus clientes têm em média uma renda anual de aproximadamente 1 milhão!
03. Os numerozinhos que não estão ali
Qualquer tipo de omissão de dados geralmente indica a tentativa de esconder algum problema.
Este capítulo trata da importância da utilização de um tamanho amostral adequado para as pesquisas.
Utilizando um grupo pequeno, a força do acaso tem uma possibilidade maior de mostrar o resultado como o manipulador deseja.
Em um grupo grande, as diferenças produzidas pelo acaso são diluídas e o resultado tende a ser mais próximo do real.
Há exemplos de empresas que repetem experimentos várias vezes com grupos bem pequenos até que a força do acaso jogue a seu favor.
Então este resultado enviesado é o que será veiculado nas propagandas da empresa.
Muitas vezes um valor só faz sentido ser apresentado se utilizado de maneira comparativa, por exemplo.
Um gráfico com dados omitidos não diz nada, mas para os mais desatentos pode dizer muito.
Neste capítulo, ainda é tratado como o uso da média, sem uma medida de variabilidade qualquer pode ser nociva e enganar facilmente os mais desatentos.
04. Muito barulho por praticamente nada
O autor discorre sobre os erros de medida e a importância de utilizar intervalos de confiança para lidar com isso.
Este tipo de erro, presente em todos os estudos por amostragem, não deve ser ignorado.
A amostra nunca representará a população perfeitamente!
05. O gráfico exagerado
Esse é um dos métodos mais eficientes para enganar os desavisados.
Com uma pequena alteração na perspectiva do gráfico, é possível aumentar a importância de determinados fatos.
Cortar uma parte do gráfico e alterar a proporção entre os eixos provoca uma mudança assombrosa.
Mesmos dados, mas um dos gráficos com o eixo Y completo e o outro com o eixo Y cortado.
Título do Anúncio
Descrição do anúncio. Lorem ipsum dolor sit amet, consectetur adipiscing elit.
06. A figura unidimensional
O apelo visual desse tipo de manipulação é estrondoso.
Abaixo os mesmos dados apresentados em:
(1) um gráfico de forma adequada; e
(2) em um pictograma desonesto.
Ao dobrar a altura da segunda sacola de dinheiro, consequentemente quadruplicaram a área dela, dando uma impressão de maior diferença.
07. O número semiligado
Esse tipo de manipulação se baseia na seguinte premissa:
“Se não consegue provar o que deseja, demonstre alguma outra coisa e finja que são equivalentes.”
“Você não pode provar que sua panaceia cura resfriados, mas pode publicar (em letras grandes) o relatório de um laboratório reconhecido, segundo o qual meio grama da sua substância foi capaz de matar 31.108 germes em um tubo de ensaio em onze segundos.”
Morreram mais pessoas em aviões no ano passado do que em 1910.
Portanto, os aviões modernos seriam mais perigosos? Isso não faz o menor sentido. O número de pessoas que pegam aviões hoje em dia é centenas de vezes maior, só isso.
Dica de ouro: Se uma porcentagem grande de médicos fuma determinada marca de cigarro, isso não quer dizer que o cigarro daquela marca não é prejudicial ou é menos que as outras.
09. Como estatisticular
“Não são bem as coisas que não sabemos que nos causam problemas. São as coisas que sabemos que não são assim.”
Artemus Ward, escritor americano
Dar informações erradas às pessoas usando material estatístico pode ser chamado de estatisticulação.
Esta é a arte [desonesta] de utilizar as manipulações estatísticas vistas anteriormente para montar uma mentira.
Até mesmo em um trabalho científico, alguém pode ter uma propensão (talvez inconsciente) a favorecer, um argumento que deseja provar. Leia mais sobre pensamento desejoso ou wishful thinking.
10. Como contestar uma estatística
Para detectar algum erro, problema ou má intenção sempre faça esses cinco perguntas básicas:
#01 Quem está dizendo?
Não deve haver parcialidade, tendenciosidade, e conflitos de interesse dos responsáveis.
#02 Como ele sabe?
A amostra deve ser representativa e adequada o suficiente para permitir uma conclusão confiável.
#03 O que está faltando?
Não deve haver informação omitida, como tamanho amostral, erros estatísticos, medidas de variabilidade, ou qualquer outra característica importante da população e análises.
#04 Alguém mudou de assunto?
A pergunta e a resposta devem tratar do mesmo assunto.
#05 Isso faz sentido?
Questione sobre o uso de números absurdos.
Conclusão
O livro é essencial para que as pessoas desenvolvam o pensar estatístico e se protejam das manipulações que somos submetidos diariamente.
Fortemente recomendado para pesquisadores, profissionais, estudantes e até para o público geral.
Para mais dicas sobre o uso da estatística para manipulação de informações, não deixe de ler o nosso excelente artigo intitulado “A Estatística e as Fake News.”
Caso tenha se interessado e queira adquirir o livro “Como Mentir Com Estatística”, clique aqui!
Baixe gratuitamente as amostras do nosso livro digital lançado recentemente.
Aprenda a analisar seus dados com uma metodologia incrível. O retorno que temos recebido de nossos alunos tem sido excelente!
Clique neste link e saiba mais sobre ele: Estatística Aplicada: Análise de Dados.