O Paradoxo de Simpson descreve uma situação em que uma tendência observada em dados agregados se inverte quando os dados são segmentados. Não é um erro estatístico, é um efeito de mistura causado por variáveis de confusão e distribuição desigual entre grupos (Simpson, 1951).

Considere dois tratamentos médicos, A e B, avaliados em dois grupos de pacientes, casos leves e casos graves.
Casos leves
Tratamento A, 90 curas em 100 pacientes, taxa 90%
Tratamento B, 80 curas em 100 pacientes, taxa 80%
Casos graves
Tratamento A, 10 curas em 100 pacientes, taxa 10%
Tratamento B, 20 curas em 100 pacientes, taxa 20%
Dentro de cada grupo, A é melhor nos leves e B é melhor nos graves. A leitura correta exige respeitar a heterogeneidade clínica, uma prática recomendada em análise causal e epidemiologia (Pearl, 2009).
Agora agregue os dados, mas com distribuição diferente de pacientes entre os tratamentos.
Tratamento A
Leves 90 de 100, graves 10 de 100, total 100 curas em 200 pacientes, taxa 50%
Tratamento B
Leves 80 de 100, graves 20 de 100, total 100 curas em 200 pacientes, taxa 50%
Ajustando levemente a distribuição para refletir um cenário comum, onde A atende mais casos graves e B mais casos leves:
Tratamento A
Leves 90 de 100, graves 10 de 900, total 100 curas em 1000 pacientes, taxa 10%
Tratamento B
Leves 80 de 900, graves 20 de 100, total 100 curas em 1000 pacientes, taxa 10%
Com pequenas variações nos números, é possível observar a inversão completa, onde o tratamento aparentemente pior no agregado é superior dentro de cada grupo. Isso ocorre porque a variável gravidade atua como confundidora, distorcendo a comparação quando ignorada (Hernán e Robins, 2020).
O Paradoxo de Simpson ganha clareza quando se visualiza a diferença entre análise segmentada e agregada. A inversão não é intuitiva em tabelas, mas torna-se evidente em gráficos que expõem o efeito da variável de confusão.
Comparação segmentada por grupo
Nos gráficos segmentados, observa-se o comportamento real dentro de cada grupo. Em casos leves, o tratamento A apresenta maior taxa de sucesso. Em casos graves, o tratamento B supera A. Essa leitura preserva a relação causal local, pois compara populações homogêneas, alinhado com boas práticas de inferência (Pearl, 2009).
Comparação agregada
Ao consolidar os dados sem considerar a distribuição entre leves e graves, o gráfico agregado pode mostrar equivalência ou até inversão de desempenho. A razão é simples, a composição dos grupos é diferente entre A e B, o que distorce a média total. Esse efeito é típico de variáveis de confusão não controladas (Hernán e Robins, 2020).
Visualização da distribuição dos grupos
Aqui está o ponto crítico. A distribuição desigual de pacientes entre leves e graves altera o peso de cada grupo no resultado final. O tratamento A pode parecer pior no agregado simplesmente porque atende proporcionalmente mais casos graves. O gráfico de composição deixa explícito o mecanismo do paradoxo.
A leitura isolada de métricas agregadas induz erro quando há heterogeneidade relevante nos dados. O Paradoxo de Simpson não é exceção, é recorrente em operações, marketing, supply chain e saúde. A prática recomendada é sempre decompor métricas por variáveis críticas, validar consistência entre níveis e só então consolidar. Sem isso, decisões orientadas por dados podem ser tecnicamente corretas na estatística e equivocadas na realidade.
O Paradoxo de Simpson expõe um risco central em decisões data driven, a análise sem estratificação pode levar a conclusões opostas à realidade operacional. Em ambientes de negócio, isso aparece em comparações entre unidades, canais ou fornecedores com mix diferente de clientes ou produtos. A implicação prática é direta, sempre testar segmentações relevantes, identificar variáveis de confusão e priorizar análises condicionais antes de decisões agregadas.