Show all categories
Informações sob suspeita

A melhor plataforma de Geomarketing não será a mais bonita, nem a mais moderna

Seu valor, acima de tudo, está naquilo que a faz mais confiável: a base de dados atualizada e coerente.

Uma lógica objetiva, mas que, como veremos, pode ser perturbada por algo tão básico quanto o instinto.

Censos são a pedra fundamental, atualizados por projeções, calibrados por segmentações e modelos preditivos, um artesanato estatístico.

Se a melhor plataforma é aquela com a melhor informação, como comparar algo que não pode ser medido?

Anthony Bourdain, ao escrever Cozinha Confidencial, expôs um código invisível da indústria de restaurantes.

Se o banheiro está sujo, a cozinha está pior

Erick Jacquin sabem bem disso quando adentra restaurantes decadentes em Pesadelo na Cozinha.

Psicólogos, por sua vez, rotularam esse fenômeno como efeito auréola: a impressão gerada por um aspecto contamina a percepção do todo.

Há algo mais profundo aí, um mecanismo de defesa evolutivo, que associa cheiros fortes a perigo.

O mais curioso é que, mesmo em pleno século XX, em meio a geladeiras e vigilâncias sanitárias, esse instinto ancestral ainda se faz útil.

O caso do cliente desconfiado

Um cliente recém-chegado à Mapfry, após anos usando outra plataforma, descreveu sua decisão de migração como algo sensorial.

Ele não sabia dizer o que, mas algo na plataforma anterior parecia errado.

Era o banheiro da interface, feio, confuso, sujo.

A Mapfry, por outro lado, soava limpa, precisa, clara.

Durante a transição, com acesso temporário às duas plataformas, ele passou a compará-las ponto a ponto.

E foi aí que o cheiro virou fumaça, e a fumaça, fogo: diferenças absurdas nos indicadores, de 30%, 50%, até 90%.

Nos procurou extremamente preocupado, não aceitaria a clássica resposta “confia".

Alguém estava dramaticamente errado e, por mais incômodo que fosse, estávamos entre os suspeitos.

Revirando tudo

Aceitamos o desafio com espírito investigativo, nada de achismos, colocado da seguinte forma:

“Olha, aqui estão as bases referência de outra plataforma, fizemos algumas comparações e as diferenças estão grandes. Sabemos que é normal defender o que sempre fizemos, o que aprendemos com mestres em outros lugares, mas temos a oportunidade de entender como esse concorrente trabalha. Precisamos realizar uma investigação isenta, que aponte as razões que levam a essas distorções”

Era preciso seguir os dados onde quer que levassem:

  • População total: praticamente igual.
  • Domicílios: 5% a mais no concorrente.
  • Média de moradores por domicílio: 5% menor.
  • Proporção de apartamentos: 40% maior!
  • Renda total domiciliar: 50% maior!!

Os números não batiam, mas também não eram aleatórios, havia ali uma lógica interna, um sistema com pesos diferentes dos nossos.

Dados viciados têm faces com pesos diferentes

Nosso trabalho era reconstruir esse sistema de fora para dentro

Usamos dois métodos:

  1. Lei dos Grandes Números, para detectar distorções estatísticas em proporções populacionais. Serviu como filtro inicial: o que ultrapassava os limites da variação esperada era marcado como ponto de atenção
  2. Lei de Benford, uma das favoritas de investigadores forenses. Parte da ideia de que, na natureza, números não se distribuem aleatoriamente: eles tendem a começar com 1, 2 ou 3

Distribuição natural dos números

E então, as perguntas:

  • Se a população é a mesma, por que crescem tanto os domicílios?
  • Por que caem os moradores por domicílio?
  • Por que tantos apartamentos?
  • Por que explode a renda por domicílio?

Não era um erro pontual, havia um viés estrutural, estávamos diante de um modelo sistematicamente diferente.

Cada vez mais perto das regras implícitas do modelo do concorrente, montamos um teste contra o grupo de controle, aquele conjunto de municípios que ficou de fora da amostra principal.

Os resultados do teste foram frustrantes, faltava alguma coisa para fechar nossa compreensão.

Foi quando decidimos consultar o ChatGPT, e ele foi elementar ao apontar algo que simplesmente não poderíamos imaginar, pois ia contra tudo o que aprendemos e praticamos nesses 20 anos de Geomarketing:

O modelo do concorrente parecia usar:

  1. Regra de três simples para projetar dados em níveis municipais
  2. Equação média mal ponderada para desagregação intraurbana

Essa abordagem, apesar de prática, introduzia distorções gigantescas.

  • O que explicava o aumento nos apartamentos, por ignorar particularidades do interior
  • Enquanto a disparada na renda, vinha de uma fórmula linear super esticada

O desfecho

Nosso cliente, que antes acreditava cegamente em fornecedores de Geomarketing, nunca mais será o mesmo.

Esse artigo é o conjunto de explicações que montamos para ele, ainda que esclarecedoras, não devem levá-lo de volta ao patamar anterior de confiança.

Ele relatou que, problemas de desempenho em projetos passados, inaugurados com base nos dados da outra plataforma, começaram a fazer sentido, como também mencionou casos que iam bem, apesar das distorções.

Isso acontece porque nem tudo é explicável pelos dados, existem outras dinâmicas que fogem ao nosso controle.

No fundo, o processo de amadurecimento que esse episódio nos trouxe, também pode ser seu.

Assim como o pouso de um avião é uma queda controlada, toda projeção é uma distorção intencional, sob o efeito do tempo.

Para um dado estar errado, sua distorção tem que estar fora do razoável, limite que não está escrito em lugar algum.

Daí a imensa importância da experiência, que equipa o time Mapfry com referências e parâmetros aprimorados ao longo dos anos.

Esse aprendizado não veio sem dor, são anos e anos de dedicação, sabemos que não é fácil, mas não imaginávamos que pudéssemos nos deparar com métodos tão rasos.

Como diria Sherlock Holmes:

Uma vez eliminado o impossível, o que sobra, por mais improvável que pareça, deve ser a verdade

Nota final

Vale reforçar que este é um debate metodológico, um exercício de decomposição numérica, ancorado em duas referências sólidas: o Censo e a projeção de um concorrente. Entre uma e outra, podem existir variáveis legítimas, como novas fontes de dados, diferentes técnicas de atualização ou até critérios de segmentação que escapem à nossa visão atual.

O que conduzimos aqui foi algo mais próximo de uma auditoria de fórmula, um processo clássico, em que hipóteses são testadas à exaustão até que reste apenas a que mais se sustenta.

Ao final dessa investigação, não apenas confirmamos a robustez dos nossos métodos, como os tornamos ainda mais transparentes e refinados.
Did this article help you?