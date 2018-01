Big data é, quase sempre, um conceito abstrato. Fora aqueles que trabalham diretamente com a montanha de dados tentando transformá-los em algo útil, os mortais em geral têm uma compreensão apenas genérica dos usos possíveis ou riscos prováveis. Uma história desta semana, porém, ajuda a explicar a aplicação política de big data. É a história de como vazou a informação sobre todos os eleitores americanos.

Bem – quase todos. Os arquivos que compõem o acervo da Deep Root Analytics, consultoria ligada ao Partido Republicano, pesam no conjunto 1,1 terabytes e contém nome, data de nascimento, endereço residencial e dados do registro eleitoral de 198 milhões dentre os 200 milhões de eleitores. Para cada uma das pessoas listadas, inclui-se ainda uma suposição a respeito da etnia e religião. Não é uma suposição à toa: segue um modelo, um algoritmo que leva em consideração nome, região em que mora, renda presumida e cruza com dados do censo para inferir qual a cor da pele, o sotaque e para que Deus reza.

A partir desta base, as identidades eram cruzadas com informações postadas publicamente pelas pessoas em redes sociais. Tudo que pudesse sugerir a opinião dos indivíduos a respeito de questões como cobrança de impostos, postura perante mudanças climáticas, imigração. Esta massa de dados pública que existe na rede é então analisada por um software de análise de sentimento, que determina se o ponto de vista é negativo, positivo ou neutro. Este conjunto, por sua vez, é cruzado com pesquisas de opinião e demografia, o que permite inferir a posição de cada indivíduo.

Sim: para cada um dos 198 milhões de indivíduos, o banco de dados atribui sua posição a respeito das grandes polêmicas políticas.

E este pacote estava livre, sem qualquer senha, disponível para quem se desse ao trabalho de fazer o download.

Segundo a consultoria, só uma pessoa o fez. É Chris Vickery, um especialista em segurança digital cujo trabalho, na empresa UpGuard, é justamente mostrar como quase ninguém se dedica o suficiente a manter informação delicada protegida. Vickery, que rastreia diretórios inseguros em servidores mundo afora, achou o acervo da Deep Root Analytics e baixou cada arquivo ao longo de pouco mais de um dia. Ao compreender do que se tratava, ele e um colega de presto buscaram seus nomes. Descobriram que a tecnologia do Partido Republicano é de primeira: as suposições a respeito de suas opiniões estavam todas corretas.

Um dos princípios de uma democracia é de que o voto é secreto e ninguém terá o poder de nos pressionar. Pois bem: o Partido Republicano sabe como votou cada americano. Individualmente. A precisão não é de 100%, mas chega perto. E tudo por conta de um mix de dados públicos e muito software de análise. Dá trabalho e custa caro montar. US$ 100 milhões de dólares é a estimativa, neste caso. Mas, para quem deseja eleger um presidente, é útil.

Este banco de dados tem muitos usos. O maior deles é que dá capilaridade e granularidade à estratégia de propaganda política. A campanha não endereça um estado ou uma cidade. Vai a um bairro, um quarteirão — até mesmo a uma casa. Sabe como pinçar itens de seu programa que vão agradar cada indivíduo. Este trabalho ainda é custoso, mas não precisa ser feito em todo o país.

Donald Trump, ora, não venceu em todo o país. Ele perdeu o voto popular. Mas, no sistema americano, em que vale a vitória em estados chaves, ele ganhou, e por margem apertada, nos distritos certos, que influenciaram o resultado de certos estados que costumam votar no Partido Democrata. E pegou todo mundo de surpresa.

Não devia. Era big data.