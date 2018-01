Não há maratona hacker sem problemas a serem resolvidos. Faz parte do processo. Solucionar e consertar são forças motrizes da cultura hacker desde seu início, nos anos 50 e 60. E em um evento que usa como bases dados públicos, os problemas são abundantes.

Faltam poucas horas para a maratona acabar, e há participantes parados no mesmo problema desde ontem. Mas isso não desanima – pelo contrário.

Muitas das bases de dados utilizadas pelas equipes do Hackatão nunca haviam sido tocadas antes (e, talvez, os responsáveis por elas não imaginassem que dali sairiam análises como as que estão sendo produzidas aqui). A boa notícia é que agora elas estão no foco. E, com isso, aumenta a responsabilidade do poder público sobre o que ele faz – e como as informações serão disponibilizadas ao público.

As dificuldades:

Conseguir os dados. A matéria prima de uma maratona de programação são as bases de dados do governo ou outras instituições. Ter acesso a eles é a primeira dificuldade. A Lei de Acesso à Informação, que entrou em vigor em maio, é uma ferramenta poderosa para obrigar o governo a fornecer os dados necessários para determinada análise. Mas, ainda assim, é preciso uma mudança de mentalidade nos servidores em relação à transparência. No portal Queremos Saber, por exemplo, há vários pedidos de informação negados pelos órgãos públicos, por várias justificativas.

Os dados devem estar padronizados. Os governos têm de divulgar informações em formatos abertos, acessíveis e legíveis por máquina. Não adianta divulgar relatórios em PDF. O PDF é um documento fechado – para editá-lo é preciso executar conversões. O formato ideal é em XML, JSON ou CSV.

Uma vírgula muda tudo. Para transformar um texto em algo que uma máquina entenda como dado nem uma vírgula – literalmente – pode estar fora do lugar. É muito comum, por exemplo, relatórios apresentarem números em diferentes formatos: 1,999 ou 1.999. Isso para um humano pode significar a mesma coisa, mas para o computador não. O mesmo vale para maiúsculas e minúsculas e contagem de espaços.

E o foco? Você tem a base de dados. O computador é capaz de trabalhar com eles, criando visualizações e aplicativos sobre aquilo. Mas o que? Como definir o que é relevante e relativamente simples de ser trabalhado no período de 24 horas?

Não é fácil. Mas vale a pena.