Por Steve Lohr*

Para humanos, a inteligência dos computadores é um mistério. As máquinas parecem ter dupla personalidade. Às vezes, são muito inteligentes. Às vezes, extremamente burras. No mês passado, o Google anunciou uma significativa revisão de seu algoritmo para ranquear os resultados de buscas. Segundo a empresa, o novo algoritmo rebaixa sites de má qualidade, criados principalmente para atrair tráfego e renda de anúncios. É um movimento para melhorar a qualidade da busca, mas também uma confissão do Google, o curador da internet, de que ele vinha sendo engambelado.

Uma semana antes, o computador Watson, da IBM, craque em responder perguntas, deu uma lavada em dois dos maiores jogadores humanos de Jeopardy, um jogo de perguntas e respostas popular na TV norte-americana. Ainda assim, em seu caminho para a vitória, Watson deu lá umas respostas absurdas, levando todos ao riso.

Os computadores são apenas tão espertos quanto seus algoritmos, programas de receitas de cálculo criados pelo homem, o bloco elementar do pensamento computacional. Quando um bom algoritmo roda em um computador poderoso, ele pode realizar façanhas incríveis. Mas algoritmos são em geral frágeis e simplórios, seguindo fórmulas, obstinadamente, como se usassem cabrestos. Eles podem ser surpreendentemente bons em tarefas definidas, como jogar xadrez. Mas são incapazes de processar coisas que humanos entendem sem o menor esforço, como nuances e senso comum.

Expandir os horizontes da inteligência dos computadores – mimetizando a compreensão humana – é um dos grandes desafios da ciência. O Watson da IBM e o algoritmo do Google destacam não só o ritmo cada vez mais rápido dos progressos mas também o quanto ainda falta a ser feito. Pesquisadores das duas empresas e um punhado de outros estudiosos estão nesse caminho. Em geral, eles focam na linguagem – coisas como programar computadores para reconhecer palavras e seus significado.

Pense nisso como a “Educação do Algoritmo”. As máquinas, desprovidas de conhecimento adquirido e da experiência de vida dos humanos, usam modelos estatísticos para chegar a resultados similares aos que as pessoas alcançariam, apenas de maneira diferente. Frederik Jelinek, um pioneiro do reconhecimento de voz, explica essa diferença em uma analogia com o ato de voar: “Aviões não batem as asas”.

Mas categorizar linguagem, com todas as suas sutilezas, continua sendo um formidável obstáculo para computadores. Por isso, o desafio de Watson foi infinitamente maior do que o aquele vencido por Deep Blue em 1997, quando o computador que jogava xadrez bateu o campeão mundial Garry Kasparov. “É muito mais difícil para um computador entender a linguagem no nível de uma criança de oito anos do que vencer o maior mestre do xadrez”, observou Oren Etzioni, cientista da computação na Universidade de Washington, em Seattle.

Os algoritmos são atalhos codificados para certos fins. Nas buscas ou no comércio, as prioridades são oferecer informação rapidamente e apresentar um potencial consumidor a um anunciante. Esses são fins perfeitamente práticos e objetivos, mas também bastante estreitos.

O Google pode ser tomado como um bibliotecário. Digite algumas palavras na caixa de buscas e ele retruca: “Eu não sei a resposta, mas tentaria esses sites”. E faz esse serviço em frações de segundo, dois bilhões de vezes por dia.

O algoritmo do Google, dizem os especialistas, é rápido e poderoso, mas razoavelmente previsível. Isso abriu a porta para empresários da web que querem fazer os seus sites “sugarem tráfego dos mecanismos de busca”, como disse Amit Singhal, um especialista em pesquisas no Google.

O Google não deu nome para nenhum dos sites de “baixa qualidade” que tinha em mente quando redesenhou o seu algoritmo. Mas os analistas concordam que o alvo pareciam ser as chamadas content farms, sites que dispõem artigos em listas, preenchendo-os com os termos mais procurados. O Essortment.com é um site que foi rebaixado depois que o Google anunciou a mudança, de acordo com a consultoria Sistrix. Um artigo típico, “25 coisas para se fazer com a sua namorada”, inclui dicas como “cozinhem juntos”, “corram uma maratona juntos”, “acampem” e “façam compras juntos”. E faz amplo uso de palavras muito procuradas, como “garotas”, “namoro”, “casamento”, “solteiros”. A página em que o texto está tem um bocado de anúncios.

Um algoritmo mais inteligente, Singhal diz, faz que o Google não caia mais nesses truques. “Os truques baixos serão reconhecidos como truques baixos”, garante.

O futuro de mecanismos de busca, como o Google ou o Bing, será explorar os avanços no processamento da linguagem para que virem máquinas de dar respostas – algo como o Watson, mas na forma de um serviço. Eles já caminham nessa direção. Digite no Google: “Qual o tamanho do Empire State Building?”. O primeiro resultado não é um link, mas uma resposta: 381 metros.

* Steve Lohr é repórter de tecnologia do New York Times

