Por Alfredo Goldman*

Que a computação tem vencido barreiras, todos sabemos, mas uma medida interessante desse progresso é ver como sistemas de computação podem vencer grandes campeões em alguns jogos de tabuleiro. Há muito tempo os computadores são capazes de competir em jogos mais simples, desde o infame jogo da velha, passando pelo tradicional jogo de damas e chegando até a jogos como o xadrez. Como isso é feito em jogos mais simples? É relativamente fácil: por serem extremamente rápidos, os computadores conseguem explorar o universo de possibilidades futuras da partida em cada jogada, procurando escolher aquela que aumente suas chances de vencer. É como se o computador, ao invés de fazer o cálculo apenas da próxima jogada, “imaginasse” toda a progressão de todas as jogadas possíveis até todos os finais possíveis do jogo para escolher a melhor opção.

Como na maioria dos jogos o número de possibilidades é muito grande, foi criada uma técnica para diminuir o volume de casos a considerar: a técnica MiniMax. A cada turno, o computador considera apenas a melhor jogada possível e simula também apenas as melhores jogadas possíveis do adversário. Esse tipo de técnica foi bastante eficaz até meados da década de 90, mas ainda havia um desafio a ser vencido: o jogo de Xadrez. Finalmente, em 1996, um sistema da IBM foi quase capaz de ganhar do mestre mundial Garry Kasparov e, em 1997, uma versão melhorada o venceu. Com a evolução dos computadores, um programa para jogar xadrez dedicado foi capaz de ganhar do campeão mundial em 2006, rodando em um PC com processador dual-core.

No entanto, embora o Xadrez seja considerado um jogo sofisticado e dependente da “inteligência” dos jogadores, o sucesso dos computadores no xadrez não encerrou o assunto; restava ainda o jogo de Go. Graças à enorme quantidade de possibilidades de colocação de peças, esse jogo tem um universo enorme de variações possíveis, o que não permite uma boa exploração e previsão das jogadas futuras. Assim, apesar das regras extremamente simples (como diria um amigo meu, basta saber contar até 1), Go continuava sendo um desafio para os computadores e mesmo jogadores medianos eram capazes de derrotar os melhores sistemas.

Pois é, isso mudou nesta semana. Um sistema desenvolvido pela Google, o AlphaGo, foi capaz de derrotar o campeão europeu de Go, em condições de campeonato, por cinco vezes seguidas! O desafio com o campeão mundial está marcado para março.

E qual a relação disso com o Software Livre? No início deste ano, comentamos sobre a liberação do código da Google ligado a Deep Learning. Embora o AlphaGo tenha sido desenvolvido especificamente para o jogo, a abordagem básica não é específica, mas sim se utiliza dos mesmos princípios e partes do código do TensorFlow, gerando um avanço que nem mesmo os pesquisadores envolvidos pensavam que aconteceria tão rapidamente. A técnica usada, tal qual a MiniMax, também é relativamente simples: primeiro o AlphaGo foi treinado usando jogadas de experts de Go (cerca de 30 milhões). Dessa forma o sistema deveria ser capaz de jogar no mesmo nível de um expert humano. Para superá-lo, o sistema continuou jogando contra si mesmo. Nesses “jogos virtuais”, o AlphaGo realizava experiências com pequenas variações nas jogadas, aprendendo sutilezas do jogo para além daquelas com as quais foi treinado. Esse mecanismo pode ser adaptado para um sem-número de outras aplicações e, graças às ferramentas abertas existentes, o avanço oferecido pela técnica está acessível a todos os especialistas em inteligência artificial.

* Alfredo Goldman é Professor de Ciência da Computação no IME/USP e diretor do CCSL-IME/USP