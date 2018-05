Google Scott Huffman, responsável pelo desenvolvimento do assistente pessoal Google Assistant

O engenheiro que lidera os esforços para aprimorar o assistente pessoal do Google já “respira” inteligência artificial há mais de 20 anos e, por isso, não se impressiona fácil com os últimos avanços nessa área, que se tornou a próxima fronteira para as gigantes de tecnologia. Em entrevista exclusiva ao Estado, Scott Huffman explicou que o fato de o Assistant conversar por telefone com humanos para agendar compromissos não significa que ele possa “falar” sobre qualquer coisa. “O sistema aprendeu a ter aquele tipo específico de conversa”, diz.

Na entrevista a seguir, Huffman conta quais são os próximos desafios técnicos para aprimorar o assistente pessoal e como isso pode ajudar o Google a ganhar mais dinheiro no futuro.

Estado: Hoje, o assistente pessoal representa o maior desafio do Google em inteligência artificial?

Scott Huffman: O desafio está em juntar várias tecnologias, como reconhecimento de voz, inteligência artificial e aprendizado de máquina num produto só. Cada uma delas está num estágio diferente de desenvolvimento e fazer tudo funcionar em conjunto é algo complexo.

A demonstração do Google Duplex representa um salto. Qual é o próximo passo?

Há muito trabalho pela frente. A demonstração mostra que estamos tentando deixar o Assistant mais natural, mas ele ainda soa um pouco estranho. É como se eu chamasse seu nome e você esperasse dois segundos para responder. Aprimorar é preciso pois já percebemos que, conforme a conversa acontece mais naturalmente, as pessoas usam mais o assistente.

Como foi a evolução da tecnologia de reconhecimento de voz nos últimos anos?

Durante muito tempo, a preocupação estava em entender as palavras da forma correta. Os sistemas tinham que aprender a ignorar os ruídos, os sotaques e entender apenas a palavra dita, da forma certa. Nós já fazemos isso muito bem. Por isso, agora estamos voltando nossa atenção a situações um pouco mais complexas, como entender o que as crianças estão falando, entender como pessoas diferentes falam, identificar as palavras mesmo quando a pessoa está longe do dispositivo. Estamos progredindo em todas essas coisas, mas ainda há muito trabalho a fazer para entender qualquer pessoa em qualquer contexto, de forma que possamos chegar mais próximo ao nível de entendimento dos humanos.

Como o Google pretende ganhar dinheiro com o Assistant?

Já pensamos sobre isso, mas não é nosso foco agora. Queremos fazer milhões de pessoas usarem o serviço e torná-lo parte da vida delas. Quando isso acontecer, o assistente fará várias coisas, incluindo operações comerciais e transacionais, e o modelo de negócio será claro. Diria que, se conseguirmos muitos usuários, transformar o Assistant em negócio é a parte fácil.

Por que o Google Duplex impressionou o público?

As pessoas acreditam que nós criamos um sistema de inteligência artificial para qualquer propósito, que pode fazer qualquer ligação, mas isso definitivamente não é verdade. O Duplex é uma tecnologia para conversas muito específicas e estruturadas. Com base em milhares de ligações sobre reservas em restaurantes, por exemplo, o sistema aprendeu a manter aquele tipo de conversa. Mas isso é tudo que ele pode fazer.

Por que o Google decidiu criar o Duplex?

Acho que a motivação estava clara. No caso de empresas maiores, elas conseguem investir mais para oferecer agendamento online, por exemplo. Quando as pessoas podem usar um sistema como o Open Table para fazer uma reserva em um restaurante, isso é muito bom: dá mais visibilidade para os negócios, é mais conveniente para o consumidor. Hoje, pelo menos 60% dos pequenos negócios, mesmo nos EUA, não estão online. Ou seja, eles não estão obtendo vantagens de nenhum sistema. Então, pensamos em como poderíamos engajar nossos usuários com esses negócios, de uma forma que o nosso usuário sinta que seja muito fácil e transparente. Esse recurso faz isso, ao mesmo tempo que não obriga esses negócios a fazer investimentos para se tornar online.

Algum tipo de uso do assistente pessoal do Google já o surpreendeu?

No carro, os usuários querem navegar em mapas, quer ouvir música. Como são ações simples, o Assistant não deveria nunca dizer “Eu não posso te ajudar”. Os engenheiros investigaram os erros e eles surpreenderam. O Assistant consegue entender quando as pessoas dizem ligue para minha mãe, ligue para minha esposa, mas nós não estávamos conseguindo lidar com as pessoas dizendo ligue para meu docinho, ligue para minha querida, ligue para meu bebê. O Assistant não entendia o que as pessoas queriam dizer com isso e só respondia que não poderia ajudar.Para resolver, nós adicionamos todas essas opções, então se a pessoa disser ligue para o meu docinho, o Assistant diz “Sim, mas quem é o seu docinho?” (risos)

Com os avanços em inteligência artificial, há a preocupação sobre privacidade de dados dos usuários. Como lidar com essa questão?

A postura do Google tem sido a mesma nos últimos anos, focando em dar transparência e controle aos usuários. Com o Assistant, as interações vão poder ser controladas pelo usuário. Mas o que tentamos mostrar é que o Assistant oferece uma experiência melhor se ele souber coisas sobre você. É como ocorre hoje, com um assistente humano.

Quando você pensa sobre o futuro, como acha que será a experiência de usar o Assistant daqui a cinco anos?

Eu acho que algumas coisas serão diferentes. Hoje, os usuários tem tentar entender o que o Assistant pode fazer o que ele não pode fazer. Ele toca uma música, ele me diz a previsão do tempo e ele pode ser um timer, mas ele pode fazer milhões de coisas, mas as pessoas não sabem. Acho que onde estou querendo chegar é uma analogia com a busca. Ninguém pensa no que a busca do Google pode fazer ou não, as pessoas meio que sabem que ao digitar qualquer coisa na busca, ela vai retornar os resultados. É aí que precisamos chegar com o Assistant: se eu quiser encomendar flores, ele poderá fazer isso, se eu quiser fazer uma pergunta, ele responderá, se eu quiser jogar um jogo, ele jogará. O Assistant precisa fazer o que eu pedir. Eu acho que estamos avançando rápido nessa direção.