Mustafa Suleyman, CEO de IA da Microsoft, declarou recentemente na MIT Technology Review que a computação está no limiar de "agentes quase humanos". O que é ótimo, supondo que consigamos evitar que eles enviem acidentalmente seus registros médicos privados para um estranho.

De acordo com o relatório State of AI Agents da Databricks, apenas 19% das organizações implantaram agentes de IA, e mesmo assim principalmente de forma limitada. Craig Wiley, chefe de IA da Databricks, disse ao ZDNET que os CFOs têm três preocupações: controle, qualidade e custo. Ou seja, basicamente as mesmas preocupações que têm com seus filhos adolescentes, mas com mais vazamento de dados.

A primeira boa prática de Wiley é governança – especificamente, controlar quais dados um agente pode acessar. Ele apontou para o aplicativo de saúde feminina Flow, que tem 75 milhões de usuárias e um medo legítimo de misturar o gráfico de ovulação de uma pessoa com o de outra. "A última coisa que eles querem é que um usuário do aplicativo receba uma resposta que inclua informações de outro usuário", disse Wiley, com o eufemismo de um homem que nunca viu uma manchete de violação de dados.

A gestora de ativos Franklin Templeton enfrenta um desafio semelhante com relatórios de portfólio. Ninguém quer receber um e-mail de seu consultor financeiro que comece com "Prezado Cliente, aqui está o patrimônio líquido de outra pessoa". Wiley enfatiza que a segmentação de dados deve ser "forçada deterministicamente", não meramente sugerida em um prompt – porque a IA, como um estagiário distraído, seguirá o caminho de menor resistência.

A segunda prática é avaliação. Quando os desenvolvedores do Flow precisaram garantir precisão, eles não pediram a programadores para julgar a saída; pediram a médicos de verdade. "Os programadores de software escrevem o chamado sistema de orquestração", explicou Wiley, "mas foram os médicos que disseram: 'esta resposta aqui precisa de contexto ou cor adicional'." A avaliação deve ser contínua, verificando não apenas as respostas finais, mas cada etapa intermediária do pensamento do agente. Empresas que fazem isso têm seis vezes mais chances de colocar agentes em produção – o que é um testemunho da avaliação ou uma condenação veemente de todos os outros.

A terceira preocupação, custo, é essencialmente a recompensa por fazer as duas primeiras coisas corretamente. "Depois que você consegue fazer essas duas coisas, para ser honesto, o resto se torna detalhes de implementação", disse Wiley. Mas o custo deve ser considerado antecipadamente: "Isso é algo que podemos resolver hoje dentro de um envelope de custo razoável? E supondo que possamos resolver, isso realmente vai mover o ponteiro na sua empresa?"

Wiley aconselha começar pequeno. A rede de lojas de conveniência 7-Eleven construiu um "super assistente" para técnicos de serviço que acessa toneladas de documentação sobre equipamentos, reduzindo a necessidade de ligar para um colega e perguntar: "Você já viu esse problema antes?" O resultado: um aumento de 25% nas taxas de reparo na primeira visita e uma queda de 40% no tempo de reparo. A Universidade Baylor usa agentes para revisar gravações de chamadas com potenciais alunos, analisando fatores de decisão que anotadores humanos inevitavelmente perdem.

A automação da análise de portfólio de investimentos da Franklin Templeton identificou mais de US$ 15 milhões em oportunidades de novos produtos – presumivelmente ao notar lacunas nos portfólios dos clientes que os humanos estavam ocupados demais para ver.

Wiley compara o estado atual da IA agêntica a "o equivalente a 2001 na web, onde as empresas estão investindo em suas páginas da web, mas não entendem realmente o propósito de tudo isso ainda". A principal lição: organize seus dados primeiro. "Se seus dados estão em boa forma, poderíamos fazer isso [construir e implantar um sistema agêntico] esta tarde", disse Wiley. "Se seus dados estão em má forma, então o verdadeiro problema será quanto tempo levaremos para colocar seus dados em ordem."

Então, o caminho para agentes quase humanos é pavimentado com dados limpos, avaliação rigorosa e a esperança eterna de que sua IA não revele acidentalmente seus segredos mais profundos a um estranho. Bem-vindo ao futuro.