SÃO FRANCISCO - A Anthropic não tem um roteiro de longo prazo para o Claude Code, sua ferramenta de desenvolvimento de software agêntica, mas a empresa aposta que tal plano seria tornado obsoleto pelas capacidades dos modelos que melhoram rapidamente e pelo que os desenvolvedores decidirem que querem na próxima semana. Essa é a conclusão de uma conversa de 30 minutos que o Ars teve com Cat Wu, head de produto do Claude Code na Anthropic.

Na semana passada, em um estacionamento de três andares de uma locadora de carros meticulosamente convertido em um espaço para eventos no centro de São Francisco, a Anthropic realizou sua segunda conferência anual de desenvolvedores Code with Claude. O evento de um dia incluiu um keynote apresentando novos recursos para Agentes Gerenciados e anunciando um acordo de computação com a SpaceX. Esse acordo de computação veio com a duplicação dos limites de uso para usuários do Claude Code nos planos Pro e Max - uma resposta à frustração significativa dos usuários sobre a escassez de computação, especialmente nas últimas semanas.

Os produtos da Anthropic - especialmente o Claude Code - tiveram uma popularidade explosiva. "Tentamos planejar muito bem para um mundo de crescimento de 10x ao ano", disse o CEO Dario Amodei no palco. "E ainda assim vimos 80x, e essa é a razão pela qual tivemos dificuldades com computação." O crescimento de usuários foi acompanhado por uma mudança de interfaces de chat simples para fluxos de trabalho complexos com múltiplos agentes, que são muitas vezes mais exigentes. Durante a crise, a Anthropic testou soluções como impor limites mais rigorosos durante horários de pico ou remover o Claude Code de seu plano de assinatura mais barato.

No ano passado, a Anthropic lançou uma infinidade de novos recursos, produtos e superfícies para interagir com seus modelos. O Claude Code passou de CLI para IDE para desktop, e novas ferramentas para gerenciar múltiplos agentes foram lançadas. O ritmo tem sido intenso e caótico às vezes. Enquanto isso, concorrentes como Codex da OpenAI, GitHub Copilot, Cursor IDE e Augment Code estão lançando seus próprios produtos, às vezes com ganchos como contexto mais explícito que eles afirmam levar a melhores resultados.

Como head de produto do Claude Code, Wu trabalha em estreita colaboração com seu criador, Boris Cherny, para identificar quais recursos priorizar. Ela não supervisiona os modelos, mas a estratégia de produto que ela descreve aposta forte que os modelos continuarão a melhorar tão rapidamente que planejar como um produto como o Claude Code deve ser no futuro é essencialmente inútil. A equipe do Claude Code passa por ciclos de desenvolvimento de apenas uma semana ou mais, lançando recursos em um Velho Oeste de experimentação.

Quando perguntada se a CLI continua sendo o centro de gravidade, Wu observou que o uso é dividido entre todas as superfícies. "O centro de gravidade ainda é a CLI", disse ela. "Ainda é a que tem os recursos mais avançados, é onde a maioria dos nossos recursos chega primeiro, e também é a mais rápida para iterarmos." No entanto, ela observou uma mudança gradual em direção ao desktop, à medida que os desenvolvedores passavam de gerenciar um agente para seis abas de terminal e eventualmente decidiam que ler dez abas não era a ideia de um bom momento.

Sobre a questão de a Anthropic consolidar suas muitas superfícies, Wu descreveu uma progressão: a maioria começa na CLI ou IDE, depois passa para o desktop para gerenciamento de múltiplos agentes, e então querem rotinas que monitorem canais do Slack automaticamente. "Todos os produtos são apenas uma maneira de ajudar você a eliciar mais facilmente a inteligência dos modelos", disse ela. "Na verdade, removemos scaffolds. Removemos partes do prompt do sistema e descrições de ferramentas ao longo do tempo, à medida que os modelos ficam mais inteligentes." Ela pode imaginar um mundo onde tudo colapsa de volta a uma caixa de texto se o modelo estiver "sempre certo", mas por enquanto, eles precisam de todas as ferramentas.

Wu citou o ensaio de 2019 de Richard Sutton, "The Bitter Lesson", como um princípio orientador, que argumenta que métodos de propósito geral que escalam com computação acabam vencendo estruturas específicas de domínio. "Somos bastante humildes em não saber exatamente qual é o fator de forma certo, mas incentivamos nossas equipes a explorar isso o máximo possível", disse ela.

Sobre limites de computação, Wu observou que, embora existam plugins para código semântico