SAN FRANCISCO - Anthropic no tiene una hoja de ruta a largo plazo para Claude Code, su herramienta de desarrollo de software agente, pero la empresa apuesta a que dicho plan quedaría obsoleto por las capacidades del modelo que mejoran rápidamente y por lo que los desarrolladores decidan que quieren la próxima semana. Esa es la conclusión de una conversación de 30 minutos que Ars tuvo con Cat Wu, directora de producto de Claude Code en Anthropic.
La semana pasada, en un estacionamiento de alquiler de autos de tres niveles meticulosamente convertido en un espacio para eventos en el centro de San Francisco, Anthropic celebró su segunda conferencia anual de desarrolladores Code with Claude. El evento de un día incluyó una presentación principal que presentó nuevas funciones para Managed Agents y anunció un acuerdo de cómputo con SpaceX. Ese acuerdo de cómputo vino con una duplicación de los límites de uso para los usuarios de Claude Code en los planes Pro y Max, una respuesta a la significativa frustración de los usuarios por la escasez de cómputo, especialmente en las últimas semanas.
Los productos de Anthropic, especialmente Claude Code, han tenido una popularidad desbocada. "Intentamos planificar muy bien para un mundo de crecimiento de 10x por año", dijo el CEO Dario Amodei en el escenario. "Y sin embargo, vimos 80x, y esa es la razón por la que hemos tenido dificultades con el cómputo". El crecimiento de usuarios fue acompañado por un cambio de interfaces de chat simples a flujos de trabajo complejos de múltiples agentes que son muchas veces más exigentes. Durante la escasez, Anthropic probó soluciones como imponer límites más estrictos durante las horas pico o eliminar Claude Code de su plan de suscripción más barato.
En el último año, Anthropic ha lanzado una plétora de nuevas funciones, productos y superficies para interactuar con sus modelos. Claude Code pasó de CLI a IDE a escritorio, y se implementaron nuevas herramientas para gestionar múltiples agentes. El ritmo ha sido intenso y caótico a veces. Mientras tanto, competidores como Codex de OpenAI, GitHub Copilot, Cursor IDE y Augment Code están lanzando sus propios productos, a veces con ganchos como un contexto más explícito que afirman conduce a mejores resultados.
Como directora de producto de Claude Code, Wu trabaja estrechamente con su creador, Boris Cherny, para identificar qué funciones priorizar. Ella no supervisa los modelos, pero la estrategia de producto que describe apuesta fuertemente a que los modelos seguirán mejorando tan rápidamente que planificar cómo debería ser un producto como Claude Code en el futuro es esencialmente inútil. El equipo de Claude Code pasa por ciclos de desarrollo de solo una semana más o menos, lanzando funciones en un Lejano Oeste de experimentación.
Cuando se le preguntó si la CLI sigue siendo el centro de gravedad, Wu señaló que el uso está dividido entre todas las superficies. "El centro de gravedad sigue siendo la CLI", dijo. "Sigue siendo la que tiene las funciones más avanzadas, es donde aterrizan la mayoría de nuestras funciones primero, y también es la más rápida para iterar". Sin embargo, observó un cambio gradual hacia el escritorio a medida que los desarrolladores pasaban de gestionar un agente a seis pestañas de terminal y eventualmente decidieron que leer diez pestañas no era su idea de un buen momento.
Sobre la cuestión de si Anthropic podría consolidar sus muchas superficies, Wu describió una progresión: la mayoría comienza en CLI o IDE, luego pasan al escritorio para la gestión de múltiples agentes, y luego quieren rutinas que vigilen canales de Slack automáticamente. "Todos los productos son solo una forma de ayudarte a elicitar más fácilmente la inteligencia de los modelos", dijo. "En realidad, eliminamos andamios. Eliminamos partes del prompt del sistema y descripciones de herramientas con el tiempo a medida que los modelos se vuelven más inteligentes". Puede imaginar un mundo donde todo colapsa de nuevo a una caja de texto si el modelo es "siempre correcto", pero por ahora, necesitan todas las herramientas.
Wu citó el ensayo de Richard Sutton de 2019 "The Bitter Lesson" como principio rector, que argumenta que los métodos de propósito general que escalan con el cómputo finalmente ganan sobre las estructuras específicas de dominio. "Somos bastante humildes acerca de no saber exactamente cuál es el factor de forma correcto, pero alentamos a nuestros equipos a explorar eso tanto como sea posible", dijo.
Sobre los límites de cómputo, Wu señaló que aunque existen complementos para código semántico