Na semana passada, David Gewirtz, do ZDNet, tem explorado o novo lançamento do ChatGPT Images 2.0 da OpenAI, que ele afirma ser um lançamento muito mais consequente do que parece. Todos ficamos impressionados com os geradores de imagem de IA - eles fazem imagens bonitas, realizam truques divertidos e produzem muito lixo de IA. Mas até agora, eles têm sido limitados em sua compreensão do que estão produzindo. O Images 2.0 adiciona inteligência de assunto à geração de imagens, o que significa que o ChatGPT agora pode receber tarefas e produzir resultados de alto valor - como, por exemplo, redesenhar a interface do usuário do seu aplicativo sem fazê-la parecer uma página do GeoCities de 1998.
Gewirtz alimentou dois designs de UI nos quais está trabalhando ativamente no ChatGPT Images 2.0 em seu plano ChatGPT Plus de $20/mês. Em poucos minutos, o ChatGPT retornou duas interfaces de usuário redesenhadas, ambas resultando em um monte de melhorias de design que ele planeja incorporar em seus produtos. O primeiro era um aplicativo Mac que ele vem codificando com o Claude Code desde janeiro - um projeto que está demorando porque ele só tem uma ou duas horas por semana para trabalhar nele, e usa a IA interna do macOS para processamento e análise de imagens. Ele enviou uma captura de tela e pediu à IA: "Redesenhe esta interface de usuário para torná-la mais atraente e fácil de usar." No início, ele não gostou das alterações - a mudança mais óbvia foi a perda dos botões coloridos, e a IA não entendeu bem que há opções de visualização na parte inferior da visualização em grade. Mas, por outro lado, o novo mockup incluía cinco notas de design que ele planeja incorporar, além de ter um mockup facilitar muito mostrar ao Claude Code o que ele quer que faça.
Em seguida, veio a UI para a página inicial de seu produto de segurança. Seu design era limpo, mas bastante rudimentar, refletindo principalmente o fato de que ele não gosta de codificar em CSS. No outono passado, em seu primeiro projeto de codificação por vibração baseado em agente, ele usou o Codex da OpenAI em seu plano ChatGPT Plus para redesenhar a UI de bastante feia para inofensiva. Desta vez, ele colou a captura de tela no ChatGPT, mas acidentalmente apertou Enter antes de dar um prompt. O ChatGPT decidiu por conta própria analisar a página, deduzindo que "Os maiores problemas são hierarquia visual fraca, muito cinza, um bloco de introdução muito longo e três cartões inferiores que competem igualmente por atenção, embora não sejam igualmente importantes." Também recomendou uma "estética administrativa mais moderna." Gewirtz então instruiu: "Forneça-me uma imagem da interface redefinida", e a IA produziu um design que inventou um logotipo (principalmente porque ele não havia fornecido um) e adicionou vários recursos que ele gostou, incluindo uma zona de Configuração Rápida, uma zona de Precisa de Ajuda, uma seção Configurar Privacidade/Ver Documentos e uma seção Status do Site na parte inferior.
Gewirtz sente que essa capacidade é tão revolucionária quanto o ChatGPT foi quando foi lançado, e tão inovadora quanto a programação em parceria com agente foi quando chegou no verão passado. Ele submeteu duas interfaces de usuário de produtos à IA e recebeu essencialmente comentários revisados por pares, juntamente com um conjunto de designs de protótipo. Como programador solo, essa saída é inestimável - mesmo que ele tivesse uma equipe interna completa com programadores e designers, provavelmente levaria cerca de uma semana para realizar essa análise e construir protótipos para revisão. Apenas as despesas com folha de pagamento para esse projeto teriam sido bastante substanciais. Mas por $20, ele recebeu dois redesigns muito úteis, muito construtivos e nada estúpidos de IA, que continham pepitas acionáveis que tornarão seus produtos melhores.