过去一周,ZDNet的David Gewirtz一直在捣鼓OpenAI新发布的ChatGPT Images 2.0,他声称这次发布比表面看起来要重要得多。我们都对AI图像生成器印象深刻——它们能制作漂亮的图片,玩有趣的花样,并产生大量AI垃圾。但到目前为止,它们对生成内容的理解还很有限。Images 2.0为图像生成增加了主题智能,这意味着ChatGPT现在可以接收任务并产生高价值的输出——比如,重新设计你的应用用户界面,而不会让它看起来像1998年的GeoCities页面。
Gewirtz将他正在积极开发的两个UI设计输入到ChatGPT Images 2.0中(使用他每月20美元的ChatGPT Plus计划)。短短几分钟内,ChatGPT返回了两个重新设计的用户界面,两者都带来了一大堆他计划整合到产品中的设计改进。第一个是他从一月份开始用Claude Code进行“氛围编码”的Mac应用——这个项目进展缓慢,因为他每周只有一两个小时的时间来开发,而且它使用macOS的内部AI进行图像处理和分析。他上传了一张截图,并提示AI“重新设计这个用户界面,使其更具吸引力且更易用。”起初,他并不喜欢这些改动——最明显的变化是彩色按钮的丢失,而且AI没有完全理解网格视图底部有查看选项。但另一方面,新的模拟图包含了五个他计划采用的设计要点,而且有了模拟图,向Claude Code展示他想要的效果就容易多了。
接下来是他的安全产品起始页面的UI。他的设计简洁但相当初级,主要反映了他不喜欢编写CSS的事实。去年秋天,在他第一个基于代理的“氛围编码”项目中,他使用ChatGPT Plus计划中的OpenAI Codex将UI从相当丑陋重新设计为尚可接受。这次,他将截图粘贴到ChatGPT中,但意外地在输入提示前按了回车。ChatGPT自行决定分析页面,推断出“最大的问题是视觉层次薄弱,灰色过多,介绍块太长,以及三个较低的卡片在争夺注意力,尽管它们的重要性不同。”它还推荐了“更现代的管理美学”。Gewirtz随后指示它“给我一个重新定义界面的图像”,AI生成了一个设计,发明了一个标志(主要是因为他没有提供),并添加了几个他喜欢的功能,包括快速设置区、需要帮助区、配置隐私/查看文档部分以及底部的站点状态部分。
Gewirtz认为这一能力与ChatGPT最初问世时一样具有变革性,也与去年夏天代理式结对编程出现时一样重要。他向AI提交了两个产品用户界面,并收到了实质上是同行评审的评论以及一套原型设计。作为一名独立程序员,这种输出是无价的——即使他有一个完整的内部团队,包括程序员和设计师,可能也需要一周左右的时间来进行分析并构建原型供审查。仅该项目的工资支出就会相当可观。但只需20美元,他就得到了两个非常有帮助、非常有建设性且一点也不AI愚蠢的重新设计,其中包含可操作的要点,将使他的产品变得更好。