이번 주 초, OpenAI는 새로운 이미지 생성 엔진인 ChatGPT Images 2.0을 공개했다. 이번 릴리스의 핵심은 '장식'(OpenAI의 표현)에서 전체 페이지 그래픽, 특히 세부 텍스트가 포함된 그래픽을 생성하는 기능으로 도약했다는 점이다.

나는 사전 출시 버전에 조기 접근할 수 있었다. 꽤 잘 작동했지만 ZDNET 로고에서 계속 실수를 했다. 이제 제품이 공식 출시되었으므로, 다양한 난제에 걸쳐 심층 테스트를 진행하고 있다.

Images 2.0은 모든 ChatGPT 티어에서 사용할 수 있지만, 더 강력한 언어 기능은 Thinking 모델을 사용할 수 있는 유료 티어에서만 사용할 수 있다. 나는 Thinking을 켠 상태에서 ChatGPT Plus 계정을 사용하여 모든 테스트를 실행하고 있다.

ZDNET 브랜딩 연습부터 시작해보자. ZDNET 페이지를 업로드하고 페이지에서 로고를 찾도록 하는 대신, ZDNET 로고의 독립형 이미지를 만들어 각 프롬프트와 함께 업로드했다. 이것이 엄청난 도움이 된 것 같다. [한 가지 빠른 참고: ZDNET은 OpenAI가 자사 페이지를 스크래핑하는 것을 허용하지 않는다. ZDNET의 모회사인 Ziff Davis는 2025년 4월 OpenAI를 상대로 소송을 제기했으며, OpenAI가 AI 시스템 훈련 및 운영에서 Ziff Davis의 저작권을 침해했다고 주장했다. 그래서 나는 Chrome 확장 프로그램을 사용하여 Images 2.0으로 테스트하고 싶은 기사의 전체 화면 스크린샷을 캡처했다. 그렇게 ChatGPT가 이를 읽을 수 있었다.]

내 시작점은 내가 이전에 Images 2.0에 대해 쓴 기사였다. 나는 ChatGPT에 다음 프롬프트를 입력했다: "이 기사를 ZDNET 브랜드 스타일과 첨부된 ZDNET 로고를 사용하여 상세하고 생생한 인포그래픽으로 만들어 주세요." 로고가 정확할 뿐만 아니라 색상도 ZDNET에 완벽하다. 하지만 이미지가 진정으로 빛나는 부분은 텍스트 사용이다. 모든 텍스트가 정확하며, 이미지에서 비스듬히 있는 작은 텍스트조차도 정확하다.

다음으로, 나는 몇 달 전 Google의 Nano Banana에 준 스케치노트 챌린지를 다시 살펴보기로 했다. 당시 과제는 미국 권리장전의 스케치노트 버전을 만드는 것이었다. Nano Banana는 이미지 측면에서 훌륭한 작업을 했지만, 텍스트를 정확하게 만들기 위해 여러 번(정말 여러 번) 시도해야 했다. ChatGPT Images 2.0의 경우, 약간 난이도를 높였다. 스케치노트를 원했지만, ZDNET의 브랜딩 스타일로 원했다. 첫 번째 프롬프트는 다음과 같다: "미국 권리장전의 스케치노트를 만들어 주세요. ZDNET 로고 스타일을 사용하고 스케치노트를 ZDNET 스타일로 만들어 주세요." 그것이 왼쪽 이미지다. 두 번째 프롬프트는 다음과 같다: "ZDNET 로고를 포함하고, 아마도 검은 배경에 더 많은 네온 스타일 색상을 추가해 주세요." 그것이 오른쪽 이미지다. 먼저, 텍스트가 정확하다는 점에 주목하라. 중복이 없다. 누락된 것도 없다. 이미 이것은 Nano Banana의 성능보다 훨씬 뛰어나다. 두 버전 모두 ZDNET 스타일에 잘 맞는다. 유일하게 마음에 들지 않는 점은 두 번째 이미지에서 ZDNET 로고가 억지로 끼워 넣어진 것처럼 보인다는 것이다. 그래도 로고는 정확하며, 몇 번 더 프롬프트를 시도하면 더 잘 배치할 수 있을 것이다.

하지만 이제 내 테스트에서 드러난 불필요한 실수에 이르렀다. 나는 Images 2.0에게 내 AI 웹사이트 빌더 대결 기사를 인포그래픽으로 변환해 달라고 요청했다. 그것은 꽤 사용할 만하지만 다소 복잡한 인포그래픽을 생성했다. 심지어 인터넷에 접속하여 기본 가격과 같이 기사에 없던 정보를 추가했다. 그러나 몇 가지 사실 오류도 추가했다: 별점이 잘못되었고, 한 제품 설명이 부정확했으며, 존재하지 않는 'AI Builders'라는 회사를 만들어냈다. 공정하게 말하면, 이 모든 오류는 사내 인간 그래픽 디자이너가 첫 번째 초안에서 만들 수 있는 오류다. 내가 Images 2.0에 수정 사항을 다시 프롬프트했을 때(두 번째 이미지에서 별점은 수정하지 않았지만), 그것은 더 적절한 정보로 인포그래픽을 올바르게 수정했다.

이 Images 2.0 릴리스는 이전 버전에 비해 엄청난 개선이다. 내가 작년에 살펴본 ChatGPT Images 버전은 특히 이미지 재맥락화 측면에서 인상적이었다. 실제 콘텐츠를 해석한 다음 이미지를 생성할 수 있는 이 새로운 버전은 이전 빌드에 비해 큰 도약이다. 더 중요한 점은, 그것이 전달할 수 있다는 것이다.