في وقت سابق من هذا الأسبوع، كشفت OpenAI عن صور ChatGPT 2.0، محرك توليد الصور الجديد. يتمثل الهدف الرئيسي لهذا الإصدار في قفزة في الوظائف من إنشاء "زخارف" (حسب تعبير OpenAI) إلى رسومات كاملة الصفحات، بما في ذلك النصوص التفصيلية.

لقد حصلت على وصول مبكر إلى نسخة ما قبل الإصدار. لقد عملت بشكل جيد، لكنها استمرت في إفساد شعار ZDNET. الآن بعد أن تم إصدار المنتج رسميًا، أقوم باختباره بعمق عبر مجموعة واسعة من التحديات.

صور 2.0 متاحة لجميع مستويات ChatGPT، لكن ميزات اللغة الأكثر قدرة متاحة فقط للمستويات المدفوعة التي يمكنها استخدام نموذج التفكير. أقوم بإجراء جميع هذه الاختبارات باستخدام حساب ChatGPT Plus مع تشغيل التفكير.

لنبدأ بتمارين العلامة التجارية لـ ZDNET. بدلاً من مجرد تحميل صفحات ZDNET وجعلها تجد الشعار في الصفحة، قمت بإنشاء صورة مستقلة لشعار ZDNET وحملتها مع كل طلب. بدا أن ذلك ساعد بشكل كبير. [ملاحظة سريعة: لا تسمح ZDNET لـ OpenAI بتجميع صفحاتها. رفعت Ziff Davis، الشركة الأم لـ ZDNET، دعوى قضائية في أبريل 2025 ضد OpenAI، زاعمة أنها انتهكت حقوق الطبع والنشر لـ Ziff Davis في تدريب وتشغيل أنظمتها للذكاء الاصطناعي. لذا استخدمت إضافة Chrome لالتقاط لقطات شاشة كاملة للمقالات التي أردت اختبارها مع صور 2.0. هكذا تمكنت ChatGPT من قراءتها.]

كانت نقطة البداية هي المقالة التي كتبتها سابقًا عن صور 2.0. أعطيت ChatGPT هذا الطلب: "أنشئ إنفوجرافيك مفصل وحيوي لهذه المقالة باستخدام نمط العلامة التجارية لـ ZDNET والشعار المرفق لـ ZDNET." ليس فقط الشعار صحيحًا، ولكن التلوين مثالي لـ ZDNET. لكن المكان الذي تتألق فيه الصورة حقًا هو استخدامها للنص. جميع النصوص صحيحة، حتى النص الصغير بزاوية في الصورة.

بعد ذلك، قررت العودة إلى تحدي الرسومات التخطيطية الذي قدمته لـ Nano Banana من Google قبل بضعة أشهر. كانت المهمة في ذلك الوقت هي إنشاء نسخة رسومات تخطيطية من وثيقة الحقوق الأمريكية. قامت Nano Banana بعمل رائع مع الصور، لكن كان علي المحاولة مرارًا وتكرارًا لإقناعها بالحصول على الصياغة الصحيحة. بالنسبة لصور ChatGPT 2.0، رفعت المخاطر قليلاً. أردت رسومات تخطيطية، لكنني أردتها بأسلوب العلامة التجارية لـ ZDNET. إليك الطلب الأول: "اصنع لي رسمًا تخطيطيًا لوثيقة الحقوق الأمريكية. استخدم نمط شعار ZDNET واجعل الرسومات التخطيطية بأسلوب ZDNET." هذه هي الصورة على اليسار. إليك الطلب الثاني: "قم بتضمين شعار ZDNET وأضف المزيد من الألوان النيون، ربما على خلفية سوداء." هذه هي الصورة على اليمين. أولاً، لاحظ أن النص صحيح. لا توجد تكرارات. لا شيء مفقود. بالفعل، هذا أفضل بكثير من أداء Nano Banana. كلا النسختين تتناسبان مع أسلوب ZDNET. الشيء الوحيد الذي لا يسعدني هو أن شعار ZDNET يبدو محشورًا في الصورة الثانية. ومع ذلك، الشعار صحيح، ويمكنني القيام ببعض تمريرات الطلب الإضافية لتحسين موضعه.

لكن الآن نأتي إلى الخطأ غير المبرر الذي كشفه اختباري. طلبت من صور 2.0 تحويل مقالتي حول مقارنة بناة مواقع الذكاء الاصطناعي إلى إنفوجرافيك. أنتجت إنفوجرافيك قابل للاستخدام إلى حد ما، وإن كان مزدحمًا بعض الشيء. حتى أنها ذهبت إلى الإنترنت وأضافت معلومات لم تكن لدي في المقالة، مثل الأسعار الأساسية. ومع ذلك، أضافت أيضًا بعض الأخطاء الواقعية: كانت تقييمات النجوم خاطئة، وكان وصف منتج واحد غير صحيح، واخترعت شركة تسمى "AI Builders" غير موجودة. للإنصاف، هذه كلها أخطاء قد ينتجها مصمم جرافيك بشري داخلي في مسودة أولى. عندما أعدت توجيه صور 2.0 مع التصحيحات (باستثناء تقييمات النجوم، التي لم أصححها في الصورة الثانية)، قامت بالفعل بتعديل الإنفوجرافيك بمعلومات أكثر ملاءمة.

هذا الإصدار من صور 2.0 هو تحسين كبير مقارنة بالإصدارات السابقة. إصدار صور ChatGPT الذي نظرت إليه العام الماضي كان مثيرًا للإعجاب، خاصة لإعادة سياق الصور. هذا الإصدار الجديد، الذي يمكنه تفسير المحتوى الفعلي ثم إنشاء الصور، هو قفزة هائلة مقارنة بالإصدارات السابقة. والأهم من ذلك، يمكنه تقديم