
أطلقت شركة OpenAI تحديثًا جديدًا ومهمًا لمنصة صور ChatGPT، يهدف هذا التحديث إلى الارتقاء بدقة وموثوقية توليد الصور بشكل ملحوظ، وذلك ضمن جهود الشركة الحثيثة لتلبية المتطلبات المتزايدة للشركات والعلامات التجارية التي تعتمد على الذكاء الاصطناعي في صياغة تصوراتها البصرية وإبداعاتها.
وفقًا لما أعلنته OpenAI، سيصبح هذا التحديث متاحًا لجميع مستخدمي ChatGPT، إضافةً إلى واجهة البرمجة التطبيقية (API) تحت اسم “GPT Image 1.5″، وقد أوضحت الشركة أن هذا الإصدار الجديد يستند إلى نموذج GPT 5.2، الذي حظي بإشادة واسعة من قبل المستخدمين الأوائل الذين وصفوه بأنه نقلة نوعية وقوية للاستخدامات التجارية المتنوعة.
وفي سياق متصل، صرحت فيدجي سيمو، الرئيس التنفيذي للتطبيقات في OpenAI، في منشور لها على Substack: “تجربة العديد من الناس الأولى مع ChatGPT تتضمن تحويل النصوص إلى صور، إنها طريقة سحرية لرؤية ما يمكن أن تفعله هذه التكنولوجيا، لكن واجهة الدردشة لم تكن مصممة لهذا الغرض أصلا، إنشاء وتحرير الصور هو نوع مختلف من المهام ويستحق مساحة مخصصة للرؤية البصرية”.
تحديثات موجهة للشركات مع تحسينات في التحرير الدقيق واتباع التعليمات
يبرز أحد أهم التحديثات في ChatGPT Images في تعزيز قدرته على تحرير الصور بدقة متناهية، حتى عند توليد الصورة مباشرةً عبر منصة الدردشة وليس فقط من خلال واجهة البرمجة التطبيقية، فبينما تقدم نماذج رائدة لتوليد الصور مثل ChatGPT Images، وجوجل Nano Banana، وStable Diffusion ميزات لتعديل الصور بناءً على المدخلات النصية للمستخدم، كانت هذه الميزات تعاني أحيانًا من عدم الدقة في تنفيذ التعديلات المطلوبة.
مع التحديث الأخير، أكدت OpenAI أن النموذج أصبح أكثر قدرة على الالتزام الدقيق برغبات المستخدم، مع الحفاظ على عناصر أساسية كالإضاءة، التكوين، والمظاهر الشخصية للأشخاص ثابتة ومتناسقة عبر جميع المدخلات، المخرجات، والتعديلات اللاحقة، مما يضمن اتساقًا بصريًا عاليًا.
وبات بإمكان المستخدمين الآن توجيه النموذج لإجراء معظم أنواع تحرير الصور بكفاءة، بما في ذلك إضافة عناصر جديدة، إزالة أخرى غير مرغوبة، دمج مكونات مختلفة، تبديل المواقع، وإجراء العديد من التعديلات المعقدة الأخرى التي تلبي احتياجات التصميم الاحترافية.
وقد شددت OpenAI على أن هذا النموذج الجديد “يتبع التعليمات بشكل أكثر موثوقية” مقارنة بالإصدارات السابقة، كما أصبح يتمتع بقدرة فائقة على تمثيل النصوص وتوليد حروف مقروءة بوضوح، حتى وإن كانت تلك النصوص صغيرة الحجم أو ذات كثافة عالية، بالإضافة إلى ذلك، طرأ تحسين ملحوظ على النموذج لإنشاء وجوه أصغر وأكثر دقة في الصور التي تضم مجموعات كبيرة من الأشخاص، مما يعزز واقعية الصور وكفاءتها.
وأضافت OpenAI أن “هذه التحولات تعمل بفعالية سواء للمفاهيم البسيطة أو المعقدة، وأصبح من السهل تجربتها باستخدام الأنماط والأفكار المعدة مسبقًا ضمن ميزة ChatGPT Images الجديدة – كل ذلك دون الحاجة إلى كتابة أوامر نصية مطولة، مما يسهل عملية الإبداع”.
معركة مولدات الصور
يأتي هذا التحديث البارز من OpenAI في أعقاب إطلاق جوجل لنموذج الصور المتميز “Nano Banana Pro”، الذي حظي بإشادة واسعة وتقدير كبير من مجتمع المطورين العالمي، مما يؤكد اشتداد المنافسة في هذا المجال الحيوي.
تسعى OpenAI، من خلال هذه التحديثات، إلى تعزيز موقعها التنافسي ومواكبة التطور المتسارع لنماذج توليد الصور الأخرى، والتي تزداد تطورًا بشكل مستمر، بهدف جذب المزيد من المستخدمين، لا سيما من قطاع الشركات والمؤسسات التي تبحث عن حلول بصرية مبتكرة.
ولا تقتصر المنافسة على جوجل وحدها، فقد أعلنت شركة علي بابا في أغسطس الماضي عن نموذجها “Qwen-Image” القادر على توليد نصوص قابلة للقراءة باللغتين الصينية والإنجليزية ببراعة، كما أصدرت Black Forest Labs نموذج “Flux.2” مفتوح المصدر الذي يقدم بدوره نموذج صور قويًا ومنافسًا، مما يبرز حجم التحدي والابتكار في سوق توليد الصور بالذكاء الاصطناعي.
