DALL-Eهو أحد النماذج الذكية التي أطلقتها شركة OpenAI، ويُعتبر أداة مبتكرة في مجال توليد الصور من النصوص. إصداره الأول كان سيئا مقارنة بالبديل الموجود (Midjourney). ولكنه، تطور خلال ثلاثة أعوام بثلاث نسح مختلفة. في العام الماضي، أصدرت OpenAI نسخة جديدة من DALL-E، وكانت هذه النسخة محط اهتمام كبير. قررت استخدامها من وقتها للتجربة.
كمميزات، فإن Dall-E تتيح استخدام أكثر من واجهة، ويمكن استخدامه عبر ChatGPT بسهولة. هذا يسهل كتابة الأمر، والتعديل عليه. ولاتصاله بنموذج لغوي، فهو يستوعب الأوامر بشكل دقيق؛ بحيث يفهم الأمر أولا ثم يطبقه. هذه الطبيعة القصصية، وفهمه العميق للكلمات هي ميزة Dall-E التي لا يضاهيها فيه أي أداة موجودة حاليا. لا يقوم بمشاركة الصور التي قمت بإنتاجها على العام، وأرخص عموما.
أما عن السلبيات، فهو أسوأ من MJ عندما يتعلق الأمر بالصور الواقعية (غالبا يقوم بذلك عن عمد لمحاولته الالتزام بمعايير معينة). هو محدود أكثر في عدد الصور. وإذا دخلت في وقت ضغط، يصبح أبطأ من عادته في إنتاج الصور. النقطة الأكبر في السلبيات الرقابة المشددة على المحتوى، بما في ذلك حظر الصور التي تتعلق بالعلامات التجارية المعروفة، الشخصيات المعروفة، إلخ. فإذا طلبت منه مثلا أن يصنع رسما بأسلوب أحد الفنانين يرفض. ومنذ يومين، طلبت منه صورة لمعركة ووصفتها، فرفض لتصنيفه ذلك بالعنف. ومؤخرا، شهدت تجربتي تحولًا ملاحظا؛ بحيث تدهورت جودة الصور مقارنة بما كانت عليه في السابق (غالبا بسبب تعديلات يقومون بها).
أحد المشكلات الكبيرة أيضا هي الكتابة في الصورة. هي أفضل من النسخة السابقة، ولكنها ما زالت سيئة للأسف. من بين كل 100 صورة، تجد مثلا 10 بكتابة صحيحة. هذا مثال أنشأته مؤخرا:
إذا خضتم تجربة إنتاج الصور بأي من الأدوات المتاحة حاليا، كيف كانت تجربتكم؟
التعليقات