مراجعة Dall-E: تعرف على المزيد حول أداة إنشاء الصور المشهورة بالذكاء الاصطناعي

إذا قمت بالاشتراك في خدمة من رابط على هذه الصفحة ، فقد تحصل شركة Reeves and Sons Limited على عمولة. انظر لدينا بيان الأخلاق.

Dall-E هو برنامج ذكاء اصطناعي (AI) يقوم بإنشاء الصور بناءً على المطالبات النصية. هذا يعني أن كل ما تحتاجه لإنتاج صور عالية الجودة من خلال الذكاء الاصطناعي هو تزويد Dall-E بتعليمات واضحة بلغة طبيعية.

في وقت كتابة هذا التقرير ، تعمل الأداة القائمة على الذكاء الاصطناعي في شكل دال-E 2، وهو أحدث إصدار من البرنامج. يتوفر Dall-E 2 تجاريًا من خلال مطوره OpenAI ، والذي يقدم البرنامج من خلال واجهة الويب الخاصة به بالإضافة إلى واجهة برمجة التطبيقات (API).

من أجل معرفة ما هو Dall-E وكيف يعمل ، إليك دليل سريع لبرنامج إنشاء الصور المتطور.

النقاط الرئيسية

  • Dall-E هي أداة لتوليد الصور تعتمد على الذكاء الاصطناعي وتنتج الصور من خلال التعليمات النصية.
  • يستخدم Dall-E التعلم العميق لاستيعاب مطالبات النص وكذلك الإشارات المرئية ، وتحويل المواد المرئية ذات الصلة إلى صور متماسكة.
  • يوفر Dall-E أيضًا محرر صور لتحسين الصور الحالية من خلال إمكانات التحرير القائمة على الذكاء الاصطناعي.
  • يتوفر Dall-E كواجهة مستخدم رسومية (GUI) وواجهة برمجة تطبيقات.
  • تحتفظ بحقوق الملكية الكاملة لأي صور تقوم بإنشائها من خلال Dall-E.

كيف تولد صور AI من خلال النص؟

صورة نص dalle

Dall-E هي أداة لتوليد الصور تعمل عبر الذكاء الاصطناعي لاستيعاب التعليمات النصية وتحويلها إلى صور أصلية. من أجل تحقيق هذا العمل الفذ ، يستخدم Dall-E التعلم العميق لفهم مجموعة واسعة من الصور والمراجع.

عندما يتم تقديم مطالبة نصية ، يستخدم Dall-E تدريبه من مجموعات البيانات هذه لإنتاج صور تتطابق مع الإرشادات المقدمة. هذا يجعل من الممكن لأي شخص استخدام الذكاء الاصطناعي لتوليد الصور ، دون الحاجة إلى استخدام ترميز مكثف أو تعليمات فنية.

هذه الوظيفة هي أحد الأسباب العديدة التي جعلت Dall-E يحظى بشعبية كبيرة منذ ظهوره لأول مرة في عام 2020. كما يقدم البرنامج في أحدث إصداراته ، Dall-E 2 ، إمكانات إضافية. يتضمن ذلك خيار تحرير الصور الموجودة عن طريق إضافة عناصر مرئية جديدة أو القدرة على توسيع اللوحة عن طريق إنشاء مرئيات ذات صلة للصورة الأصلية.

من أجل استخدام Dall-E 2 ، يمكنك التوجه إلى موقع OpenAI على الويب واستخدام الأداة من خلال واجهة المستخدم الرسومية المستندة إلى الويب. حتى إذا لم تكن قد استخدمت برنامج AI من قبل ، فإن الواجهة البسيطة تجعل من السهل عليك إدخال موجه النص الخاص بك والحصول على الصور التي تريدها في المقابل.

تعمل واجهة التحرير التي تم الكشف عنها في أواخر عام 2022 بنفس طريقة البساطة. باستخدام أداة ممحاة سهلة الاستخدام ، يمكنك إزالة أجزاء صورتك التي تريد تحريرها أو تحسينها باستخدام Dall-E. من هناك ، يمكنك إضافة مطالبات نصية لإضافة عناصر جديدة إلى صورتك.

يمكنك أيضًا استخدام أداة "Generation Frame" لتوسيع مساحة الرسم وحجم الصورة الحالية. يمكنك إضافة إطار الجيل هذا نحو الأعلى أو الأسفل أو أي جانب. يمكنك أيضًا ضبط حجم هذا الإطار. بمجرد أن تنتهي من تسوية إطار التوليد وإعطائك موجهًا إلى Dall-E ، يمكنك رؤية صورتك تمتد إلى الحجم الذي تريده بينما تتماشى مع بقية العناصر المرئية والسمات وأسلوب الفن.

إعادة تصميم صورة dalle

تتيح لك هذه المقدمة السريعة فهم ما هو Dall-E وكيفية تشغيله. ولكن إذا كان لديك المزيد من الأسئلة حول كيفية عمل الأداة بالضبط سحرها ، فيمكنك المضي قدمًا في فهم الآليات التي تقف وراءها.

تستخدم Dall-E تقنيات مختلفة قائمة على الذكاء الاصطناعي لتعزيز براعتها البصرية

في حين أن Dall-E بارع بشكل لا يصدق في تحديد الصور وتكرار أسلوبها ، فإن الكفاءة لم تولد من العدم. بدلاً من ذلك ، تم تدريب Dall-E AI باستخدام شبكة عصبية تجمع بين المراجع المرئية والإشراف على اللغة الطبيعية.

تستخدم هذه الشبكة العصبية التعلم العميق ، وهو مجموعة فرعية من الذكاء الاصطناعي الذي يعالج مجموعات كبيرة من البيانات للتعرف على الموضوع المطروح. باستخدامه ، يمكن للتعلم العميق من خلال الشبكات العصبية أيضًا تصنيف أنماط مختلفة وتحديد العلاقة بين أجزاء مختلفة من البيانات.

تسمى الشبكة العصبية المستخدمة لتدريب Dall-E CLIP (التدريب المسبق على اللغة والصورة التقابلية). يستخدم CLIP إعداد التعلم بدون طلقة (ZSL) ، والذي يسمح له بتقييم العينات المرئية والمراجع النصية حتى لو لم تكن قد واجهتها من قبل. هذا ممكن من خلال مجموعات البيانات الشاملة التي تم تدريب CLIP عليها من أجل مطابقة مجموعة واحدة من informatأيون مع الآخر.

من أجل تعلم هذه المراجع المرئية والنصية ، تم تدريب Dall-E على ما لا يقل عن 12 مليار المعلمة. تقوم هذه المعلمات بتسمية صور مختلفة بمرجع نصي وتسمح لـ Dall-E بفهم ما هو متوقع منها عندما يطلب المستخدم إنشاء صورة معينة. بالإضافة إلى تمكين توليد الصور للمفاهيم المباشرة ، تتألق هذه الإمكانية أيضًا في المفاهيم المجردة مثل رسم الشخصيات المجسمة من الكائنات الجامدة.

هذا هو المكان الذي يتطابق فيه نموذج AI لـ Dall-E بشكل وثيق مع منتج آخر لمطوره OpenAI. تأتي هذه المباراة في شكل محول 3 Generative مسبق التدريب (GPT-3). بينما يقوم GPT-3 بإنشاء نص من خلال التنبؤ بما يجب أن تكون عليه الكلمة التالية في النص الذي يتم إنشاؤه ، ينتج Dall-E صورًا عن طريق تحديد كيفية إنشاء صورة كاملة وفقًا للعناصر التي يتم إنشاؤها في سلسلة.

بمجرد أن تفهم ما هو Dall-E ، يمكنك أن ترى كيف تعمل هذه الطريقة على العجائب لتوليد صور عالية الجودة من البداية. باستخدامه ، يوضح أيضًا كيفية إنشاء البرنامج للصور الممتدة وتحرير الصور الموجودة.

من خلال استخدام اختياره الرائع للمعلمات ، والشبكة العصبية المصممة بشكل هادف ، وواجهة المستخدم الرسومية البديهية ، يجعل Dall-E من السهل على الجميع الاستفادة من تقنية الذكاء الاصطناعي التوليدية سريعة التطور لإنتاج الصور.

مراجعة Dall-E: ما هي تكلفة Dall-E؟

دال- إي متاح من خلال مطوره OpenAI ، والذي يقدم ائتمانات مقابل سعر محدد. كل رصيد يساوي طلب إنشاء صورة واحدة.

هذا يعني أنك ستستخدم رصيدًا واحدًا لإنتاج صورة من موجه نص ، أو تحرير صورة حالية لإجراء تعديلات ، أو تمديد اللوحة للصورة الحالية. يوفر لك كل طلب إنشاء صورة أيضًا أربعة أشكال مختلفة. ولكن إذا طلبت المزيد من الاختلافات ، فستكلفك رصيدًا واحدًا لكل طلب.

في وقت كتابة هذا التقرير ، كان Dall-E متاحًا بسعر 115 ساعة معتمدة مقابل 15 دولارًا. تنتهي صلاحية الأرصدة التي تشتريها في غضون 12 شهرًا. يمكنك استخدام هذه الاعتمادات عبر واجهة الويب أو من خلال Dall-E API.

بشكل عام ، تعد خطة تسعير Dall-E أغلى من أقرب منافسيها ، ميدجورني و انتشار مستقر. في وقت كتابة هذا التقرير ، يبدأ سعر Midjourney من 10 دولارات مقابل 200 طلب لإنشاء الصور. كما يقدم خطة بقيمة 30 دولارًا لطلبات إنشاء المستخدمين غير المحدودة. في حين أن Stable Diffusion يتقاضى 100 دولار مقابل 100 رصيد للصورة.

ولكن بالنظر إلى أن الذكاء الاصطناعي الخاص بشركة Dall-E مُدرب بشكل مكثف ويقدم أدوات تمديد الصورة التي لا تمتلكها Midjourney و Stable Diffusion ، فإن لديها سببًا كافيًا لتسعير منتجها بمستوى أعلى. إلى جانب ذلك ، يتطلب منك Midjourney الوصول إلى البرنامج من خلال Discord. حيث أن Dall-E متاح من خلال واجهة المستخدم الرسومية على الويب وكذلك واجهة برمجة التطبيقات.

بعد معرفة ما هو Dall-E ونوع الرسوم التي يجلبها إلى الطاولة ، يصبح من السهل عليك تحديد ما إذا كان يجب عليك دفع مقابل خدماتها أم لا. أثناء القيام بذلك ، يمكنك التسجيل للحصول على الحل على أي حال والحصول على 50 رصيدًا مجانيًا على الفور. بعد ذلك ، يمكنك الحصول على 15 رصيدًا مجانيًا كل شهر. ومع ذلك ، تنتهي صلاحية هذه الاعتمادات المجانية في غضون شهر على عكس تاريخ انتهاء صلاحية الاعتمادات المدفوعة لمدة عام.

إيجابيات وسلبيات Dall-E

Dall-E 2 ، التي تم الكشف عنها في أبريل 2022 ، لديها قدرات أكثر من سابقتها. باستخدام الصور والمراجع من شبكته العصبية ، يمكن للبرنامج إنشاء صور رائعة تناسب موجهاتك في كثير من الأحيان. بالإضافة إلى ذلك ، فإن ميزاته البديهية واجهة المستخدم الرسومية وواجهة برمجة التطبيقات تسهل عليك إنتاج الصور دون الحاجة إلى استخدام أدوات تحرير الصور المعقدة.

مع ما يقال ، لا تزال Dall-E تمر بمرحلة الطفولة حيث لا يمكنك توقع الكمال في كل واحدة من صورها التي تم إنشاؤها. في حين أن البرنامج يبذل قصارى جهده لملء الفراغات التي يُضرب بها المثل أو الحرفي من خلال الصور التي يولدها ، إلا أنه لا يزال يعاني من قيود بسبب كونه جيدًا فقط مثل البيانات التي يتم التدريب عليها.

على سبيل المثال ، إذا أعطيت Dall-E موجهًا بأنه ليس له سابقة في شبكته العصبية ، فسيُنشئ أقرب صورة ممكنة لموجهتك والتي قد تلائم أو لا تناسب تعليماتك بلغتها الطبيعية. كمثال ، فكر في إعطاء البرنامج التعليمات لإنشاء "بحيرة البجع على المسرح". يمكن أن تشير بشكل جيد للغاية إلى الباليه الشهير أو بحيرة حرفية مع طيور البجع الموضوعة على خشبة المسرح.

عند إنشاء صور واقعية ، يمكنك أيضًا ملاحظة مشكلة مستمرة في تصوير الوجوه واليدين والقدمين والتفاصيل التشريحية الأخرى. في بعض الأحيان ، يولد الذكاء الاصطناعي ميزات ليست موجودة تمامًا من حيث الدقة المرئية أو الواقعية. لكن هذه مشكلة موجودة في جميع المجالات لأدوات الذكاء الاصطناعي الأخرى أيضًا.

هل Dall-E يستحق كل هذا العناء؟

إذا كنت تستمتع بكونك جزءًا من تقنية جديدة ، واللعب بميزات ممتعة ، وتحمل مشكلات وظيفية بسيطة باسم التقدم ، فقد تستحق Dall-E وقتك وأموالك. هذا صحيح بشكل خاص إذا كنت تفهم ما الذي تعمل به Dall-E من حيث القيود ولا تشعر بالإحباط عندما يتعين عليك مواجهة هذه التحديات بشكل مباشر.

ولكن هذا هو المكان الذي لديك فيه خيار مناسب في شكل أرصدة Dall-E المجانية. للتأكد من رضاك ​​عن البرنامج قبل أن تدفع ثمنه ، يمكنك المضي قدمًا في الاشتراك في النظام الأساسي وتجربته عبر أرصدة مجانية. إذا كنت راضيًا عن أداء Dall-E ، فيمكنك حينئذٍ التسجيل للحصول على الائتمانات المدفوعة التي تقدمها من خلال منصة OpenAI.

سيرجيو كوستا (دكتوراه)

يقوم سيرجيو بتدريس ريادة الأعمال والابتكار على مستويات مختلفة (البكالوريوس ، ماجستير ، ماجستير في إدارة الأعمال ، دكتوراه) بشكل رئيسي في جامعة باث ، إمبريال كوليدج لندن ، مدرسة وارويك للأعمال. وقد نشر بحثًا في مجلة الأعمال التجارية ومؤتمرات الإدارة الرائدة (AOM ، SMS ، Babson ، BAM).

التعليقات الردود 0

اترك تعليق

لن يتم نشر عنوان بريدك الإلكتروني. الحقول المشار إليها إلزامية *

التقييم *

يستخدم هذا الموقع نظام Akismet لتقليل الرسائل الضارة. تعرف كيف تتم معالجة بيانات تعليقك.