Dall-E एक आर्टिफिशियल इंटेलिजेंस (AI) प्रोग्राम है जो टेक्स्ट प्रॉम्प्ट के आधार पर इमेज जेनरेट करता है। इसका मतलब यह है कि आपको एआई के माध्यम से उच्च गुणवत्ता वाली छवियों का उत्पादन करने के लिए डल-ई को प्राकृतिक भाषा में स्पष्ट निर्देश प्रदान करने की आवश्यकता है।
लेखन के समय, एआई-आधारित उपकरण के रूप में कार्य करता है दल-ई 2, जो प्रोग्राम का नवीनतम संस्करण है। Dall-E 2 अपने डेवलपर OpenAI के माध्यम से व्यावसायिक रूप से उपलब्ध है, जो प्रोग्राम को अपने वेब इंटरफ़ेस के साथ-साथ अपने एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस (API) के माध्यम से पेश करता है।
यह जानने के लिए कि Dall-E क्या है और यह कैसे काम करता है, यहाँ इस अत्याधुनिक छवि निर्माण कार्यक्रम के लिए एक त्वरित मार्गदर्शिका दी गई है।
प्रमुख बिंदु
- Dall-E एक AI-आधारित इमेज जनरेशन टूल है जो टेक्स्ट निर्देशों के माध्यम से इमेज बनाता है।
- Dall-E पाठ संकेतों के साथ-साथ दृश्य संकेतों को आत्मसात करने के लिए गहन शिक्षण का उपयोग करता है, और संबंधित दृश्य सामग्री को सुसंगत छवियों में बदल देता है।
- डल-ई एआई-आधारित संपादन क्षमताओं के माध्यम से मौजूदा छवियों को बढ़ाने के लिए एक छवि संपादक भी प्रदान करता है।
- Dall-E एक ग्राफिकल यूजर इंटरफेस (GUI) और एक एपीआई दोनों के रूप में उपलब्ध है।
- आपके द्वारा Dall-E के माध्यम से उत्पन्न की गई किसी भी छवि पर आपके पास पूर्ण स्वामित्व अधिकार है।
आप पाठ के माध्यम से AI इमेज कैसे उत्पन्न करते हैं?
Dall-E एक इमेज जनरेशन टूल है जो टेक्स्ट निर्देशों को आत्मसात करने और उन्हें मूल इमेज में बदलने के लिए AI के माध्यम से काम करता है। इस उपलब्धि को हासिल करने के लिए, डल-ई छवियों और संदर्भों के व्यापक सेट को समझने के लिए गहन शिक्षा का उपयोग करता है।
जब इसे टेक्स्ट प्रॉम्प्ट दिया जाता है, तो Dall-E उन डेटासेट से अपने प्रशिक्षण का उपयोग करता है ताकि प्रदान किए गए निर्देशों से मेल खाने वाली छवियां तैयार की जा सकें। यह व्यापक कोडिंग या तकनीकी निर्देशों का उपयोग किए बिना, किसी के लिए छवि निर्माण के लिए एआई का उपयोग करना संभव बनाता है।
यह कार्यक्षमता उन कई कारणों में से एक है जिसकी वजह से Dall-E 2020 में अपनी शुरुआत के बाद से इतना लोकप्रिय हो गया है। अपने नवीनतम पुनरावृत्ति, Dall-E 2 में, कार्यक्रम अतिरिक्त क्षमताएं भी प्रदान करता है। इनमें नए दृश्य तत्वों को जोड़कर मौजूदा छवियों को संपादित करने का विकल्प या मूल छवि के लिए संबंधित दृश्य बनाकर कैनवास का विस्तार करने की क्षमता शामिल है।
Dall-E 2 का उपयोग करने के लिए, आप OpenAI की वेबसाइट पर जा सकते हैं और वेब-आधारित GUI के माध्यम से टूल का उपयोग कर सकते हैं। यहां तक कि अगर आपने पहले कभी एआई प्रोग्राम का उपयोग नहीं किया है, तो सरल इंटरफ़ेस आपके लिए अपना टेक्स्ट प्रॉम्प्ट दर्ज करना और बदले में अपनी वांछित छवियां प्राप्त करना आसान बनाता है।
2022 के अंत में अनावरण किया गया संपादन इंटरफ़ेस सरलता के समान दृष्टिकोण के साथ काम करता है। उपयोग में आसान इरेज़र टूल से, आप अपनी छवि के उन हिस्सों को हटा सकते हैं जिन्हें आप Dall-E के साथ संपादित या बढ़ाना चाहते हैं। वहां से, आप अपनी इमेज में नए तत्व जोड़ने के लिए टेक्स्ट प्रॉम्प्ट जोड़ सकते हैं।
आप मौजूदा छवि के कैनवास और आकार को बढ़ाने के लिए "जेनरेशन फ्रेम" टूल का भी उपयोग कर सकते हैं। आप इस पीढ़ी के फ्रेम को ऊपर, नीचे या दोनों ओर जोड़ सकते हैं। आप इस फ्रेम के आकार को भी समायोजित कर सकते हैं। एक बार जब आप जेनरेशन फ्रेम तय कर लेते हैं और Dall-E को एक संकेत दे देते हैं, तो आप अपनी छवि को अपने वांछित आकार तक विस्तारित होते हुए देख सकते हैं, जबकि इसके बाकी दृश्यों, थीम और कला शैली के अनुरूप हो सकते हैं।
यह त्वरित परिचय आपको यह समझने की अनुमति देता है कि Dall-E क्या है और इसे कैसे संचालित किया जाए। लेकिन अगर आपके पास इस बारे में और प्रश्न हैं कि टूल वास्तव में अपना जादू कैसे काम करता है, तो आप इसके पीछे की यांत्रिकी को समझने के साथ आगे बढ़ सकते हैं।
डल-ई अपनी दृश्य शक्ति को बढ़ाने के लिए विभिन्न एआई-आधारित तकनीकों का उपयोग करता है
जबकि Dall-E छवियों की पहचान करने और उनकी शैली की नकल करने में अविश्वसनीय रूप से निपुण है, प्रवीणता कहीं से पैदा नहीं हुई है। इसके बजाय, Dall-E AI को एक तंत्रिका नेटवर्क का उपयोग करके प्रशिक्षित किया गया है जो दृश्य संदर्भों को प्राकृतिक भाषा पर्यवेक्षण के साथ जोड़ता है।
यह तंत्रिका नेटवर्क गहरी शिक्षा को नियोजित करता है, जो एआई का एक सबसेट है जो विषय वस्तु के बारे में जानने के लिए डेटा के बड़े सेट को संसाधित करता है। इसके साथ, तंत्रिका नेटवर्क के माध्यम से गहन शिक्षा भी विभिन्न पैटर्नों को वर्गीकृत कर सकती है और डेटा के विभिन्न खंडों के बीच संबंध की पहचान कर सकती है।
डल-ई प्रशिक्षण के लिए उपयोग किए जाने वाले तंत्रिका नेटवर्क को कहा जाता है क्लिप (विपरीत भाषा-छवि पूर्व प्रशिक्षण)CLIP एक जीरो-शॉट लर्निंग (ZSL) सेटअप का उपयोग करता है, जो इसे दृश्य नमूनों और पाठ संदर्भों का आकलन करने की अनुमति देता है, भले ही यह पहले कभी उनका सामना न किया हो। यह व्यापक डेटा सेट के माध्यम से संभव है, जिस पर CLIP को प्रशिक्षित किया गया है ताकि एक जानकारी के सेट को दूसरे के साथ मिलान किया जा सके।
इन दृश्य और पाठ संदर्भों को सीखने के लिए, Dall-E को कम से कम प्रशिक्षित किया गया है 12 बिलियन पैरामीटर. ये पैरामीटर एक पाठ संदर्भ के साथ अलग-अलग छवियों को लेबल करते हैं और डल-ई को यह समझने की अनुमति देते हैं कि जब कोई उपयोगकर्ता किसी विशिष्ट छवि को उत्पन्न करने के लिए कहता है तो उससे क्या अपेक्षा की जाती है। सीधी अवधारणाओं के लिए छवि निर्माण को सक्षम करने के अलावा, यह क्षमता अमूर्त अवधारणाओं में भी चमकती है जैसे कि निर्जीव वस्तुओं से मानवरूपी चरित्रों को चित्रित करना।
यह वह जगह है जहां Dall-E का AI मॉडल इसके डेवलपर OpenAI के दूसरे उत्पाद से निकटता से मेल खाता है। यह मैच जनरेटिव प्री-ट्रेन्ड ट्रांसफॉर्मर 3 (GPT-3) के रूप में आता है। जबकि GPT-3 यह भविष्यवाणी करके पाठ उत्पन्न करता है कि पाठ में अगला शब्द क्या होना चाहिए जो इसे उत्पन्न कर रहा है, Dall-E यह निर्धारित करके छवियों का निर्माण करता है कि इसे एक श्रृंखला में उत्पन्न होने वाले तत्वों के अनुसार एक पूर्ण छवि कैसे बनानी चाहिए।
एक बार जब आप समझ जाते हैं कि Dall-E क्या है, तो आप देख सकते हैं कि कैसे यह दृष्टिकोण खरोंच से उच्च गुणवत्ता वाली छवियों के निर्माण के लिए अद्भुत काम करता है। इसके साथ, यह यह भी स्पष्ट करता है कि कैसे प्रोग्राम विस्तारित छवियां बनाता है और मौजूदा छवियों को संपादित करता है।
मापदंडों के अपने प्रभावशाली चयन, उद्देश्यपूर्ण रूप से डिज़ाइन किए गए तंत्रिका नेटवर्क और सहज ज्ञान युक्त GUI का उपयोग करके, Dall-E छवि उत्पादन के लिए तेजी से विकसित हो रही जनरेटिव AI तकनीक से सभी को लाभान्वित करना आसान बनाता है।
Dall-E की समीक्षा: Dall-E की कीमत कितनी है?
दाल-ई अपने डेवलपर OpenAI के माध्यम से उपलब्ध है, जो एक निर्धारित मूल्य के बदले में क्रेडिट प्रदान करता है। प्रत्येक क्रेडिट एक छवि निर्माण अनुरोध के बराबर होता है।
इसका मतलब यह है कि आप टेक्स्ट प्रॉम्प्ट से एक छवि बनाने, संशोधन करने के लिए मौजूदा छवि को संपादित करने, या मौजूदा छवि के लिए कैनवास का विस्तार करने के लिए एकल क्रेडिट का उपयोग करेंगे। प्रत्येक छवि निर्माण अनुरोध आपको चार विविधताएं भी प्रदान करता है। लेकिन यदि आप अधिक विविधताओं के लिए अनुरोध करते हैं, तो प्रति अनुरोध एक क्रेडिट खर्च होता है।
लेखन के समय, Dall-E $115 के लिए 15 क्रेडिट की कीमत पर उपलब्ध है। आपके द्वारा खरीदे गए क्रेडिट 12 महीनों के भीतर समाप्त हो जाते हैं। आप इन क्रेडिट्स का उपयोग वेब इंटरफ़ेस या Dall-E API के माध्यम से कर सकते हैं।
कुल मिलाकर, Dall-E की मूल्य निर्धारण योजना अपने निकटतम प्रतिस्पर्धियों की तुलना में अधिक महंगी है, मध्य यात्रा और स्थिर प्रसार. लेखन के समय, 10 छवि निर्माण अनुरोधों के लिए मिडजर्नी का मूल्य $200 से शुरू होता है। यह असीमित उपयोगकर्ता पीढ़ी के अनुरोधों के लिए $ 30 की योजना भी प्रदान करता है। वहीं, स्टेबल डिफ्यूजन 100 इमेज क्रेडिट के लिए 100 डॉलर चार्ज करता है।
लेकिन यह देखते हुए कि Dall-E का AI अधिक व्यापक रूप से प्रशिक्षित है और छवि विस्तार उपकरण प्रदान करता है जो कि Midjourney और Stable Diffusion के पास नहीं है, इसके पास अपने उत्पाद की कीमत उच्च स्तर पर रखने के पर्याप्त कारण हैं। इसके अलावा, मिडजर्नी को आपको डिस्कोर्ड के माध्यम से कार्यक्रम तक पहुंचने की आवश्यकता है। जबकि, Dall-E अपने स्वयं के वेब GUI के साथ-साथ API के माध्यम से भी उपलब्ध है।
यह जानने के बाद कि Dall-E क्या है और यह किस प्रकार की फीस लाता है, आपके लिए यह निर्धारित करना आसान हो जाता है कि आपको इसकी सेवाओं के लिए भुगतान करना चाहिए या नहीं। जब आप ऐसा करते हैं, तो आप वैसे भी समाधान के लिए साइन-अप कर सकते हैं और तुरंत 50 क्रेडिट प्राप्त कर सकते हैं। बाद में, आप हर महीने 15 निःशुल्क क्रेडिट प्राप्त कर सकते हैं। हालांकि, भुगतान किए गए क्रेडिट की साल भर की समाप्ति तिथि के विपरीत, ये मुफ्त क्रेडिट एक महीने के भीतर समाप्त हो जाते हैं।
डल-ई पेशेवरों और विपक्ष
Dall-E 2, जिसका अप्रैल 2022 में अनावरण किया गया था, में अपने पूर्ववर्ती की तुलना में अधिक क्षमताएं हैं। अपने तंत्रिका नेटवर्क से छवियों और संदर्भों का उपयोग करके, कार्यक्रम प्रभावशाली छवियां उत्पन्न कर सकता है जो आपके प्रांप्ट को अधिक बार फिट करते हैं। इसके अतिरिक्त, इसकी सहज ज्ञान युक्त जीयूआई और एपीआई विशेषताएं जटिल छवि संपादन उपकरणों का उपयोग किए बिना छवियों का उत्पादन करना आपके लिए आसान बनाती हैं।
कहा जा रहा है कि, Dall-E अभी भी अपनी शैशवावस्था से गुज़र रहा है जहाँ आप इसकी बनाई गई प्रत्येक छवि में पूर्णता की उम्मीद नहीं कर सकते हैं। हालांकि यह प्रोग्राम उत्पन्न होने वाली छवियों के माध्यम से लौकिक या शाब्दिक रिक्त स्थान को भरने के लिए अपनी पूरी कोशिश करता है, फिर भी इसकी सीमाएं केवल उस डेटा के रूप में अच्छी होने के कारण होती हैं जिस पर इसे प्रशिक्षित किया जा रहा है।
उदाहरण के लिए, यदि आप Dall-E को संकेत देते हैं कि इसके तंत्रिका नेटवर्क में इसका कोई उदाहरण नहीं है, तो यह आपके संकेत के लिए संभव निकटतम छवि उत्पन्न करेगा जो आपके निर्देशों को उनकी प्राकृतिक भाषा में फिट या फिट नहीं कर सकता है। एक उदाहरण के रूप में, कार्यक्रम को "मंच पर हंस झील" उत्पन्न करने का निर्देश देने के बारे में सोचें। यह बहुत अच्छी तरह से लोकप्रिय बैले या एक मंच पर हंसों के साथ एक शाब्दिक झील का उल्लेख कर सकता है।
फ़ोटो-यथार्थवादी छवियां बनाते समय, आप चेहरे, हाथ, पैर और अन्य शारीरिक विवरणों के चित्रण के साथ चल रही समस्या को भी देख सकते हैं। कभी-कभी, एआई ऐसी विशेषताएं उत्पन्न करता है जो दृश्य सटीकता या यथार्थवाद के संदर्भ में बिल्कुल नहीं होती हैं। लेकिन यह एक ऐसा मुद्दा है जो अन्य एआई टूल्स के लिए भी मौजूद है।
क्या डल-ई इसके लायक है?
यदि आप नई तकनीक का हिस्सा बनना, मज़ेदार सुविधाओं के साथ खेलना और प्रगति के नाम पर मामूली कार्यात्मक मुद्दों को सहन करना पसंद करते हैं, तो Dall-E आपके समय और धन के लायक हो सकता है। यह विशेष रूप से सच है यदि आप समझते हैं कि Dall-E सीमाओं के संदर्भ में किसके साथ काम कर रहा है और जब आपको इन चुनौतियों का सामना करना पड़ता है तो निराश न हों।
लेकिन यही वह जगह है जहां आपके पास डल-ई के मुफ्त क्रेडिट के रूप में एक अनुकूल विकल्प है। यह सुनिश्चित करने के लिए कि आप इसके लिए भुगतान करने से पहले कार्यक्रम से संतुष्ट हैं, आप मंच के लिए साइन अप करने और मुफ्त क्रेडिट के माध्यम से इसे आजमाने के साथ आगे बढ़ सकते हैं। यदि आप Dall-E के प्रदर्शन से खुश हैं, तो आप भुगतान किए गए क्रेडिट के लिए साइन अप कर सकते हैं जो यह OpenAI के प्लेटफॉर्म के माध्यम से प्रदान करता है।
टिप्पणियाँ 0 जवाब