Dall-E Review: Aflați mai multe despre popularul instrument de generare de imagini AI

Dacă vă abonați la un serviciu dintr-un link de pe această pagină, Reeves and Sons Limited poate câștiga un comision. Vezi noastre declarație de etică.

Dall-E este un program de inteligență artificială (AI) care generează imagini pe baza solicitărilor de text. Aceasta înseamnă că tot ceea ce aveți nevoie pentru a produce imagini de înaltă calitate prin AI este să oferiți Dall-E instrucțiuni clare în limbaj natural.

La momentul scrierii, instrumentul bazat pe AI operează sub forma Dall-E 2, care este cea mai recentă versiune a programului. Dall-E 2 este disponibil comercial prin intermediul dezvoltatorului său OpenAI, care oferă programul prin interfața sa web, precum și prin interfața sa de programare a aplicațiilor (API).

Pentru a afla ce este Dall-E și cum funcționează, iată un ghid rapid pentru acest program de generare de imagini de ultimă generație.

Puncte cheie

  • Dall-E este un instrument de generare de imagini bazat pe inteligență artificială care produce imagini prin instrucțiuni text.
  • Dall-E folosește învățarea profundă pentru a asimila instrucțiunile textului, precum și indicațiile vizuale și transformă materialul vizual aferent în imagini coerente.
  • Dall-E oferă, de asemenea, un editor de imagini pentru a îmbunătăți imaginile existente prin capabilități de editare bazate pe AI.
  • Dall-E este disponibil atât ca interfață grafică de utilizator (GUI) cât și ca API.
  • Vă păstrați drepturile complete de proprietate asupra oricăror imagini pe care le generați prin Dall-E.

Cum generați imagini AI prin text?

imagine text dalle

Dall-E este un instrument de generare de imagini care funcționează prin intermediul inteligenței artificiale pentru a asimila instrucțiunile text și a le transforma în imagini originale. Pentru a realiza această performanță, Dall-E folosește învățarea profundă pentru a înțelege un set extins de imagini și referințe.

Când i se dă un mesaj text, Dall-E își folosește formarea din acele seturi de date pentru a produce imagini care se potrivesc cu instrucțiunile furnizate. Acest lucru face posibil ca oricine să folosească AI pentru generarea de imagini, fără a fi nevoie să folosească coduri extinse sau instrucțiuni tehnice.

Această funcționalitate este unul dintre numeroasele motive pentru care Dall-E a devenit atât de popular de la debutul său în 2020. În cea mai recentă versiune, Dall-E 2, programul oferă și capacități suplimentare. Acestea includ opțiunea de a edita imaginile existente prin adăugarea de noi elemente vizuale sau capacitatea de a extinde pânza prin crearea de imagini înrudite pentru o imagine originală.

Pentru a utiliza Dall-E 2, puteți merge pe site-ul OpenAI și puteți utiliza instrumentul prin interfața grafică bazată pe web. Chiar dacă nu ați mai folosit niciodată un program AI, interfața simplă vă ajută să introduceți mesajul text și să primiți în schimb imaginile dorite.

Interfața de editare care a fost dezvăluită la sfârșitul anului 2022 funcționează cu aceeași abordare a simplității. Cu un instrument de șters ușor de utilizat, puteți elimina părțile imaginii pe care doriți să le editați sau să le îmbunătățiți cu Dall-E. De acolo, puteți adăuga solicitări de text pentru a adăuga elemente noi imaginii dvs.

De asemenea, puteți utiliza instrumentul „Generație cadru” pentru a extinde pânza și dimensiunea unei imagini existente. Puteți adăuga acest cadru de generație în partea de sus, de jos sau pe oricare parte. De asemenea, puteți ajusta dimensiunea acestui cadru. Odată ce ați stabilit cadrul de generare și ați dat o solicitare lui Dall-E, puteți vedea imaginea extinsă la dimensiunea dorită, fiind în concordanță cu restul imaginilor, temei și stilului artistic.

reproiectarea imaginii dalle

Această introducere rapidă vă permite să înțelegeți ce este Dall-E și cum să îl utilizați. Dar dacă mai aveți întrebări despre modul în care instrumentul își desfășoară magia, puteți merge mai departe cu înțelegerea mecanicii din spatele lui.

Dall-E folosește diverse tehnici bazate pe inteligență artificială pentru a-și îmbunătăți capacitatea vizuală

În timp ce Dall-E este incredibil de abil în identificarea imaginilor și reproducerea stilului lor, competența nu se naște din senin. În schimb, Dall-E AI a fost antrenat folosind o rețea neuronală care combină referințe vizuale cu supravegherea limbajului natural.

Această rețea neuronală folosește învățarea profundă, care este un subset de AI care procesează seturi mari de date pentru a afla despre subiectul în cauză. Cu acesta, învățarea profundă prin rețelele neuronale poate, de asemenea, clasifica diferite modele și poate identifica relația dintre diferitele segmente de date.

Rețeaua neuronală care este utilizată pentru antrenamentul Dall-E se numește CLIP (Pre-training pentru limbaj contrastant-imagine). CLIP folosește o configurație de învățare zero-shot (ZSL), care îi permite să evalueze mostre vizuale și referințe de text, chiar dacă nu le-a mai întâlnit înainte. Acest lucru este posibil prin seturile extinse de date pe care CLIP a fost instruit pentru a potrivi un set de informații cu celălalt.

Pentru a învăța aceste referințe vizuale și de text, Dall-E a fost instruit pe nu mai puțin de 12 miliarde de parametri. Acești parametri etichetează imagini diferite cu o referință text și îi permit lui Dall-E să înțeleagă ce se așteaptă de la ele atunci când un utilizator solicită generarea unei anumite imagini. Pe lângă faptul că permite generarea de imagini pentru concepte simple, această capacitate strălucește și în concepte abstracte, cum ar fi desenarea personajelor antropomorfe din obiecte neînsuflețite.

Aici modelul AI al lui Dall-E se potrivește îndeaproape cu un alt produs al dezvoltatorului său OpenAI. Acest meci vine sub forma Generative Pre-Trained Transformer 3 (GPT-3). În timp ce GPT-3 generează text prin predicția care ar trebui să fie următorul cuvânt din textul pe care îl generează, Dall-E produce imagini determinând cum ar trebui să creeze o imagine completă în funcție de elementele pe care le generează într-o serie.

Odată ce înțelegeți ce este Dall-E, puteți vedea cum această abordare face minuni pentru generarea de imagini de înaltă calitate de la zero. Cu acesta, de asemenea, clarifică modul în care programul creează imagini extinse și editează imaginile existente.

Folosind selecția impresionantă de parametri, rețeaua neuronală proiectată intenționat și interfața grafică intuitivă, Dall-E face ca toată lumea să beneficieze cu ușurință de tehnologia AI generativă care evoluează rapid pentru producția de imagini.

Revizuirea Dall-E: Cât costă Dall-E?

Dală este disponibil prin intermediul dezvoltatorului său OpenAI, care oferă credite în schimbul unui preț stabilit. Fiecare credit este egal cu o singură cerere de generare a imaginii.

Aceasta înseamnă că veți folosi un singur credit pentru producerea unei imagini dintr-un prompt text, editarea unei imagini existente pentru a face modificări sau extinderea pânzei pentru o imagine existentă. Fiecare cerere de generare de imagini vă oferă, de asemenea, patru variante. Dar dacă solicitați mai multe variații, costă un credit per cerere.

La momentul redactării acestui articol, Dall-E este disponibil la prețul de 115 credite pentru 15 USD. Creditele pe care le cumpărați expiră în 12 luni. Puteți utiliza aceste credite prin interfața web sau prin API-ul Dall-E.

În general, planul de prețuri al Dall-E este mai scump decât cei mai apropiați concurenți ai săi, Mijlocul călătoriei si Difuzie stabilă. La momentul redactării acestui articol, prețul Midjourney începe de la 10 USD pentru 200 de solicitări de generare de imagini. De asemenea, oferă un plan de 30 USD pentru solicitări nelimitate de generare de utilizatori. În timp ce, Stable Diffusion percepe 100 USD pentru 100 de credite de imagine.

Dar, având în vedere că AI-ul Dall-E este instruit mai pe larg și oferă instrumente de extensie a imaginii pe care Midjourney și Stable Diffusion nu le au, are suficiente motive pentru a prețui produsul său la un nivel superior. În plus, Midjourney vă cere să accesați programul prin Discord. În timp ce, Dall-E este disponibil prin intermediul propriului GUI web, precum și prin API.

După ce ați aflat ce este Dall-E și ce fel de taxe aduce la masă, vă devine mai ușor să determinați dacă ar trebui să plătiți sau nu pentru serviciile sale. În timp ce faceți acest lucru, puteți oricum să vă înscrieți pentru soluție și să obțineți 50 de credite gratuite imediat. Ulterior, puteți obține 15 credite gratuite în fiecare lună. Cu toate acestea, aceste credite gratuite expiră într-o lună, spre deosebire de data de expirare de un an a creditelor plătite.

Dall-E Avantaje și dezavantaje

Dall-E 2, care a fost lansat în aprilie 2022, are mai multe capacități decât predecesorul său. Folosind imaginile și referințele din rețeaua sa neuronală, programul poate genera imagini impresionante care se potrivesc promptului dvs. de cele mai multe ori. În plus, caracteristicile sale intuitive GUI și API vă fac mai ușor să produceți imagini fără a fi nevoie să utilizați instrumente complicate de editare a imaginilor.

Acestea fiind spuse, Dall-E încă trece printr-o fază incipientă în care nu te poți aștepta la perfecțiune la fiecare dintre imaginile sale generate. În timp ce programul face tot posibilul pentru a completa spațiile libere proverbiale sau literale prin imaginile pe care le generează, are totuși limitările sale, deoarece este la fel de bun ca datele pe care este antrenat.

De exemplu, dacă îi dați lui Dall-E un prompt pentru care nu are precedent în rețeaua sa neuronală, acesta va genera cea mai apropiată imagine posibilă de promptul dvs. care se potrivește sau nu cu instrucțiunile dvs. în limbajul lor natural. De exemplu, gândiți-vă să oferiți programului instrucțiunile de a genera „lacul lebedelor pe scenă”. S-ar putea referi foarte bine la baletul popular sau la un lac literal cu lebede așezate pe o scenă.

Când generați imagini fotorealiste, puteți observa și o problemă continuă cu reprezentarea fețelor, a mâinilor, a picioarelor și a altor detalii anatomice. Uneori, AI generează caracteristici care nu sunt chiar acolo în ceea ce privește acuratețea vizuală sau realismul. Dar aceasta este o problemă care există în general și pentru alte instrumente AI.

Merită Dall-E?

Dacă îți place să faci parte din noua tehnologie, să te joci cu funcții distractive și să tolerezi ușoare probleme funcționale în numele progresului, Dall-E ar putea merita timpul și fondurile tale. Acest lucru este valabil mai ales dacă înțelegeți cu ce lucrează Dall-E în ceea ce privește limitările și nu vă simțiți frustrați atunci când trebuie să faceți față acestor provocări direct.

Dar aici aveți o opțiune favorabilă sub forma creditelor gratuite Dall-E. Pentru a vă asigura că sunteți mulțumit de program înainte de a plăti pentru el, puteți continua cu înscrierea la platformă și încercarea acestuia prin credite gratuite. Dacă sunteți mulțumit de performanța Dall-E, vă puteți înscrie pentru creditele plătite pe care le oferă prin platforma OpenAI.

Sergio Costa (doctorat)

Sergio predă antreprenoriat și inovare la diferite niveluri (BSc, MSc, MBA, PhD), în principal la Universitatea din Bath, Imperial College London, Warwick Business School. A publicat cercetări în Journal of Business Venturing și a condus conferințe de management (AOM, SMS, Babson, BAM).

Comentarii Răspunsuri 0

Lasă un comentariu

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate *

Evaluare *

Acest site folosește Akismet pentru a reduce spamul. Aflați cum sunt procesate datele despre comentarii.