Dall-E is 'n kunsmatige intelligensie-program (KI) wat beelde genereer gebaseer op teksaanwysings. Dit beteken dat al wat jy nodig het om hoë kwaliteit beelde deur AI te produseer, is om Dall-E te voorsien van duidelike instruksies in natuurlike taal.
Ten tyde van die skryf hiervan werk die KI-gebaseerde instrument in die vorm van Dall-E 2, wat die nuutste weergawe van die program is. Dall-E 2 is kommersieel beskikbaar deur sy ontwikkelaar OpenAI, wat die program deur sy webkoppelvlak sowel as sy toepassingsprogrammeringskoppelvlak (API) aanbied.
Om te leer wat Dall-E is en hoe dit werk, is hier 'n vinnige gids tot hierdie moderne beeldgenereringsprogram.
sleutelpunte
- Dall-E is 'n AI-gebaseerde beeldgenereringsinstrument wat beelde deur teksinstruksies produseer.
- Dall-E gebruik diep leer om teksaanwysings sowel as visuele leidrade te assimileer, en verander verwante visuele materiaal in samehangende beelde.
- Dall-E bied ook 'n beeldredigeerder om bestaande beelde te verbeter deur AI-gebaseerde redigeringsvermoëns.
- Dall-E is beskikbaar as 'n grafiese gebruikerskoppelvlak (GUI) en 'n API.
- Jy behou volledige eienaarskapsregte op enige beelde wat jy deur Dall-E genereer.
Hoe genereer jy KI-beelde deur teks?
Dall-E is 'n beeldgenereringsinstrument wat via AI werk om teksinstruksies te assimileer en dit in oorspronklike beelde te verander. Om hierdie prestasie te bereik, gebruik Dall-E diep leer om 'n uitgebreide stel beelde en verwysings te verstaan.
Wanneer dit 'n teksopdrag kry, gebruik Dall-E sy opleiding van daardie datastelle om beelde te produseer wat ooreenstem met die verskafde instruksies. Dit maak dit vir enigiemand moontlik om AI vir beeldgenerering te gebruik, sonder om uitgebreide kodering of tegniese instruksies te gebruik.
Hierdie funksionaliteit is een van die vele redes waarom Dall-E so gewild geword het sedert sy debuut in 2020. In sy jongste herhaling, Dall-E 2, bied die program ook bykomende vermoëns. Dit sluit die opsie in om bestaande beelde te wysig deur nuwe visuele elemente by te voeg of die vermoë om die doek uit te brei deur verwante beeldmateriaal vir 'n oorspronklike beeld te skep.
Om Dall-E 2 te gebruik, kan u na OpenAI se webwerf gaan en die instrument deur die webgebaseerde GUI gebruik. Selfs as jy nog nooit 'n KI-program gebruik het nie, maak die eenvoudige koppelvlak dit vir jou maklik om jou teksaanvraag in te voer en jou verlangde beelde terug te kry.
Die redigeerkoppelvlak wat laat in 2022 onthul is, werk met dieselfde benadering tot eenvoud. Met 'n maklik-om-te gebruik uitveër-instrument kan jy die dele van jou prent verwyder wat jy wil wysig of verbeter met Dall-E. Van daar af kan jy teksaanwysings byvoeg om nuwe elemente by jou prent te voeg.
Jy kan ook die "Generation Frame"-nutsding gebruik om die doek en grootte van 'n bestaande prent uit te brei. Jy kan hierdie generasieraam na bo, onder of enige kant toe voeg. Jy kan ook die grootte van hierdie raam aanpas. Sodra jy die generasieraamwerk afgehandel het en 'n aansporing aan Dall-E gegee het, kan jy sien hoe jou prent uitbrei na jou verlangde grootte terwyl dit in lyn is met die res van sy visuele, tema en kunsstyl.
Hierdie vinnige inleiding laat jou toe om te verstaan wat Dall-E is en hoe om dit te gebruik. Maar as jy verdere vrae het oor hoe presies die instrument sy towerkrag uitwerk, kan jy vorentoe beweeg om die meganika daaragter te verstaan.
Dall-E gebruik verskillende KI-gebaseerde tegnieke om sy visuele vaardigheid te verbeter
Terwyl Dall-E ongelooflik vaardig is om beelde te identifiseer en hul styl te repliseer, word die vaardigheid nie uit die niet gebore nie. In plaas daarvan is die Dall-E AI opgelei deur 'n neurale netwerk te gebruik wat visuele verwysings met natuurlike taaltoesig kombineer.
Hierdie neurale netwerk maak gebruik van diep leer, wat 'n subset van KI is wat groot stelle data verwerk om meer oor die onderwerp te leer. Daarmee kan diep leer deur neurale netwerke ook verskillende patrone kategoriseer en die verband tussen verskillende segmente van data identifiseer.
Die neurale netwerk wat gebruik word vir Dall-E opleiding word genoem CLIP (Kontrasiewe Taal-Beeld Vooropleiding). CLIP gebruik 'n nulskoot-leer (ZSL)-opstelling, wat dit toelaat om visuele voorbeelde en teksverwysings te assesseer, selfs al het dit dit nie voorheen teëgekom nie. Dit is moontlik deur die uitgebreide datastelle waarop CLIP opgelei is om een stel inligting met die ander te pas.
Om hierdie visuele en teksverwysings te leer, is Dall-E opgelei op nie minder nie as 12 miljard parameters. Hierdie parameters benoem verskillende beelde met 'n teksverwysing en laat Dall-E toe om te verstaan wat daaruit verwag word wanneer 'n gebruiker vra dat 'n spesifieke beeld gegenereer word. Benewens om beeldgenerering vir eenvoudige konsepte moontlik te maak, skyn hierdie vermoë ook deur in abstrakte konsepte soos om antropomorfiese karakters uit lewelose voorwerpe te teken.
Dit is hier waar die KI-model van Dall-E nou ooreenstem met 'n ander produk deur sy ontwikkelaar OpenAI. Hierdie wedstryd kom in die vorm van Generative Pre-trained Transformer 3 (GPT-3). Terwyl GPT-3 teks genereer deur te voorspel wat die volgende woord moet wees in die teks wat dit genereer, produseer Dall-E beelde deur te bepaal hoe dit 'n volledige beeld moet skep volgens die elemente wat dit in 'n reeks genereer.
Sodra jy verstaan wat Dall-E is, kan jy sien hoe hierdie benadering wondere verrig vir die generering van hoë kwaliteit beelde van nuuts af. Daarmee maak dit dit ook duidelik hoe die program uitgebreide beelde skep en bestaande beelde wysig.
Deur sy indrukwekkende keuse van parameters, doelgerig ontwerpte neurale netwerk en intuïtiewe GUI te gebruik, maak Dall-E dit maklik vir almal om voordeel te trek uit die vinnig ontwikkelende generatiewe AI-tegnologie vir beeldproduksie.
Dall-E Review: Hoeveel kos Dall-E?
Blad is beskikbaar deur sy ontwikkelaar OpenAI, wat krediete bied in ruil vir 'n vasgestelde prys. Elke krediet is gelyk aan 'n enkele beeldgenereringversoek.
Dit beteken dat jy 'n enkele krediet sal gebruik vir die vervaardiging van 'n prent vanaf 'n teksaanvraag, om 'n bestaande prent te redigeer om wysigings aan te bring, of om die doek vir 'n bestaande prent uit te brei. Elke beeldgenereringversoek bied jou ook vier variasies. Maar as jy vir meer variasies versoek, kos dit een krediet per versoek.
Met die skryf hiervan is Dall-E beskikbaar teen die prys van 115 krediete vir $15. Die krediete wat jy koop, verval binne 12 maande. U kan hierdie krediete oor die webkoppelvlak of deur die Dall-E API gebruik.
In die algemeen is Dall-E se prysplan duurder as sy naaste mededingers, middel van die reis en Stabiele verspreiding. Met die skryf hiervan begin Midjourney se pryse by $10 vir 200 beeldgenereringversoeke. Dit bied ook 'n $30-plan vir onbeperkte gebruikersgenerasieversoeke. Terwyl Stable Diffusion $100 vra vir 100 beeldkrediete.
Maar aangesien Dall-E se KI meer omvattend opgelei is en beelduitbreidingsinstrumente bied wat Midjourney en Stable Diffusion nie het nie, het dit genoeg rede om sy produk op 'n hoër vlak te prys. Boonop vereis Midjourney dat jy toegang tot die program moet kry deur Discord. Terwyl Dall-E beskikbaar is deur sy eie web-GUI sowel as API.
Nadat jy geleer het wat Dall-E is en watter soort fooie dit na die tafel bring, word dit vir jou makliker om te bepaal of jy vir sy dienste moet betaal of nie. Terwyl jy dit doen, kan jy in elk geval vir die oplossing aanmeld en dadelik 50 gratis krediete kry. Daarna kan jy elke maand 15 gratis krediete kry. Hierdie gratis krediete verval egter binne 'n maand, in teenstelling met die betaalde krediete se jaarlange vervaldatum.
Dall-E voor- en nadele
Dall-E 2, wat in April 2022 onthul is, het meer vermoëns as sy voorganger. Deur die beelde en verwysings van sy neurale netwerk te gebruik, kan die program indrukwekkende beelde genereer wat meer dikwels as nie by jou opdrag pas nie. Boonop maak sy intuïtiewe GUI en API-kenmerke dit vir jou makliker om beelde te produseer sonder om ingewikkelde beeldbewerkingsinstrumente te gebruik.
Met dit gesê, gaan Dall-E steeds deur sy kinderskoene fase waar jy nie perfeksie by elkeen van sy gegenereerde beelde kan verwag nie. Alhoewel die program sy bes doen om die spreekwoordelike of letterlike spasies in te vul deur die beelde wat dit genereer, het dit steeds sy beperkings omdat dit net so goed is soos die data waarop dit opgelei word.
Byvoorbeeld, as jy vir Dall-E 'n prompt gee waarvoor dit geen presedent in sy neurale netwerk het nie, sal dit die naaste moontlike beeld aan jou prompt genereer wat dalk nie by jou instruksies in hul natuurlike taal pas nie. Dink byvoorbeeld daaraan om die program die instruksie te gee om "swanemeer op die verhoog" te genereer. Dit kan baie goed verwys na die gewilde ballet of 'n letterlike meer met swane wat op 'n verhoog geplaas is.
Wanneer jy fotorealistiese beelde genereer, kan jy ook 'n voortdurende probleem met die uitbeelding van gesigte, hande, voete en ander anatomiese besonderhede opmerk. Soms genereer die KI kenmerke wat nie heeltemal daar is in terme van visuele akkuraatheid of realisme nie. Maar dit is 'n probleem wat ook oor die hele linie bestaan vir ander KI-instrumente.
Is Dall-E die moeite werd?
As jy daarvan hou om deel te wees van nuwe tegnologie, om met prettige kenmerke te speel en geringe funksionele probleme te verdra in die naam van vooruitgang, kan Dall-E jou tyd en geld werd wees. Dit is veral waar as jy verstaan waarmee Dall-E werk in terme van beperkings en nie gefrustreerd voel wanneer jy eerstehands hierdie uitdagings die hoof moet bied nie.
Maar dit is waar jy 'n gunstige opsie het in die vorm van Dall-E se gratis krediete. Om seker te maak dat jy tevrede is met die program voordat jy daarvoor betaal, kan jy vorentoe gaan deur by die platform aan te meld en dit met gratis krediete te probeer. As jy tevrede is met Dall-E se prestasie, kan jy dan inteken vir die betaalde krediete wat dit bied deur OpenAI se platform.
Kommentaar Kommentaar