Dall-E er et kunstig intelligens (AI) program, der genererer billeder baseret på tekstprompter. Det betyder, at alt, hvad du behøver for at producere billeder af høj kvalitet gennem AI, er at give Dall-E klare instruktioner i naturligt sprog.
I skrivende stund fungerer det AI-baserede værktøj i form af Dall-E 2, som er den seneste version af programmet. Dall-E 2 er kommercielt tilgængelig gennem sin udvikler OpenAI, som tilbyder programmet gennem sin webgrænseflade samt sin applikationsprogrammeringsgrænseflade (API).
For at lære, hvad Dall-E er, og hvordan det virker, er her en hurtig guide til dette avancerede billedgenereringsprogram.
Centrale punkter
- Dall-E er et AI-baseret billedgenereringsværktøj, der producerer billeder gennem tekstinstruktioner.
- Dall-E bruger dyb læring til at assimilere tekstmeddelelser såvel som visuelle signaler og omdanner relateret visuelt materiale til sammenhængende billeder.
- Dall-E tilbyder også en billededitor til at forbedre eksisterende billeder gennem AI-baserede redigeringsmuligheder.
- Dall-E er tilgængelig både som en grafisk brugergrænseflade (GUI) og en API.
- Du bevarer de fulde ejerskabsrettigheder til alle billeder, som du genererer gennem Dall-E.
Hvordan genererer du AI-billeder gennem tekst?
Dall-E er et billedgenereringsværktøj, der fungerer via AI til at assimilere tekstinstruktioner og omdanne dem til originale billeder. For at opnå denne bedrift bruger Dall-E dyb læring til at forstå et omfattende sæt billeder og referencer.
Når den får en tekstprompt, bruger Dall-E sin træning fra disse datasæt til at producere billeder, der matcher de medfølgende instruktioner. Dette gør det muligt for alle at bruge AI til billedgenerering uden at skulle bruge omfattende kodning eller tekniske instruktioner.
Denne funktionalitet er en af de mange grunde til, at Dall-E er blevet så populær siden debuten i 2020. I sin seneste iteration, Dall-E 2, tilbyder programmet også yderligere muligheder. Disse inkluderer muligheden for at redigere eksisterende billeder ved at tilføje nye visuelle elementer eller muligheden for at udvide lærredet ved at skabe relaterede visuals til et originalt billede.
For at bruge Dall-E 2 kan du gå til OpenAIs hjemmeside og bruge værktøjet gennem den webbaserede GUI. Selvom du aldrig har brugt et AI-program før, gør den enkle grænseflade det nemt for dig at indtaste din tekstprompt og få dine ønskede billeder til gengæld.
Redigeringsgrænsefladen, der blev afsløret i slutningen af 2022, arbejder med samme tilgang til enkelhed. Med et brugervenligt viskelæderværktøj kan du fjerne de dele af dit billede, som du ønsker skal redigeres eller forbedres med Dall-E. Derfra kan du tilføje tekstbeskeder for at tilføje nye elementer til dit billede.
Du kan også bruge værktøjet "Generation Frame" til at udvide lærredet og størrelsen af et eksisterende billede. Du kan tilføje denne generationsramme mod toppen, bunden eller begge sider. Du kan også justere størrelsen på denne ramme. Når du har afgjort generationsrammen og givet en prompt til Dall-E, kan du se dit billede udvide til din ønskede størrelse, mens det er i tråd med resten af dets visuelle elementer, tema og kunststil.
Denne hurtige introduktion giver dig mulighed for at forstå, hvad Dall-E er, og hvordan den betjenes. Men hvis du har yderligere spørgsmål om, hvordan værktøjet præcist virker sin magi, kan du komme videre med at forstå mekanikken bag det.
Dall-E bruger forskellige AI-baserede teknikker til at forbedre sin visuelle dygtighed
Selvom Dall-E er utrolig dygtig til at identificere billeder og gentage deres stil, er færdighederne ikke født ud af ingenting. I stedet er Dall-E AI blevet trænet ved at bruge et neuralt netværk, der kombinerer visuelle referencer med naturligt sprogovervågning.
Dette neurale netværk anvender deep learning, som er en delmængde af AI, der behandler store datasæt for at lære om emnet ved hånden. Med det kan dyb læring gennem neurale netværk også kategorisere forskellige mønstre og identificere forholdet mellem forskellige segmenter af data.
Det neurale netværk, der bruges til Dall-E træning kaldes CLIP (Contrastive Language-Image Pre-training). CLIP bruger en ZSL-opsætning (zero-shot learning), som giver den mulighed for at vurdere visuelle prøver og tekstreferencer, selvom den ikke har stødt på dem før. Dette er muligt gennem de omfattende datasæt, som CLIP er blevet trænet i for at matche et sæt informationer med det andet.
For at lære disse visuelle og tekstreferencer er Dall-E blevet trænet på intet mindre end 12 milliarder parametre. Disse parametre mærker forskellige billeder med en tekstreference og gør det muligt for Dall-E at forstå, hvad der forventes ud af det, når en bruger beder om et specifikt billede, der skal genereres. Ud over at muliggøre billedgenerering for ligefremme koncepter skinner denne evne også igennem i abstrakte begreber som at tegne antropomorfe karakterer ud af livløse objekter.
Det er her, AI-modellen af Dall-E tæt matcher et andet produkt fra dets udvikler OpenAI. Denne kamp kommer i form af Generative Pre-trained Transformer 3 (GPT-3). Mens GPT-3 genererer tekst ved at forudsige, hvad det næste ord skal være i teksten, som det genererer, producerer Dall-E billeder ved at bestemme, hvordan det skal skabe et komplet billede i henhold til de elementer, det genererer i en serie.
Når du først forstår, hvad Dall-E er, kan du se, hvordan denne tilgang gør underværker for generering af billeder i høj kvalitet fra bunden. Med den gør det også klart, hvordan programmet opretter udvidede billeder og redigerer eksisterende billeder.
Ved at bruge sit imponerende udvalg af parametre, målrettet designede neurale netværk og intuitive GUI gør Dall-E det nemt for alle at drage fordel af den hurtigt udviklende generative AI-teknologi til billedproduktion.
Dall-E anmeldelse: Hvor meget koster Dall-E?
plade er tilgængelig gennem sin udvikler OpenAI, som tilbyder kreditter i bytte for en fast pris. Hver kredit er lig med en enkelt billedgenereringsanmodning.
Det betyder, at du vil bruge en enkelt kredit til at producere et billede fra en tekstprompt, redigere et eksisterende billede for at foretage ændringer eller udvide lærredet for et eksisterende billede. Hver billedgenereringsanmodning giver dig også fire variationer. Men hvis du anmoder om flere variationer, koster det én kredit pr. anmodning.
I skrivende stund er Dall-E tilgængelig til en pris af 115 kreditter for $15. De kreditter, du køber, udløber inden for 12 måneder. Du kan bruge disse kreditter via webgrænsefladen eller via Dall-E API.
Samlet set er Dall-E's prisplan dyrere end sine nærmeste konkurrenter, midt på rejsen og Stabil diffusion. I skrivende stund starter Midjourneys prissætning ved $10 for 200 billedgenereringsanmodninger. Det tilbyder også en $30-plan for ubegrænsede anmodninger om brugergenerering. Hvorimod Stable Diffusion opkræver $100 for 100 billedkreditter.
Men i betragtning af, at Dall-E's AI er mere omfattende trænet og tilbyder billedudvidelsesværktøjer, som Midjourney og Stable Diffusion ikke har, har den tilstrækkelig grund til at prissætte sit produkt til et højere niveau. Derudover kræver Midjourney, at du får adgang til programmet gennem Discord. Hvorimod Dall-E er tilgængelig via sin egen web-GUI samt API.
Efter at have lært, hvad der er Dall-E, og hvilken slags gebyrer det bringer på bordet, bliver det lettere for dig at bestemme, om du skal betale for dets tjenester. Mens du gør det, kan du alligevel tilmelde dig løsningen og få 50 gratis kreditter med det samme. Bagefter kan du få 15 gratis kreditter hver måned. Disse gratis kreditter udløber dog inden for en måned i modsætning til de betalte kreditters år lange udløbsdato.
Dall-E fordele og ulemper
Dall-E 2, som blev afsløret i april 2022, har flere muligheder end sin forgænger. Ved at bruge billederne og referencerne fra dets neurale netværk kan programmet generere imponerende billeder, der oftere end ikke passer til din prompt. Derudover gør dens intuitive GUI og API-funktioner det nemmere for dig at producere billeder uden at skulle bruge indviklede billedredigeringsværktøjer.
Når det er sagt, er Dall-E stadig i gang med sin spæde fase, hvor du ikke kan forvente perfektion ved hvert eneste af dets genererede billeder. Selvom programmet gør sit bedste for at udfylde de ordsprogede eller bogstavelige tomrum gennem de billeder, det genererer, har det stadig sine begrænsninger, fordi det kun er lige så godt som de data, det trænes på.
For eksempel, hvis du giver Dall-E en prompt, som den ikke har nogen præcedens for i dets neurale netværk, vil den generere det tættest mulige billede på din prompt, som måske passer til dine instruktioner på deres naturlige sprog. Som et eksempel, tænk på at give programmet instruktionen til at generere "svanesø på scenen." Det kunne meget vel henvise til den populære ballet eller en bogstavelig sø med svaner placeret på en scene.
Når du genererer fotorealistiske billeder, kan du også bemærke et vedvarende problem med afbildningen af ansigter, hænder, fødder og andre anatomiske detaljer. Nogle gange genererer AI'en funktioner, der ikke er helt der med hensyn til visuel nøjagtighed eller realisme. Men dette er et problem, der også eksisterer over hele linjen for andre AI-værktøjer.
Er Dall-E det værd?
Hvis du nyder at være en del af ny teknologi, lege med sjove funktioner og tolerere små funktionelle problemer i fremskridtets navn, kan Dall-E være din tid og penge værd. Dette gælder især, hvis du forstår, hvad Dall-E arbejder med i form af begrænsninger og ikke føler dig frustreret, når du skal møde disse udfordringer på egen hånd.
Men det er der, du har en favorabel mulighed i form af Dall-Es gratis kreditter. For at sikre dig, at du er tilfreds med programmet, før du betaler for det, kan du gå videre med at tilmelde dig platformen og prøve det via gratis kreditter. Hvis du er tilfreds med Dall-E's præstation, kan du derefter tilmelde dig de betalte kreditter, som den tilbyder gennem OpenAI's platform.
Kommentarer 0 Responses