Dall-E Review: Lær mer om det populære AI-bildegenereringsverktøyet

Hvis du abonnerer på en tjeneste fra en lenke på denne siden, kan Reeves and Sons Limited tjene en provisjon. Se vår etisk uttalelse.

Dall-E er et kunstig intelligens (AI) program som genererer bilder basert på tekstmeldinger. Dette betyr at alt du trenger for å produsere bilder av høy kvalitet gjennom AI er å gi Dall-E klare instruksjoner på naturlig språk.

I skrivende stund opererer det AI-baserte verktøyet i form av Dall-E 2, som er den nyeste versjonen av programmet. Dall-E 2 er kommersielt tilgjengelig gjennom utvikleren OpenAI, som tilbyr programmet gjennom nettgrensesnittet så vel som applikasjonsprogrammeringsgrensesnittet (API).

For å lære hva som er Dall-E og hvordan det fungerer, her er en rask guide til dette toppmoderne bildegenereringsprogrammet.

Viktige punkter

  • Dall-E er et AI-basert bildegenereringsverktøy som produserer bilder gjennom tekstinstruksjoner.
  • Dall-E bruker dyp læring for å assimilere tekstmeldinger så vel som visuelle signaler, og gjør relatert visuelt materiale om til sammenhengende bilder.
  • Dall-E tilbyr også et bilderedigeringsprogram for å forbedre eksisterende bilder gjennom AI-baserte redigeringsmuligheter.
  • Dall-E er tilgjengelig både som et grafisk brukergrensesnitt (GUI) og et API.
  • Du beholder fullstendige eierskapsrettigheter til alle bilder du genererer gjennom Dall-E.

Hvordan genererer du AI-bilder gjennom tekst?

dalle tekstbilde

Dall-E er et bildegenereringsverktøy som fungerer via AI for å assimilere tekstinstruksjoner og gjøre dem om til originale bilder. For å oppnå denne bragden bruker Dall-E dyp læring for å forstå et omfattende sett med bilder og referanser.

Når den får en tekstmelding, bruker Dall-E opplæringen fra disse datasettene for å produsere bilder som samsvarer med instruksjonene som er gitt. Dette gjør det mulig for alle å bruke AI for bildegenerering, uten å måtte bruke omfattende koding eller tekniske instruksjoner.

Denne funksjonaliteten er en av mange grunner til at Dall-E har blitt så populær siden debuten i 2020. I sin siste iterasjon, Dall-E 2, tilbyr programmet også flere muligheter. Disse inkluderer muligheten til å redigere eksisterende bilder ved å legge til nye visuelle elementer eller muligheten til å utvide lerretet ved å lage relaterte bilder for et originalt bilde.

For å bruke Dall-E 2, kan du gå til OpenAIs nettsted og bruke verktøyet gjennom den nettbaserte GUI. Selv om du aldri har brukt et AI-program før, gjør det enkle grensesnittet det enkelt for deg å skrive inn tekstmeldingen og få ønsket bilder i retur.

Redigeringsgrensesnittet som ble avduket i slutten av 2022 fungerer med samme tilnærming til enkelhet. Med et brukervennlig viskelærverktøy kan du fjerne de delene av bildet du ønsker skal redigeres eller forbedres med Dall-E. Derfra kan du legge til tekstmeldinger for å legge til nye elementer i bildet ditt.

Du kan også bruke "Generasjonsramme"-verktøyet for å utvide lerretet og størrelsen på et eksisterende bilde. Du kan legge til denne generasjonsrammen mot toppen, bunnen eller begge sider. Du kan også justere størrelsen på denne rammen. Når du har avgjort generasjonsrammen og gitt en melding til Dall-E, kan du se bildet utvides til ønsket størrelse mens det er i tråd med resten av dets visuelle, tema og kunststil.

redesign av dalle bilde

Denne raske introduksjonen lar deg forstå hva som er Dall-E og hvordan du bruker den. Men hvis du har flere spørsmål om nøyaktig hvordan verktøyet fungerer sin magi, kan du gå videre med å forstå mekanikken bak det.

Dall-E bruker forskjellige AI-baserte teknikker for å forbedre sin visuelle dyktighet

Mens Dall-E er utrolig flink til å identifisere bilder og gjenskape stilen deres, er ikke ferdighetene født ut av ingenting. I stedet har Dall-E AI blitt trent ved å bruke et nevralt nettverk som kombinerer visuelle referanser med naturlig språkovervåking.

Dette nevrale nettverket bruker dyp læring, som er en undergruppe av AI som behandler store sett med data for å lære om emnet. Med den kan dyp læring gjennom nevrale nettverk også kategorisere forskjellige mønstre og identifisere forholdet mellom ulike segmenter av data.

Det nevrale nettverket som brukes til Dall-E-trening kalles CLIP (Contrastive Language-Image Pre-training). CLIP bruker et zero-shot learning (ZSL) oppsett, som lar den vurdere visuelle prøver og tekstreferanser selv om den ikke har møtt dem før. Dette er mulig gjennom de omfattende datasettene som CLIP har blitt trent på for å matche et sett med informasjon med det andre.

For å lære disse visuelle og tekstreferansene har Dall-E blitt trent på ikke mindre enn 12 milliarder parametere. Disse parameterne merker forskjellige bilder med en tekstreferanse og lar Dall-E forstå hva som forventes av det når en bruker ber om å generere et spesifikt bilde. I tillegg til å muliggjøre bildegenerering for enkle konsepter, skinner denne evnen også gjennom i abstrakte konsepter som å tegne antropomorfe karakterer ut av livløse objekter.

Det er her AI-modellen til Dall-E matcher et annet produkt fra utvikleren OpenAI. Denne kampen kommer i form av Generative Pre-trained Transformer 3 (GPT-3). Mens GPT-3 genererer tekst ved å forutsi hva det neste ordet skal være i teksten som det genererer, produserer Dall-E bilder ved å bestemme hvordan det skal lage et komplett bilde i henhold til elementene den genererer i en serie.

Når du forstår hva Dall-E er, kan du se hvordan denne tilnærmingen gjør underverker for generering av bilder av høy kvalitet fra bunnen av. Med den gjør den det også tydelig hvordan programmet lager utvidede bilder og redigerer eksisterende bilder.

Ved å bruke sitt imponerende utvalg av parametere, målrettet utformede nevrale nettverk og intuitive GUI, gjør Dall-E det enkelt for alle å dra nytte av den raskt utviklende generative AI-teknologien for bildeproduksjon.

Dall-E anmeldelse: Hvor mye koster Dall-E?

Plate er tilgjengelig gjennom sin utvikler OpenAI, som tilbyr kreditter i bytte mot en fastsatt pris. Hver kreditt tilsvarer en enkelt bildegenereringsforespørsel.

Dette betyr at du vil bruke en enkelt kreditt for å produsere et bilde fra en tekstmelding, redigere et eksisterende bilde for å gjøre endringer eller utvide lerretet for et eksisterende bilde. Hver bildegenereringsforespørsel gir deg også fire varianter. Men hvis du ber om flere varianter, koster det én kreditt per forespørsel.

I skrivende stund er Dall-E tilgjengelig til en pris av 115 studiepoeng for $15. Kredittene du kjøper utløper innen 12 måneder. Du kan bruke disse kredittene over nettgrensesnittet eller gjennom Dall-E API.

Totalt sett er Dall-Es prisplan dyrere enn sine nærmeste konkurrenter, midt på reisen og Stabil diffusjon. I skrivende stund starter Midjourneys priser på $10 for 200 bildegenereringsforespørsler. Den tilbyr også en $30-plan for ubegrensede forespørsler om brukergenerering. Mens stabil diffusjon belaster $100 for 100 bildekreditter.

Men gitt at Dall-Es AI er mer omfattende trent og tilbyr bildeutvidelsesverktøy som Midjourney og Stable Diffusion ikke har, har den tilstrekkelig grunn til å prise produktet til et høyere nivå. Dessuten krever Midjourney at du får tilgang til programmet gjennom Discord. Mens Dall-E er tilgjengelig gjennom sin egen web-GUI så vel som API.

Etter å ha lært hva som er Dall-E og hva slags gebyrer det bringer til bordet, blir det lettere for deg å avgjøre om du skal betale for tjenestene. Mens du gjør det, kan du uansett registrere deg for løsningen og få 50 gratis kreditter med en gang. Etterpå kan du få 15 gratis kreditter hver måned. Disse gratis kredittene utløper imidlertid innen en måned, i motsetning til de betalte kredittenes år lange utløpsdato.

Dall-E fordeler og ulemper

Dall-E 2, som ble avduket i april 2022, har flere muligheter enn forgjengeren. Ved å bruke bildene og referansene fra dets nevrale nettverk, kan programmet generere imponerende bilder som oftere enn ikke passer til spørsmålet ditt. I tillegg gjør dens intuitive GUI og API-funksjoner det enklere for deg å produsere bilder uten å måtte bruke kronglete bilderedigeringsverktøy.

Når det er sagt, går Dall-E fortsatt gjennom sin barndomsfase, hvor du ikke kan forvente perfeksjon på hvert eneste av de genererte bildene. Selv om programmet gjør sitt beste for å fylle ut de ordspråklige eller bokstavelige tomrommene gjennom bildene som det genererer, har det fortsatt sine begrensninger på grunn av at det bare er like bra som dataene det trenes på.

For eksempel, hvis du gir Dall-E en forespørsel som den ikke har noen presedens for i dets nevrale nettverk, vil den generere det nærmest mulige bildet til forespørselen din, som kanskje passer til instruksjonene dine på deres naturlige språk. Som et eksempel, tenk på å gi programmet instruksjonen om å generere "svanesjøen på scenen." Det kan godt referere til den populære balletten eller en bokstavelig innsjø med svaner plassert på en scene.

Når du genererer fotorealistiske bilder, kan du også legge merke til et pågående problem med avbildningen av ansikter, hender, føtter og andre anatomiske detaljer. Noen ganger genererer AI funksjoner som ikke er helt der når det gjelder visuell nøyaktighet eller realisme. Men dette er et problem som eksisterer over hele linja for andre AI-verktøy også.

Er Dall-E verdt det?

Hvis du liker å være en del av ny teknologi, leke med morsomme funksjoner og tolerere små funksjonelle problemer i fremgangens navn, kan Dall-E være verdt tiden din og pengene dine. Dette gjelder spesielt hvis du forstår hva Dall-E jobber med når det gjelder begrensninger og ikke føler deg frustrert når du må møte disse utfordringene på førstehånd.

Men det er der du har et gunstig alternativ i form av Dall-Es gratis kreditter. For å være sikker på at du er fornøyd med programmet før du betaler for det, kan du gå videre med å registrere deg for plattformen og prøve det via gratis kreditter. Hvis du er fornøyd med Dall-Es ytelse, kan du registrere deg for de betalte kredittene den tilbyr gjennom OpenAIs plattform.

Sergio Costa (PhD)

Sergio underviser i entreprenørskap og innovasjon på ulike nivåer (BSc, MSc, MBA, PhD) hovedsakelig ved University of Bath, Imperial College London, Warwick Business School. Han har publisert forskning på Journal of Business Venturing og ledende lederkonferanser (AOM, SMS, Babson, BAM).

Kommentar 0 Responses

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket *

Vurdering *

Dette nettstedet bruker Akismet for å redusere spam. Lær hvordan kommentaren din behandles.

shopify-first-one-dollar-promo-3-months