Recenzja Dall-E: Dowiedz się więcej o popularnym narzędziu do generowania obrazów AI

Jeśli subskrybujesz usługę za pośrednictwem łącza na tej stronie, firma Reeves and Sons Limited może otrzymać prowizję. Zobacz nasze oświadczenie etyczne.

Dall-E to program oparty na sztucznej inteligencji (AI), który generuje obrazy na podstawie komunikatów tekstowych. Oznacza to, że aby uzyskać wysokiej jakości obrazy za pomocą sztucznej inteligencji, wystarczy udostępnić firmie Dall-E jasne instrukcje w języku naturalnym.

W chwili pisania tego tekstu narzędzie oparte na sztucznej inteligencji działa w formie Dall E 2, czyli najnowsza wersja programu. Dall-E 2 jest dostępny na rynku za pośrednictwem OpenAI, który oferuje program za pośrednictwem interfejsu sieciowego oraz interfejsu programowania aplikacji (API).

Aby dowiedzieć się, czym jest Dall-E i jak działa, oto krótki przewodnik po tym najnowocześniejszym programie do generowania obrazów.

Kluczowe punkty

  • Dall-E to narzędzie do generowania obrazów oparte na sztucznej inteligencji, które generuje obrazy za pomocą instrukcji tekstowych.
  • Dall-E wykorzystuje głębokie uczenie się do przyswajania podpowiedzi tekstowych i wskazówek wizualnych oraz przekształca powiązany materiał wizualny w spójne obrazy.
  • Dall-E oferuje także edytor obrazów, który pozwala ulepszać istniejące obrazy za pomocą funkcji edycji opartych na sztucznej inteligencji.
  • Dall-E jest dostępny zarówno jako graficzny interfejs użytkownika (GUI), jak i API.
  • Zachowujesz pełne prawa własności do wszelkich obrazów generowanych za pośrednictwem firmy Dall-E.

Jak generujesz obrazy AI za pomocą tekstu?

obraz tekstowy Dalle

Dall-E to narzędzie do generowania obrazów, które działa za pośrednictwem sztucznej inteligencji w celu asymilacji instrukcji tekstowych i przekształcania ich w oryginalne obrazy. Aby osiągnąć ten wyczyn, Dall-E wykorzystuje głębokie uczenie się, aby zrozumieć obszerny zestaw obrazów i odniesień.

Po otrzymaniu podpowiedzi tekstowej Dall-E wykorzystuje swoje szkolenie na podstawie tych zbiorów danych w celu wygenerowania obrazów zgodnych z dostarczonymi instrukcjami. Dzięki temu każdy może wykorzystać sztuczną inteligencję do generowania obrazów, bez konieczności stosowania obszernego kodowania lub instrukcji technicznych.

Ta funkcjonalność to jeden z wielu powodów, dla których Dall-E stał się tak popularny od czasu swojego debiutu w 2020 roku. W swojej najnowszej wersji, Dall-E 2, program oferuje również dodatkowe możliwości. Obejmują one opcję edycji istniejących obrazów poprzez dodanie nowych elementów wizualnych lub możliwość rozszerzenia płótna poprzez utworzenie powiązanych wizualizacji dla oryginalnego obrazu.

Aby korzystać z Dall-E 2, możesz udać się na stronę internetową OpenAI i skorzystać z narzędzia za pośrednictwem internetowego interfejsu GUI. Nawet jeśli nigdy wcześniej nie korzystałeś z programu AI, prosty interfejs ułatwia wprowadzenie tekstu i uzyskanie w zamian żądanych obrazów.

Interfejs edycji, który został zaprezentowany pod koniec 2022 roku, opiera się na tym samym podejściu do prostoty. Dzięki łatwemu w użyciu narzędziu do wymazywania możesz usunąć części obrazu, które chcesz edytować lub ulepszyć za pomocą Dall-E. Stamtąd możesz dodać podpowiedzi tekstowe, aby dodać nowe elementy do obrazu.

Możesz także użyć narzędzia „Ramka generacyjna”, aby rozszerzyć płótno i rozmiar istniejącego obrazu. Możesz dodać tę ramkę generowania w górę, w dół lub po obu stronach. Możesz także dostosować rozmiar tej ramki. Po ustaleniu ramki generowania i przekazaniu monitu Dall-E możesz zobaczyć, jak obraz rozciąga się do żądanego rozmiaru, zachowując jednocześnie zgodność z resztą elementów wizualnych, motywem i stylem graficznym.

przeprojektowanie obrazu Dalle

To krótkie wprowadzenie pozwala zrozumieć, czym jest Dall-E i jak go obsługiwać. Jeśli jednak masz dalsze pytania dotyczące tego, jak dokładnie narzędzie działa w swojej magii, możesz przejść dalej, poznając mechanikę stojącą za nim.

Dall-E wykorzystuje różne techniki oparte na sztucznej inteligencji, aby zwiększyć swoje możliwości wizualne

Chociaż Dall-E jest niesamowicie biegły w identyfikowaniu obrazów i odtwarzaniu ich stylu, biegłość ta nie rodzi się znikąd. Zamiast tego sztuczna inteligencja Dall-E została przeszkolona przy użyciu sieci neuronowej, która łączy odniesienia wizualne z nadzorem języka naturalnego.

Ta sieć neuronowa wykorzystuje głębokie uczenie się, które jest podzbiorem sztucznej inteligencji przetwarzającym duże zbiory danych, aby poznać dany temat. Dzięki niemu głębokie uczenie się za pośrednictwem sieci neuronowych może również kategoryzować różne wzorce i identyfikować relacje między różnymi segmentami danych.

Sieć neuronowa używana do uczenia Dall-E nazywa się CLIP (kontrastywny trening językowy i obrazowy). CLIP wykorzystuje konfigurację uczenia się zerowego (ZSL), która pozwala mu ocenić próbki wizualne i odniesienia tekstowe, nawet jeśli wcześniej się z nimi nie spotkał. Jest to możliwe dzięki obszernym zbiorom danych, na których uczono CLIP w celu dopasowania jednego zestawu informatjon z drugim.

Aby nauczyć się tych wizualnych i tekstowych odniesień, firma Dall-E została przeszkolona na co najmniej 12 miliarda parametrów. Parametry te oznaczają różne obrazy odnośnikami tekstowymi i pozwalają Dall-E zrozumieć, czego się od nich oczekuje, gdy użytkownik poprosi o wygenerowanie konkretnego obrazu. Oprócz umożliwienia generowania obrazów dla prostych koncepcji, funkcja ta sprawdza się również w koncepcjach abstrakcyjnych, takich jak rysowanie postaci antropomorficznych z obiektów nieożywionych.

W tym miejscu model sztucznej inteligencji Dall-E jest ściśle powiązany z innym produktem jego twórcy OpenAI. To dopasowanie ma postać wstępnie wytrenowanego transformatora generatywnego 3 (GPT-3). Podczas gdy GPT-3 generuje tekst, przewidując, jakie powinno być następne słowo w generowanym tekście, Dall-E tworzy obrazy, określając, w jaki sposób powinien utworzyć kompletny obraz na podstawie elementów generowanych w serii.

Kiedy już zrozumiesz, czym jest Dall-E, możesz zobaczyć, jak to podejście zdziała cuda w generowaniu od podstaw obrazów o wysokiej jakości. Dzięki niemu wyjaśnia również, w jaki sposób program tworzy rozszerzone obrazy i edytuje istniejące obrazy.

Wykorzystując imponujący wybór parametrów, celowo zaprojektowaną sieć neuronową i intuicyjny interfejs graficzny, Dall-E ułatwia każdemu korzystanie z szybko rozwijającej się technologii generatywnej sztucznej inteligencji do tworzenia obrazów.

Recenzja Dall-E: ile kosztuje Dall-E?

Płyta jest dostępny za pośrednictwem dewelopera OpenAI, który oferuje kredyty w zamian za ustaloną cenę. Każdy kredyt oznacza jedno żądanie wygenerowania obrazu.

Oznacza to, że wykorzystasz pojedynczy kredyt na utworzenie obrazu z podpowiedzi tekstowej, edycję istniejącego obrazu w celu wprowadzenia modyfikacji lub rozszerzenie płótna dla istniejącego obrazu. Każde żądanie wygenerowania obrazu zapewnia również cztery odmiany. Jeśli jednak poprosisz o więcej odmian, koszt za każde żądanie będzie wynosił jeden kredyt.

W chwili pisania tego tekstu Dall-E jest dostępny w cenie 115 kredytów za 15 dolarów. Zakupione przez Ciebie kredyty tracą ważność w ciągu 12 miesięcy. Możesz wykorzystać te środki za pośrednictwem interfejsu internetowego lub interfejsu API Dall-E.

Ogólnie rzecz biorąc, plan cenowy firmy Dall-E jest droższy niż plan cenowy najbliższych konkurentów, W połowie drogi i Stabilna dyfuzja. W chwili pisania tego tekstu ceny Midjourney zaczynają się od 10 dolarów za 200 żądań wygenerowania obrazu. Oferuje również plan za 30 USD na nieograniczone żądania generowania użytkowników. Natomiast Stable Diffusion pobiera opłatę w wysokości 100 USD za 100 kredytów na obrazy.

Biorąc jednak pod uwagę, że sztuczna inteligencja Dall-E jest lepiej wyszkolona i oferuje narzędzia do rozszerzania obrazu, których nie mają Midjourney i Stable Diffusion, ma to wystarczający powód, aby wycenić swój produkt na wyższym poziomie. Poza tym Midjourney wymaga dostępu do programu poprzez Discord. Natomiast Dall-E jest dostępny za pośrednictwem własnego internetowego interfejsu GUI oraz interfejsu API.

Po zapoznaniu się z tym, czym jest Dall-E i jakie opłaty ze sobą wiąże, łatwiej będzie Ci określić, czy warto płacić za jego usługi, czy nie. Gdy to zrobisz, możesz mimo to zarejestrować się w rozwiązaniu i od razu otrzymać 50 darmowych kredytów. Następnie możesz otrzymać 15 darmowych kredytów co miesiąc. Jednakże te bezpłatne kredyty wygasają w ciągu miesiąca, w przeciwieństwie do rocznej daty wygaśnięcia płatnych kredytów.

Plusy i minusy Dall-E

Dall-E 2, który został zaprezentowany w kwietniu 2022 roku, ma więcej możliwości niż jego poprzednik. Korzystając z obrazów i odnośników z sieci neuronowej, program może generować imponujące obrazy, które często pasują do podpowiedzi. Dodatkowo intuicyjne funkcje GUI i API ułatwiają tworzenie obrazów bez konieczności korzystania ze skomplikowanych narzędzi do edycji obrazów.

Mając to na uwadze, Dall-E wciąż znajduje się w fazie początkowej, w której nie można oczekiwać doskonałości w każdym wygenerowanym obrazie. Chociaż program robi wszystko, co w jego mocy, aby wypełnić przysłowiowe lub dosłowne luki za pomocą generowanych obrazów, nadal ma swoje ograniczenia, ponieważ jest tak dobry, jak dane, na których jest szkolony.

Na przykład, jeśli dasz Dall-E monit, dla którego nie ma precedensu w jego sieci neuronowej, wygeneruje on obraz możliwie najbliższy Twojemu monitowi, który może, ale nie musi, pasować do instrukcji w ich naturalnym języku. Weźmy na przykład możliwość wydania programowi instrukcji wygenerowania na scenie „jeziora łabędziego”. Równie dobrze może odnosić się do popularnego baletu, jak i dosłownego jeziora z łabędziami ustawionymi na scenie.

Podczas generowania fotorealistycznych obrazów można również zauważyć ciągły problem z przedstawieniem twarzy, dłoni, stóp i innych szczegółów anatomicznych. Czasami sztuczna inteligencja generuje funkcje, które nie są do końca dostępne pod względem dokładności wizualnej i realizmu. Jest to jednak problem występujący powszechnie także w przypadku innych narzędzi AI.

Czy warto kupić Dall-E?

Jeśli lubisz być częścią nowych technologii, bawić się ciekawymi funkcjami i tolerować drobne problemy funkcjonalne w imię postępu, Dall-E może być wart Twojego czasu i środków. Jest to szczególnie prawdziwe, jeśli rozumiesz, z czym pracuje Dall-E w zakresie ograniczeń i nie czujesz się sfrustrowany, gdy musisz stawić czoła tym wyzwaniom na własnej skórze.

Ale tutaj masz korzystną opcję w postaci darmowych kredytów Dall-E. Aby upewnić się, że jesteś zadowolony z programu, zanim za niego zapłacisz, możesz przejść dalej, rejestrując się na platformie i wypróbowując go za pomocą bezpłatnych kredytów. Jeśli jesteś zadowolony z wydajności Dall-E, możesz zapisać się na płatne kredyty oferowane przez platformę OpenAI.

Sergio Costa (doktorat)

Sergio uczy przedsiębiorczości i innowacji na różnych poziomach (BSc, MSc, MBA, PhD) głównie na Uniwersytecie w Bath, Imperial College London, Warwick Business School. Publikował badania w Journal of Business Venturing oraz na wiodących konferencjach menedżerskich (AOM, SMS, Babson, BAM).

Komentarze Odpowiedzi 0

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

Ocena *

Ta strona używa Akismet do redukcji spamu. Dowiedz się, jak przetwarzane są dane komentarza.