Dobre wieści dla subskrybentów ChatGPT Plus! OpenAI na łamach swojego bloga poinformował o dodaniu funkcji generowania obrazów dla pakietów ChatGPT Plus i Enterprise. Jest to funkcja w fazie testów Beta, ale znacząco podwyższa ona opłacalność inwestycji w abonament. Dzięki DALL-E 3 użytkownicy ChatGPT Plus będą mogli tworzyć wyjątkowe obrazy przy użyciu dobrze znanego okna dialogowego narzędzia i promptów.
DALL-E 3 to prawdziwy milowy krok w świecie technologii, który jest gratką dla miłośników grafiki. Dzięki pracom ekipy z OpenAI, DALL-E 3 jest teraz bardziej zaawansowany niż kiedykolwiek, a różnice są widoczne gołym okiem. Przede wszystkim, obrazy, które tworzy, są teraz bardziej efektowne i pełne detali.
Co więcej, DALL-E 3 całkiem dobrze radzi sobie z trudnymi do narysowania elementami, takimi jak tekst, dłonie czy twarze. Nie ma też większych problemów z bardziej rozbudowanymi promptami, co pozwala na tworzenie obrazów zarówno w układzie poziomym, jak i portretowym.
Inne narzędzia AI, takie jak Midjourney, wymagają od nas trochę pojęcia o tym, jak je nakierować na odpowiednie tory, aby uzyskać atrakcyjne obrazy. Z DALL-E 3 jest jednak inaczej – nie trzeba formułować skomplikowanych zapytać, aby uzyskać zamierzony efekt. Wystarczy nawet jeden, bardzo podstawowy prompt (sam często od tego zaczynam!), a DALL-E 3 zrobi za nas całą resztę.
To sprawia, że praca z DALL-E 3 jest prostsza i bardziej przyjazna, co z pewnością spodoba się mniej zaawansowanym użytkownikom.
Jak tworzyć obrazy AI z pomocą DALL-E 3 i ChatGPT?
Na dzień dzisiejszy, aby skorzystać z DALL-E 3 w ramach ChatGPT musisz posiadać subskrypcję ChatGPT. Całkiem niedawno pisaliśmy o tym, dlaczego warto w nią zainwestować, a dostęp do narzędzia do generowania obrazów AI to kolejny mocny argument.
Jeżeli jesteś już szczęśliwym posiadaczem/czką ChatGPT Plus to aby rozpocząć swoją przygodę ze sztuką generowania obrazów za pomocą AI musisz z menu rozwijanego wybrać opcję DALL-E 3 Beta.
Osobiście zawsze zaczynam od bardzo ogólnego zapytania, który ma pokazywać całościową wizję obrazu, który chcę stworzyć. Spróbujmy od przygotowania świątecznej kartki bożonarodzeniowej.
Mój prompt to:
create a christmas card with small mountain village landscape
Uwaga: zalecam formułowanie zapytań w języku angielskim. W dalszej części artykułu sprawdzimy jak DALL-E 3 radzi sobie z językiem polskim.
Oto rezultat:
Mi się podoba 🙂 Ale to jeszcze nie to, co chciałem otrzymać. Spróbujmy więc popracować iteracyjnie, by stworzyć perfekcyjną kartkę świąteczną z pomocą sztucznej inteligencji.
W kolejnym kroku klikam na obraz, który spodobał mi się najbardziej. Po prawej stronie ChatGPT pokaże nam swoją wersję promptu, która posłużyła mu do wygenerowanie właśnie tego obrazka. Skopiuję go i wkleję jako kolejny prompt z lekką modyfikacją.
Oto mój drugi prompt:
Illustration of a Christmas card featuring a quaint mountain village during the holiday season. The village is nestled at the base of towering snow-capped mountains. Children are building snowmen in the foreground, and a horse-drawn sleigh is seen making its way through the village. Colorful Christmas lights hang from the eaves of the houses, illuminating the snowy streets below. Make it in minimalistic, vintage style (like in 1940s)
Zauważ, że rozszerzyłem to zapytanie o “Make it in minimalistic, vintage style (like in 1940s)”. W ten sposób sugeruję, w którą stronę oczekuję zmian.
Oto rezultat:
Jesteśmy już bardzo blisko!
Ponownie klikam na wybrany obrazek, kopiuje zaproponowany prompt i proszę o dodanie napisu.
Illustration in a minimalistic, vintage 1940s style of a Christmas card. The scene showcases a quaint mountain village during the holiday season nestled at the base of towering snow-capped mountains. In the foreground, children of diverse ethnicities are building snowmen. A horse-drawn sleigh makes its way through the village, and colorful Christmas lights hang from the eaves of the houses, casting a soft glow on the snowy streets below. Add a nice, handwritten title "Merry Christmas!"
A oto finalny rezultat:
Tak po 3 iteracjach prezentuje się moja wymarzona kartka:
Ładna? 🙂
Jak udoskonalić swoje prompty przy generowaniu obrazków z pomocą ChatGPT i DALL-E 3?
Przede wszystkim ważna jest iteracyjność, czyli bieżące wskazówki i korekty zgłaszane podczas generowania kolejnych wersji obrazu.
Druga to “inżynieria odwrotna” – czyli spoglądanie w prompty sugerowane przez ChatGPT i na ich podstawie modyfikowanie przy kolejnych zapytaniach. Warto rozbudowywać prompty o takie frazy jak “make it more minimalistic” albo “in vintage style”.
Tutaj kilka ciekawych pomysłów, które zasugerował Zapier na swoim blogu:
- “A cubist painting of a large cow in a small field”
- “An oil painting of a monkey in a spacesuit on the moon”
- “A Canadian man riding a moose through a maple forest in the style of an impressionist painting”
- “A stock photo of an Irish man working remotely”
Czy mogę korzystać z DALL-E 3 po polsku?
Tak, sprawdziłem i da się. Aczkolwiek moim subiektywnym zdaniem wyniki są słabsze niż przy komunikacji w języku angielskim. Wynika to przede wszystkim z dużo większej bazy materiałów anglojęzycznych na podstawie której ChatGPT może “nauczyć się” tworzenia obrazów AI.
Źródło: własne | blog OpenAI