Konfrontacja artystyczna: Midjourney kontra Adobe Firefly Generative Fill.
Wkraczamy w nowy etap rozwoju sztucznej inteligencji w dziedzinie generowania obrazów. Nie chodzi już tylko o tworzenie grafik na podstawie opisów tekstowych. Kluczowym aspektem, decydującym o sukcesie, jest to, jak sprawnie te narzędzia radzą sobie z modyfikacją już wygenerowanych obrazów – czyli z tzw. inpaintingiem.
W tym starciu stają naprzeciw siebie dwaj giganci: Adobe i Midjourney. Oba narzędzia dysponują zaawansowanymi funkcjami malowania, a my postaramy się wyłonić spośród nich zwycięzcę.
Na wstępie warto zaznaczyć, że Midjourney jest narzędziem subskrypcyjnym, natomiast Adobe Generative Fill można wypróbować za darmo.
Ja sam wykupiłem subskrypcję Midjourney i jestem gotów do przeprowadzenia szczegółowej analizy porównawczej.
Zanim jednak przejdziemy do praktycznych testów, przyjrzyjmy się bliżej, jak działa funkcja inpaintingu w obu tych narzędziach.
Inpainting w Midjourney: analiza działania
Po aktywacji subskrypcji, należy otworzyć aplikację Discord i wybrać dowolny kanał. W polu czatu wpisujemy polecenie `/settings` i zatwierdzamy Enterem. Z wyświetlonego okna wybieramy tryb Remiksu.
Następnie generujemy obraz za pomocą podpowiedzi tekstowej, przeskalowujemy go do preferowanego rozmiaru i klikamy opcję „Zmieniaj (Region)”, aby przejść do selektywnego malowania.
Wybieramy interesujący nas obszar i opisujemy, co ma zostać w nim zmienione.
W odpowiedzi otrzymujemy cztery różne propozycje zmian, które można dalej modyfikować i udoskonalać.
Generative Fill w Adobe Photoshop: omówienie działania
Aby rozpocząć pracę z Generative Fill w Adobe Photoshop, wybieramy narzędzie „Przekształcanie tekstu w obraz” na ekranie startowym Adobe Firefly. Za jego pomocą możemy wygenerować dowolny obraz na podstawie opisu tekstowego.
Następnie możemy wybrać jeden z czterech wygenerowanych obrazów i przejść do funkcji wypełnienia generatywnego.
Wybieramy fragment, który chcemy zmodyfikować, wpisujemy podpowiedź opisującą pożądaną zmianę i klikamy przycisk „Generuj”.
W odpowiedzi otrzymujemy kilka wariantów, które możemy ocenić i w razie potrzeby ponownie zmodyfikować.
Ogólnie rzecz biorąc, interfejs Generative Fill od Adobe jest bardziej przystępny dla początkujących użytkowników. Dostępne są opcje automatycznego wyboru i odwracania tła, a funkcje dodawania i odejmowania ułatwiają precyzyjną edycję.
Warto zauważyć, że termin „malowanie” (inpainting) jest ogólnym określeniem tej techniki. Określenie „wypełnianie generatywne” (Generative Fill) stosowane przez Adobe, w rzeczywistości oznacza to samo.
Mając to na uwadze, możemy przejść do naszego praktycznego porównania.
Praktyczne starcie: Inpainting w Midjourney kontra Generative Fill w Photoshopie
Procedura jest prosta. Wykorzystam te same podpowiedzi tekstowe w obu narzędziach, wybiorę najlepszy wynik, a następnie zmodyfikuję go za pomocą funkcji malowania. Zobaczymy, jak obie aplikacje poradzą sobie z tym samym zadaniem. Po każdej rundzie przyznam punkty za jakość malowania, aby na koniec wyłonić zwycięzcę.
Podpowiedź 1
Opancerzony wojownik stojący na szczycie klifu, z widokiem na rozległą armię, a zachodzące słońce rzuca złote światło na całą scenerię.
W Midjourney (po lewej) celowo pominąłem fragment z wojskiem.
Zadanie malowania: Zmiana tła na bujny, zielony las.
Malowanie w Midjourney
Co zaskakujące, w tle Midjourney pojawiło się również kilku żołnierzy. Jakość lasu zależy w dużej mierze od tego, jak precyzyjnie posłużymy się narzędziem lasso do wyznaczenia granic. Ponieważ jest to proces manualny, zawsze mogą pojawić się ostre krawędzie. Mimo to, uważam tę pracę za ponadprzeciętną, ponieważ dobrze połączyła element wojownika z niebem.
Ocena za malowanie: 7/10
Adobe Firefly
Zauważyłem, że w interfejsie Adobe Generative Fill nie można cofnąć wykonanej zmiany. Dostępna jest jedynie opcja „Wyczyść”, która resetuje wszystkie edycje. Duży minus dla Adobe za to rozwiązanie 👎.
Firefly również poradził sobie całkiem nieźle ze zmianą tła na zielony las.
Jednak (nie jestem z nikim powiązany) estetyka Adobe wydaje mi się bardziej nienaturalna. Drzewa (za wyjątkiem tego, które znajduje się obok wojownika) wydają się „dosadzone”. Ponadto, mimo że światło słoneczne pada z lewego górnego rogu, pomarańczowy odcień wokół wojownika wygląda na niepasujący.
Ocena za malowanie: 5/10
Zwycięzca: Midjourney
Podpowiedź 2
Młody wynalazca gorliwie pracujący w zagraconym warsztacie, otoczony skomplikowanymi gadżetami naukowymi.
Od razu widać, że Midjourney domyślnie generuje bardziej filmowe obrazy, natomiast Adobe Firefly prezentuje grafiki o bardziej realistycznym charakterze. Co więcej, Adobe Firefly ma pewne trudności z odwzorowaniem ludzkiego ciała, przez co większość obrazów wygląda na zniekształcone.
Zadanie malowania: Dodanie badaczowi maski Spider-Mana.
Malowanie w Midjourney
Było to dość proste zadanie, z którym Midjourney poradziło sobie znakomicie. Maska idealnie pasuje do twarzy i wygląda jak z filmu o Spider-Manie.
Ocena za malowanie: 10/10.
Adobe Firefly
Najwyraźniej Firefly nie ma pojęcia o Spider-Manie i uzyskał okrągłe zero.
Ocena za malowanie: 0/10
Zwycięzca: Midjourney
Podpowiedź 3
Stado cybernetycznych wilków przemierzających gęsty, pokryty śniegiem las, z oczami świecącymi w blasku księżyca.
W Midjourney do pewnego stopnia brakuje motywu „cybernetycznego”, natomiast kreacja Adobe sprawia wrażenie komiksowej. Mimo to Adobe wyraźnie odwzorowało „śnieżny las”, a jego wilki przypominają bardziej roboty.
Zadanie malowania: Zamiana wilków na małpy jedzące banany.
Malowanie w Midjourney
Poza drobnym zniekształceniem, małpy zostały przedstawione w sposób akceptowalny. Jednak nie udało się wygenerować ich jedzących banany, co wydawałoby się całkiem łatwe.
Ocena za malowanie: 3/10
Adobe Firefly
Chociaż małpy wyglądają nieco dziwnie, przynajmniej trzymają coś, co przypomina banana. Mimo to, ich twarze mogłyby być nieco bardziej wyraziste.
Nie jest to idealny wynik, ale ogólnie jest lepszy niż w Midjourney.
Ocena za malowanie: 4/10
Zwycięzca: Adobe Firefly
Podpowiedź 4
Obcy grający na gitarze pod latarnią uliczną, a tłum ludzi słucha go z uwagą.
Oba narzędzia wygenerowały akceptowalne obrazy. Midjourney zachwyca naturalnością, aż do przesady. 😀 Rezultaty Firefly ponownie ucierpiały z powodu zniekształceń twarzy i dłoni. Jedynie lewy dolny obraz jest w miarę akceptowalny, jeśli pominiemy jego absurdalny charakter.
Zadanie malowania: Zmiana tła na słoneczny dzień z tęczą.
Malowanie w Midjourney
Ten obraz zdecydowanie się nie udał. W żadnym z wygenerowanych wariantów nie pojawiła się tęcza. Ponadto, nie rozumiem, dlaczego Midjourney przeszło z realistycznych scenerii do animowanego otoczenia.
Jedynym plusem jest ilustracja słonecznego dnia.
Ocena za malowanie: 4/5
Adobe Firefly
Z drugiej strony, Firefly dosłownie potraktował podpowiedź. W tym momencie staje się jasne, że większość wypełnień generatywnych Adobe nie jest przyjemna dla oka.
Efekt jest sztuczny i od razu widać, że obraz został „przerobiony w Photoshopie”. Tak więc, chociaż zawiera wszystkie elementy, o które prosiłem, ostateczny obraz wydaje się po prostu fałszywy.
Ocena za malowanie: 5/5
Zwycięzca: Adobe Firefly
Podpowiedź 5
Magiczny ogród z czekoladowym stawem, czekoladowym drzewem oraz zachwycającą florą i fauną inspirowaną kakao.
Żadna z kreacji Midjourney nie była tak mocno inspirowana czekoladą, co jest rozczarowujące, bo zadanie wydawało się dość proste.
Natomiast po raz pierwszy w tej serii Adobe Firefly zrobił to perfekcyjnie. Wszystkie zdjęcia były zachwycające i trudno było wybrać jedno.
Zadanie malowania: Dodanie fontanny waniliowej.
Malowanie w Midjourney
Midjourney nadrobił słabe przedstawienie czekolady, dodając głęboką, waniliową fontannę. Można było to zrobić na wiele innych sposobów, ale wątpię, czy narzędzie AI mogłoby to zrobić lepiej.
Ocena za inpainting: 9/10
Adobe Firefly
Otrzymujemy obraz od Firefly, który dobrze komponuje się z resztą. Mimo to Midjourney jest nieco lepszy pod względem ogólnej estetyki.
Ocena za malowanie: 8/10
Zwycięzca: Midjourney
Ogłaszamy mistrza Inpaintingu!
Midjourney (33/50) zdecydowanie wygrywa z Adobe Firefly (22/50). Powodem, dla którego tak się stało, jest to, że funkcja inpainting w Midjourney jest po prostu bardziej wydajna.
Z drugiej strony, Firefly ma problemy z łączeniem. Jego modyfikacje w większości wyglądają jak nakładki, co podważa cel zadania malowania. Ponadto, wydaje mi się, że wyniki Firefly są powiązane z Adobe Photoshop, co w niektórych przypadkach może być zaletą, ale w innych może przynieść odwrotny skutek. Co więcej, Adobe musi jeszcze popracować nad ilustracją ludzkiego ciała, ponieważ w większości przypadków występuje pewien stopień zniekształcenia.
W przypadku Midjourney, interfejs użytkownika nie jest tak intuicyjny i ma tendencję do bagatelizowania podpowiedzi. Może pominąć niektóre elementy z opisu, zwłaszcza te wymienione na końcu.
Ostateczną ocenę pozostawiam Wam.
PS: Sprawdź te generatory grafiki AI, jeśli szukasz dodatkowych opcji.
newsblog.pl
Maciej – redaktor, pasjonat technologii i samozwańczy pogromca błędów w systemie Windows. Zna Linuxa lepiej niż własną lodówkę, a kawa to jego główne źródło zasilania. Pisze, testuje, naprawia – i czasem nawet wyłącza i włącza ponownie. W wolnych chwilach udaje, że odpoczywa, ale i tak kończy z laptopem na kolanach.