Rewolucja w generowaniu obrazów AI: Czy Flux.1 detronizuje Midjourney?
Do niedawna Midjourney dzierżył palmę pierwszeństwa wśród generatorów obrazów opartych na sztucznej inteligencji. Jednakże, na scenie pojawił się nowy gracz – model open-source o nazwie Flux.1, stworzony przez Black Forest Labs. Ten innowacyjny projekt błyskawicznie zdobywa uznanie za swoje zdolności do generowania fotorealistycznych wizualizacji. W niniejszym porównaniu Flux kontra Midjourney przyjrzymy się bliżej, który z tych systemów lepiej radzi sobie z tworzeniem obrazów o charakterze ludzkim, w tym tych o lekko surrealistycznym zabarwieniu. Zauważalny realizm generowanych grafik jest naprawdę imponujący.
Czym jest generator obrazów AI Flux?
Flux.1 to otwarty model AI do kreowania obrazów, będący owocem pracy byłych inżynierów i badaczy związanych ze Stable Diffusion. W ramach nowego przedsięwzięcia pod nazwą Black Forest Labs zaprezentowano trzy odmienne warianty modelu Flux.1. Wersja Flux.1 [pro] to model premium, przeznaczony do komercyjnych zastosowań.
Niesamowite! To bez wątpienia najbardziej realistyczne obrazy wygenerowane przez AI, jakie kiedykolwiek widziałem.
Jesteśmy zaledwie o 0,3% od osiągnięcia idealnych, **nierozróżnialnych od rzeczywistości obrazów tworzonych przez AI**.
(Przy powiększeniu wciąż widoczne są pewne niedoskonałości)
Wygenerowano przy użyciu **FLUX**. **Dolina niesamowitości**. pic.twitter.com/5BIRmZey8B— Roberto Nickson (@rpnickson) 8 sierpnia 2024
Modele Flux.1 [dev] oraz Flux.1 [schnell] są dostępne na licencji open source, a społeczność entuzjastów AI już je ulepszyła pod kątem generowania fotorealistycznych obrazów. Dzięki adapterowi Realism LoRA, wariant Flux.1 [dev] jest zdolny do tworzenia wizualnie bardzo realistycznych grafik, gdzie ludzkie dłonie prezentują się bez zniekształceń czy artefaktów.
Aby rzetelnie ocenić model AI Flux.1, przeprowadziliśmy jego porównanie z Midjourney v6.1. Wykorzystaliśmy model FLUX Realism LoRA dostępny na fal.ai (przejdź) dla przedstawień ludzkich oraz FLUX.1 [pro] (przejdź) dla obrazów krajobrazowych. Poniżej prezentujemy zestawienie wyników generowania obrazów za pomocą obu narzędzi, przy użyciu identycznych zapytań.
Flux vs Midjourney: Generowanie obrazów
1. Kobieta w drodze na poranny kurs
W pierwszej serii obrazów, wyraźnie widać, że grafika wygenerowana przez Flux charakteryzuje się wyższym poziomem fotorealizmu. Pomimo użycia parametru –style raw w Midjourney, wynikowy obraz ma stylizację zbliżoną do kreskówki.
Flux
Midjourney
2. Starsza para w parku
Ponownie, rezultat uzyskany dzięki Flux jest bardziej realistyczny i przekonujący, niż ten wygenerowany przez Midjourney. Obraz stworzony przez Midjourney przypomina raczej malowidło, podczas gdy Flux prezentuje niezwykle realistyczne ujęcie.
Flux
Midjourney
3. Obraz kucharza
W tym teście, oba wygenerowane obrazy – zarówno przez Flux, jak i Midjourney – nie przechodzą próby realizmu. Oba rezultaty mają charakter sztucznie stworzonych przez AI, aczkolwiek rezultat uzyskany przez Midjourney lepiej odzwierciedla detale, takie jak odbicia i grę świateł.
Midjourney
4. Zamek fantasy
W tym przypadku, skłaniałbym się ku wynikowi Flux, ze względu na jego wyraziste, fantastyczne przedstawienie. Obraz wygenerowany przez Midjourney jest również szczegółowy, ale nieco mniej przekonujący w kontekście fantasy.
Midjourney
5. Futurystyczne miasto nocą
W tej sytuacji można uznać wynik za remis, lecz obraz stworzony przez Flux wydaje się nieco bardziej przejrzysty, podczas gdy Midjourney wygenerował wizualnie bogaty, aczkolwiek nieco chaotyczny obraz.
Midjourney
6. Gazeta z czytelnymi literami
W ostatnim teście, zarówno Flux, jak i Midjourney bardzo dobrze poradziły sobie z odwzorowaniem tekstu. Jest to obszar, który zazwyczaj sprawia trudność modelom syntezy obrazów. Fakt, że otwarty model, jakim jest Flux, potrafi konkurować z zamkniętym modelem, takim jak Midjourney, jest obiecujący.
Midjourney
Zwycięzca: Flux
Flux vs Midjourney: Ceny
Przechodząc do kwestii cen, warto zaznaczyć, że Flux jest projektem darmowym i o otwartym kodzie źródłowym, jednakże aby uruchomić model lokalnie, wymagany jest komputer o dużej mocy obliczeniowej, wyposażony w dedykowaną kartę graficzną (GPU). Wynika to z faktu, że jest to model o 12 miliardach parametrów. Najłatwiejszym sposobem na korzystanie z Flux na lokalnym sprzęcie jest aplikacja Pinokio (strona). Wystarczy pobrać aplikację i rozpocząć generowanie obrazów za pomocą Flux.
Oprócz tego, dostępnych jest szereg usług, które umożliwiają generowanie obrazów za pomocą modelu Flux bezpłatnie. Należy jednak pamiętać, że darmowe opcje mogą wiązać się z ograniczonym dostępem kredytów lub dłuższym czasem generowania, co jest zależne od obciążenia systemu.
Model Flux.1 [dev] można bezpłatnie wypróbować na platformie HuggingFace (strona). Kolejną opcją jest platforma fal.ai (strona), gdzie dostępne są modele LoRA, jednak użytkownik otrzymuje jedynie kredyty o wartości 1 USD. Po ich wykorzystaniu, konieczne jest dokupienie dodatkowych kredytów, w zależności od stopnia wykorzystania usługi.
Z drugiej strony, Midjourney jest usługą płatną, której koszt wynosi 10 USD miesięcznie przy rozliczeniu comiesięcznym. Jednak, zaletą Midjourney jest szybkość generowania obrazów oraz intuicyjny interfejs użytkownika.
Zwycięzca: Flux
Flux vs Midjourney: Funkcje
Ze względu na to, że Flux jest stosunkowo nowym modelem na rynku, nie oferuje on od razu rozbudowanych funkcji edycji obrazów. Istnieją jednakże serwisy, takie jak BasedLabs (strona), które umożliwiają wprowadzanie poprawek do obrazów, a także definiowanie ich proporcji. Użytkownik ma również możliwość wyboru liczby generowanych obrazów jednocześnie. Zaawansowani użytkownicy mogą modyfikować parametry, takie jak wartość seed, liczba kroków, czy ustawienia redukcji szumów.
W odróżnieniu od Flux, Midjourney jest znacznie bogatszy w funkcje, oferując szeroki wachlarz możliwości. Na początku, użytkownik ma możliwość ustawienia proporcji obrazu, wyboru estetyki oraz stylu. Dostępna jest opcja korzystania ze starszych modeli Midjourney, a także tworzenia naturalnie wyglądających obrazów dzięki opcji **Raw**.
Ponadto, po wygenerowaniu obrazu, użytkownik ma możliwość jego powiększenia, oddalenia, dodania szczegółów, wypełnienia fragmentów za pomocą narzędzia lasso, przekształcenia kadru i wiele innych. W zasadzie, obraz można modyfikować poprzez uruchamianie nowych zapytań, co jest niezwykle przydatne. W związku z tym, w kwestii możliwości edycji, Midjourney oferuje obecnie więcej narzędzi i kontroli, niż Flux.
Zwycięzca: Midjourney
Flux vs Midjourney: Uprawnienia do treści
Jeżeli jesteś twórcą, doceniłbyś z pewnością usługę, która wspiera standard Content Credentials. Pomaga on w uzyskaniu informacji o pochodzeniu obrazu, a także w weryfikacji, czy był on poddawany modyfikacjom. Niestety, ani Midjourney, ani Flux nie wspierają tego standardu. Oznacza to, że te usługi nie dodają żadnych weryfikowalnych metadanych do tworzonych przez AI obrazów.
Zwycięzca: Żaden
To podsumowuje nasze porównanie między Flux a Midjourney. Uważamy, że model Flux to godna uwagi i bezpłatna alternatywa dla Midjourney. Społeczność open source ma potencjał, aby dalej rozwijać ten projekt, dodając kolejne przydatne funkcje, takie jak edycja i malowanie zewnętrzne. Na tym kończymy nasze porównanie. Jeśli masz jakieś pytania, zapraszamy do zadawania ich w komentarzach poniżej.
newsblog.pl