Jak uruchomić stabilną sztuczną inteligencję dyfuzyjną na komputerach Mac i Windows

Photo of author

By maciekx

Chcesz samodzielnie generować grafiki z tekstu, wykorzystując potencjał sztucznej inteligencji Stable Diffusion (SD AI)? Ten artykuł przedstawi Ci najprostszy, krok po kroku, sposób na osiągnięcie tego celu.

W dobie dynamicznego rozwoju sztucznej inteligencji tworzenie unikatowych ilustracji na potrzeby blogów, filmów, stron internetowych oraz aplikacji powinno być zarówno tanie, jak i szybkie. Nie musisz już być specjalistą od grafiki czy posiadać wyjątkowego zmysłu kreatywnego, aby wygenerować wspaniałe obrazy, które przyciągną uwagę czytelników, zwiększą ruch na stronie lub zainteresują użytkowników aplikacji.

Technologia generowania obrazów oparta na sztucznej inteligencji może również znacząco zwiększyć efektywność Twoich aplikacji internetowych i mobilnych, które służą do projektowania graficznego i edycji.

Zapraszamy do lektury, aby dowiedzieć się, jak w prosty sposób uruchomić popularny system generowania obrazów oparty na AI, czyli Stable Diffusion AI, na komputerze z systemem macOS lub Windows.

Czym jest Stable Diffusion AI?

Stable Diffusion AI to zaawansowany model sztucznej inteligencji, który specjalizuje się w przetwarzaniu obrazów. Na podstawie wpisanego tekstu (tzw. promptu) tworzy obrazy, opierając się na różnych modelach dyfuzji. Wykorzystuje proces dyfuzji, aby iteracyjnie budować obraz.

W przeciwieństwie do innych systemów AI generujących obrazy, Stable Diffusion nie tworzy obrazu w jednym kroku, na podstawie zbiorów danych treningowych. Zamiast tego stosuje proces dyfuzji, krok po kroku, stopniowo ulepszając obraz w kolejnych iteracjach.

Jeśli miałeś okazję korzystać z narzędzi AI, takich jak MidJourney, DALL-E, Contrastive Language-Image Pre-Training (CLIP), Playground AI, z pewnością docenisz możliwości Stable Diffusion. Pozwala on na tworzenie wyobrażonych obrazów od podstaw. Generowane grafiki cechują się wysoką jakością, umożliwiającą ich wykorzystanie na stronach internetowych, w aplikacjach, a także w materiałach marketingowych.

Dlaczego warto uruchamiać Stable Diffusion AI lokalnie?

Stable Diffusion AI to narzędzie open source. Oznacza to, że każdy może pobrać gotowy model lub punkt kontrolny (checkpoint) z publicznych repozytoriów i generować obrazy samodzielnie. Istnieją dwa sposoby korzystania z tego narzędzia:

  • Korzystanie z kosztownych aplikacji internetowych.
  • Uruchamianie lokalne na komputerze PC lub Mac, co pozwala zaoszczędzić pieniądze.
  • Oto kilka powodów, dla których warto uruchomić Stable Diffusion AI na własnym komputerze:

  • Zachowujesz pełną własność wygenerowanych treści. Nie musisz przypisywać autorstwa żadnym narzędziom ani organizacjom.
  • Możesz tworzyć tysiące obrazów na potrzeby komercyjne lub osobiste, nie ponosząc żadnych kosztów.
  • Unikasz konieczności opłacania drogich subskrypcji internetowych narzędzi do generowania obrazów.
  • Masz dostęp do setek ustawień, które pozwalają na modyfikację finalnego obrazu według własnych preferencji.
  • Możesz generować obrazy offline, bez konieczności połączenia z Internetem.
  • Prawdopodobnie najważniejszym powodem, dla którego warto uruchamiać SD AI lokalnie, jest możliwość modyfikacji modelu treningowego i generowanych wyników. Możesz na przykład dostosować następujące ustawienia:

    • Skalowanie obrazu
    • Opcje wyostrzania
    • Przywracanie szczegółów twarzy
    • Dostosowywanie modeli AI
    • Parametry samplera
    • Generowanie obrazu z tekstu (text-to-image)
    • Generowanie obrazu na podstawie innego obrazu (image-to-image)
    • Łączenie punktów kontrolnych
    • Dostosowywanie rozdzielczości, szerokości, wysokości obrazu

    Teraz, kiedy wiesz już więcej na temat SD AI i zalet jego lokalnego uruchamiania, zapoznaj się z instrukcjami, które pozwolą Ci go uruchomić na komputerach PC z systemem Windows oraz na komputerach Mac:

    Jak uruchomić Stable Diffusion AI w systemie Windows?

    Proces uruchamiania SD AI na komputerze polega na instalacji niezbędnych pakietów oprogramowania, a następnie pobraniu najnowszego punktu kontrolnego lub modelu treningowego AI z publicznego repozytorium.

    Po pobraniu punktu kontrolnego należy połączyć go z interfejsem graficznym Stable Diffusion i można rozpocząć generowanie obrazów. Poniżej znajduje się szczegółowy opis całego procesu. Postępuj zgodnie z instrukcjami, aby bez problemu uruchomić SD AI już za pierwszym razem.

    Wymagania sprzętowe komputera

    Ponieważ generowanie obrazów za pomocą sztucznej inteligencji wymaga wykonywania milionów obliczeń, do tego zadania należy użyć komputera o odpowiedniej wydajności. Twój komputer powinien posiadać następujące parametry, aby SD AI działał płynnie:

    • System Windows 8, 10 lub 11
    • Wielordzeniowy procesor 64-bitowy, np. Intel Core i7 12. generacji lub nowszy
    • 16 GB pamięci RAM DDR4 lub DDR5 (lub więcej)
    • Dysk NVMe SSD, aby przyspieszyć wykonywanie kodu z dysku
    • Dedykowana karta graficzna NVIDIA lub Radeon z 8 GB pamięci VRAM lub więcej
    • Karta z 4 GB VRAM również będzie działać, ale może wystąpić spowolnienie przetwarzania
    • Połączenie z Internetem, aby regularnie aktualizować pakiety oprogramowania
    • Wydajny system chłodzenia procesora, ponieważ generowanie i ulepszanie obrazów za pomocą sztucznej inteligencji są procesami obciążającymi, które generują duże ilości ciepła

    Pobierz i zainstaluj Git

    Na początek należy pobrać i zainstalować system kontroli wersji Git. Oto jak to zrobić:

  • Przejdź do strony Git Download dla systemu Windows.
  • Kliknij przycisk 64-bitowy Git for Windows Setup, aby pobrać plik instalacyjny.
  • Przejdź do folderu, do którego pobrałeś plik i kliknij dwukrotnie plik Git-2.41.0-64-bit.
  • Kliknij Uruchom, a następnie kolejno Dalej w każdym oknie dialogowym.
  • Pozwól programowi się zainstalować.
  • Po zakończeniu instalacji kliknij Zakończ.
  • Pobierz i zainstaluj Pythona

    Stable Diffusion wykorzystuje biblioteki Pythona do uruchamiania modeli AI, wykonywania złożonych obliczeń matematycznych itp. Dlatego konieczne jest zainstalowanie najnowszej wersji Pythona na komputerze. Wykonaj następujące kroki:

  • Przejdź do strony pobierania Pythona dla systemu Windows.
  • Kliknij przycisk Pobierz Pythona 3.XX.X.
  • Po zakończeniu pobierania przejdź do katalogu, w którym zapisałeś plik.
  • Kliknij dwukrotnie instalator i zaznacz opcję Dodaj Python.exe do PATH.
  • Kliknij Zainstaluj teraz.
  • Po zakończeniu instalacji zamknij instalator.
  • Sklonuj WebUI Stable Diffusion na PC

    Aby uruchomić SD AI na komputerze, potrzebny jest interfejs graficzny. Ułatwia on generowanie obrazów. Nie musisz pamiętać skomplikowanych poleceń Pythona, aby generować obrazy z tekstu, obrazu, modyfikować ustawienia modelu AI itp.

    Najpierw utwórz katalog na dysku lokalnym, w którym chcesz umieścić interfejs Stable Diffusion WebUI z serwisu GitHub. W tym katalogu będą również przechowywane punkty kontrolne i modele treningowe SD AI. Przejdź do dowolnego dysku, kliknij prawym przyciskiem myszy i wybierz opcję Nowy folder. Zmień nazwę folderu na StableDiffusionAI.

    Teraz możesz sklonować webUI SD AI do tego folderu, używając klienta Git i repozytorium GitHub. Wykonaj następujące kroki:

  • W folderze StableDiffusionAI kliknij prawym przyciskiem myszy i wybierz Git-Bash here z menu kontekstowego.
  • Spowoduje to otwarcie interfejsu wiersza poleceń klienta Git.
  • Następnie przejdź do strony AUTOMATIC1111/stable-diffusion-webui w serwisie GitHub i kliknij przycisk Kod.
  • W menu kontekstowym Kod kliknij zakładkę Lokalne, a następnie ikonę kopiowania do schowka pod zakładką HTTPS.
  • W ten sposób skopiowałeś adres URL interfejsu internetowego SD AI. Poniżej znajdziesz instrukcje, jak sklonować go na komputerze za pomocą klienta Git.

  • W Git-Bash CLI, w katalogu StableDiffusionAI,
  • Skopiuj i wklej następujący kod:
  • git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

  • Naciśnij Enter, a klient Git rozpocznie importowanie komponentów webUI SD AI do wybranego folderu.
  • W ten sposób utworzyłeś pliki potrzebne do uruchomienia Stable Diffusion AI przy użyciu interfejsu graficznego.

    Pobierz modele AI lub punkty kontrolne

    Teraz musisz pobrać najnowszy model treningowy lub punkt kontrolny Stable Diffusion AI.

  • Odwiedź oficjalną stronę punktu kontrolnego Stable Diffusion AI w serwisie Hugging Face.
  • Przewiń w dół do sekcji Pobierz wagi.
  • Powinny się tam znajdować następujące pliki:
    • sd-v1-4.ckpt
    • sd-v1-4-full-ema.ckpt
  • Kliknij sd-v1-4.ckpt, aby rozpocząć pobieranie pliku.
  • Pobieranie może zająć trochę czasu, ponieważ model ma 4 GB.
  • Po zakończeniu pobierania przejdź do folderu z pobranymi plikami.
  • Skopiuj plik sd-v1-4 i wklej go do następującego katalogu:
  • StableDiffusionAI > stable-diffusion-webui > models\Stable-diffusion

    Do tego momentu przygotowałeś komputer do lokalnego uruchamiania Stable Diffusion AI. Wykonaj jeszcze poniższe kroki, aby interfejs webUI uruchomił właściwy program AI.

    Uruchom Stable Diffusion AI

    Wykonaj poniższe kroki, aby korzystać z interfejsu internetowego SD AI do tworzenia obrazów generatywnych przy użyciu modeli dyfuzji:

  • Przejdź do folderu StableDiffusionAI.
  • Znajdź plik webui-user.bat i kliknij go prawym przyciskiem myszy.
  • Kliknij Edytuj, aby otworzyć plik wsadowy w Notatniku.
  • W pliku Notatnika, powyżej linijki @echo off, dodaj następujący kod:
  • git pull
  • Kliknij Plik w górnym menu, a następnie Zapisz.
  • Teraz kliknij dwukrotnie plik webui-user.bat, aby otworzyć interfejs wiersza poleceń.
  • WebUI zacznie pobierać PyTorch, platformę deep learningu do uczenia maszynowego.
  • Poczekaj na zakończenie tego etapu przygotowania.
  • Gdy w oknie CLI zobaczysz następujący tekst, proces jest zakończony:
  • Przewiń okno CLI do sekcji, w której widoczny jest tekst Uruchamianie na lokalnym adresie URL.
  • Skopiuj adres IP znajdujący się obok i wklej go w pasku adresu przeglądarki internetowej.
  • Naciśnij Enter, aby otworzyć webUI SD AI.
  • Teraz możesz wpisać dowolny tekst w polu prompt txt2img. Naciśnij Generuj, aby uzyskać obraz. Na przykład ja wpisałem następujący tekst:

    Utwórz obraz komputera z systemem Windows 11 na biurku.

    A oto wynik:

    Za każdym razem, gdy chcesz uruchomić Stable Diffusion AI, musisz kliknąć plik webui-user.bat.

    Jak uruchomić Stable Diffusion AI na komputerze Mac?

    Na komputerze Mac możesz zastosować takie samo podejście, aby lokalnie uruchomić SD AI. Istnieje jednak aplikacja na macOS, którą można użyć, aby uruchomić SD AI, unikając wszystkich kroków, które musiałeś wykonać na komputerze z systemem Windows. Aplikacją tą jest DiffusionBee.

    Wymagania sprzętowe komputerów Mac

    Jeśli chcesz uruchomić SD AI na komputerze Mac, zalecane są następujące konfiguracje sprzętowe:

  • System operacyjny macOS Monetery (macOS 12.5.1) lub nowszy
  • Mac z chipem Apple Silicon M1 lub M2
  • 8 GB zunifikowanej pamięci lub więcej
  • 8 GB lub więcej wolnego miejsca na dysku wewnętrznym dla modeli AI i plików do przetwarzania
  • Możesz również korzystać z komputera Mac z procesorem Intel, ale szybkość przetwarzania może być mniejsza.

    Pobierz i zainstaluj DiffusionBee

    Poniżej znajduje się instrukcja krok po kroku, jak pobrać i uruchomić DiffusionBee na komputerze Mac:

  • Otwórz przeglądarkę Safari i przejdź na stronę pobierania DiffusionBeed.
  • Powinny być widoczne dwie opcje pobierania: macOS Apple Silicon i macOS Intel 64-Bit.
  • Wybierz opcję pobierania zgodną z konfiguracją Twojego Macbooka lub iMaca.
  • W powiadomieniu Zezwalaj na pobieranie kliknij Zezwól.
  • Po zakończeniu pobierania kliknij ikonę Pobrane w przeglądarce Safari.
  • Kliknij dwukrotnie plik DiffusionBee w folderze Pobrane, aby otworzyć okno instalatora.
  • Przeciągnij ikonę DiffusionBee z lewej strony do folderu Aplikacje po prawej stronie.
  • Kliknij Otwórz w wyskakującym okienku z ostrzeżeniem.
  • DiffusionBee uruchomi się i rozpocznie pobieranie niezbędnych pakietów i plików.
  • Po zakończeniu pobierania możesz zacząć korzystać z SD AI w DiffusionBee, tak jak w przypadku każdej innej aplikacji na komputerze Mac. Jest to proces jednorazowy i wymaga połączenia z Internetem. Po przygotowaniu aplikacji DiffusionBee za pomocą wymaganych pakietów możesz uruchomić ją w trybie offline.

    Uruchom Stable Diffusion AI za pomocą DiffusionBee

    Gdy aplikacja DiffusionBee będzie gotowa do akceptowania promptów „Tekst do obrazu” lub „Obraz do obrazu”, zobaczysz następujące okno:

    Kliknij zakładkę Tekst na obraz i wpisz prompt w odpowiednim polu. Na przykład ja wpisałem:

    Utwórz obraz kota leżącego na klawiaturze.

    Kliknij przycisk Opcje, aby zmodyfikować generowany obraz, zmieniając wartości następujących parametrów:

    • Liczba obrazów
    • Rozdzielczość
    • Ziarno
    • Kroki
    • Sampler
    • I wiele innych opcji

    Po zakończeniu optymalizacji modelu generatywnego AI, kliknij przycisk Generuj. Powinien pojawić się pasek postępu generowania. Po zakończeniu otrzymasz obraz podobny do tego poniżej:

    Alternatywnie możesz dostarczyć generatorowi obrazów AI własny obraz treningowy. Następnie, za pomocą odpowiedniego promptu, możesz zmodyfikować ten obraz według własnych potrzeb. Kliknij Generuj, aby uzyskać kreatywne arcydzieło od Stable Diffusion AI. Otrzymany obraz jest znacząco różny od wejściowego, więc nie będzie problemów z prawami autorskimi, jeśli opublikujesz lub zaczniesz zarabiać na wygenerowanej grafice.

    Podsumowanie

    Teraz już wiesz, jak uruchomić Stable Diffusion AI na komputerze PC z systemem Windows lub na komputerze Mac. Możesz użyć tego zaawansowanego modelu AI do tworzenia wspaniałych obrazów na potrzeby Twoich projektów. Obecnie trudno jest znaleźć darmowe zdjęcia stockowe lub grafiki wektorowe do publikacji.

    Aby pokonać to wyzwanie, możesz swobodnie korzystać z Stable Diffusion. Nie musisz podawać autora, jeśli użyjesz wyprodukowanego obrazu na własny użytek lub komercyjnie. Jeśli jesteś kreatywnym projektantem graficznym, możesz sporo zaoszczędzić, unikając kosztownych subskrypcji internetowych aplikacji Stable Diffusion.

    Następny artykuł: MidJourney vs. Stable Diffusion vs. Bing Image Creator.


    newsblog.pl