Są jakieś darmowe generatory obrazów? Testowałem kilka, ale za możliwość generowania obrazów trzeba prędzej czy później płacić.
https://github.com/comfyanonymous/ComfyUI
Trzeba trochę pokombinować, aby wszystko fajnie działało, ale potem idzie już z górki. Jest to oparte o stable diffusion, więc jest to w pełni darmowe i otwarte oprogramowanie.
Plusów jest od groma. Nie ma cenzury, a program działa lokalnie, wiec nawet nie potrzeba internetu aby działał. Nie ma też śmiesznych limitów jak np. w generatorze MS. Można tworzyć obrazki w dowolnym stylu, trzeba tylko użyć odpowiedniego modelu. Te można wziąć np. z https://civitai.com/
Jedyny minus jest jak masz słabszą kartę. Na mojej GTX 960 stworzenie obrazka w rozdziałce 768x1024 trwa zazwyczaj od 3 do 5 minut w zależności od użytego modelu, wiec szału nie ma, ale to i tak szybciej niż w generatorze MS po uplywie limitu. Oczywiście można tez przyspieszyć tworzenie wybierając mniejszą rozdziałkę, a potem dodać upscaler, który zwiększa rozdzielczość i ulepsza jakość obrazków.
No a jak masz nowszą, to tworzenie będzie dużo szybsze, więc ten problem cię nie będzie dotyczył. Wtedy stworzenie obrazka trwa od kilku do kilkunastu sekund.
Zacząłem korzystać z tego w połowie grudnia i od tamtej pory z innych generatorów już praktycznie nie korzystam. Zdarza mi się jeszcze, jak chce na szybkiego wygenerować coś do wątku ze zgadywaniem gier.
Też "polecam", aczkolwiek jeszcze u siebie nie odpaliłem :D
Czeka w kolejce.
Polecasz może jakieś strony, gdzie można znaleźć jakieś wstępne "pipeliny" pod konkretne zadania/typy obrazków jakie chcemy wygenerować?
Na civitai jest tego bardzo dużo, bo strona od razu wykrywa prompty i ustawienia użyte do stworzenia większości obrazków. Na tensor art też są, chociaż ja bardzo rzadko tam wchodzę przez to, że bardzo dużo modeli ma zablokowaną możliwość pobierania i możliwe jest jedynie generowanie przez stronę.
Trzeba wziąć jeszcze pod uwagę to, że nie zawsze zastosowanie identycznego prompta i ustawień na tym samym modelu da podobny efekt. Różnice te wynikają z tego, że comfyui nieco różni sie od Automatic1111, z którego większość korzysta oraz z tego, że jak ktoś korzysta z upscalera lub innej funkcji podbijających jakość obrazków, to nie jest to wykrywane przez civitai.
Mi dobre kilka dni zajęło ogarnięcie niektórych opcji, a i tak nadal wielu nie używam. Warto też czytać komentarze, bo czasami można sie czegoś przydatnego dowiedzieć.
Tak tak, to oczywiste, że mogą być rozbieżności, tylko bardziej w stronę taką, że chciałem użyć AI do wygenerowania unikalnego tatuażu i przydałby się jakiś base pipeline z jakimś zestawem pozytywnych/negatywnych promptów, które mogą wspomóc w wygenerowanie możliwie najlepszego obrazka ;-)
Negatywnych promptów poszukaj w zakładce embeddings. Troche tego wyszło, ale ludzie zazwyczaj uzywaja czegoś pokroju easynegative, deepnegative, bad artist negative, verybadimagenegative itd.
Co do pozytywnych, to tutaj jest trudniej, bo do tatuaży większość używa lor, które zazwyczaj wystarczy jedynie aktywować i te same generują jakiś tatuaż. Chociaż jak teraz patrzę na civitai, to niektóre wyglądają spoko, tylko trzeba chyba założyć konto i wyłączyć filtry, bo wiekszość używa ich do generowania obrazków NSFW.
Wygląda jak połączenie squirtla/blastoisa i charizarda :D
Via Tenor
Wpisałem co prawda tylko Blastoise i Charizard, ale wygrałeś żółwika.
Pierwsza myśl to był squirtle, ale jak zobaczyłem, że jest dosyć spory, to dodałem blastoisa jako alternatywe :)
Na YT powinny być, bo sam patrzyłem, jak to na początku skonfigurowac i za co odpowiadają jakie opcje. Za to do samego uruchomienia nie potrzeba poradnika. Wystarczy, że pobierzesz zipa z githuba i po rozpakowaniu uruchomisz plik run_nvidia_gpu.bat, który jest w głównym folderze. Wtedy wszystkie potrzebne pliki do uruchomienia UI jednorazowo się pobiorą. Potem po pobraniu plików samo się uruchomi, albo poprosi o restart, ale to już zobaczysz, co ci w konsoli wyskoczy.
Co do karty to niedawno wymieniłem na rtx 4070
Z tą kartą będzie ci bardzo szybko tworzyć.
Powracając do tematu. Żeby móc uruchomić program ComfyUI w pliku konfiguracyjnym extra_model_paths.yaml należy podać ścieżkę do folderu z jakimś chyba ubdate ale nie bardzo wiem właśnie jaki. Obejrzałem sobie kilka poradników ale i tak do końca nie wiem który bo to nie jest dokładnie pokazane. Może ktoś wie o jaki dokładnie folder chodzi?
W tym pliku jest jest coś takiego
base_path: path/to/stable-diffusion-webui/
checkpoints: models/Stable-diffusion
configs: models/Stable-diffusion
vae: models/VAE
loras: |
models/Lora
models/LyCORIS
upscale_models: |
i właśnie w nim trzeba podać. Ktoś potrafi to dokładnie pokazać?
Ale tam w instrukcji ten plik jest przy sekcji
How do I share models between another UI and ComfyUI?
co nie wydaje mi się krokiem obowiązkowym do podstawowej instalacji ;-)
Ten gościu tu to tłumaczy ale nie kumam właśnie o który konkretnie folder chodzi.
https://youtu.be/KTPLOqAMR0s?t=91
co nie wydaje mi się krokiem obowiązkowym do podstawowej instalacji ;-)
Pisze mi właśnie w konsoli że trzeba jakiś podać
Gość mówi wprost - jeżeli używasz automatic1111 i masz tam modele i chcesz ich użyć w comfyUI to wtedy dopiero modyfikujesz ten plik - usuwasz .example i w poliku wskazujesz ścieżkę do modeli z automatic1111
Wrzuć screena z błędu
Jak uruchamiam plik update_comfyui.bat to pojawia się konsola i piszę w niej to co jest na fotce. To jest właśnie chyba spowodowane tym że podaje złą ścieżkę. Nie mogę tego zakumać jakoś.
Ja używam immgai.pro i do domowych rzeczy wystarcza