Spis
treści
Midjourney
Midjourney to potężne narzędzie w wersji Beta służące do generowania grafik na podstawie krótkiej informacji podanej systemowi w języku naturalnym lub za pomocą kilku słów kluczowych. Aby móc z niego korzystać, musisz dołączyć do grupy na Discordzie. Na ich oficjalnej stronie możesz znaleźć instrukcję, jak korzystać z kanału. Na obecną chwilę (kwiecień 2023) Midjourney ma ponad 13 milionów użytkowników, w tym ponad milion aktywnych.
Jego darmowa wersja pozwala na generowanie odpowiedzi na 25 zapytań. Możliwe jest też wykupienie płatnej wersji pozwalającej na nielimitowane generowanie obrazów przez AI i pełen dostęp do społeczności, w tym do pisania na kanale prywatnym z czatem, co przyspiesza pracę i generowanie kreacji.
By wygenerować obraz należy wykorzystać funkcję “/imagine” łącznie z naszym zapytaniem. Bot wygeneruje odpowiedź w ciągu 60 sekund, która pokaże 4 przykłady obrazków w niskiej rozdzielczości. Następnie użytkownik może wybrać jedną z 4 propozycji i pracować nad zwiększaniem jej szczegółowości lub tworzyć jej zbliżone wariacje. Finalny utwór będzie wysokiej jakości i szczegółowości.
Tak wygląda generowanie grafik przez Midjorney w praktyce:
- wstępne zapytanie z wykorzystaniem funkcji /imagine:
Źródło: własny zrzut ekranu z narzędzia
- wybranie opcji zwiększenia szczegółowości i jakości 3. propozycji:
Źródło: własny zrzut ekranu z narzędzia
- wygenerowanie wariacji tej propozycji:
Źróło: własny zrzut ekranu z narzędzia
- uzyskanie finalnej wersji:
Źródło: własny zrzut ekranu z narzędzia
Jak widać, narzędzie jest potężne, a jednocześnie bardzo proste.
Ma jednak swoje ograniczenia – tak jak generuje wysokiej jakości i szczegółowości obrazy, tak ma wyzwanie z tym, z czym mają wyzwanie artyści. na których pracach bazuje: proporcjami, oczami, dłońmi itp.
Inny obszar generujący wyzwania to design, m.in. tworzenie logo i logotypów. Jak widać na poniższym screenie, system musi się jeszcze nauczyć większego “rozumienia” zapytania:
Źródło: własny zrzut ekranu z narzędzia
Midjourney to jedno z najpotężniejszych i najprostszych narzędzi kreatywnych dostępnych obecnie na rynku.
Warto także wspomnieć, że… wywołało ono “burzę“ prawną. W świecie kreatywnym to o nim mówiło się, zanim ChatGPT zawładnął uwagą publiczną za sprawą pisania tekstów przez AI. Dlaczego? Midjourney to narzędzie tworzące obrazy opierając się o ML, które uczyło się na gigantycznej bazie prac artystów i twórców znanych z kart historii sztuki, jak i współczesnych. I właśnie dlatego wywołał niemałe zamieszanie w świecie kreatywnym.
Jego działanie było szeroko bojkotowane (co np. można było zobaczyć na Artstation – screen poniżej) i skończyło się zbiorowym pozwem artystów.
Źródło: ArtStation
Czego dotyczy bojkot i pozew? Praw autorskich. Artyści i rzemieślnicy domagają się wprowadzania regulacji prawnych nt. możliwości wykorzystania ich prac do nauki algorytmów AI/ML za ich zgodą i otrzymywania honorarium z tego wynikającego.
Ze względu na negatywny odbiór tworzonych prac portale kreatywne typu ArtStation wprowadziły możliwość dodania tagów uniemożliwiających korzystanie przez AI z prac znajdujących się na portalu. Wspomniany portal dodał także konieczność oznaczania prac wprowadzanych przez użytkowników, które były wygenerowane za pomocą AI.
Midjourney to świetne narzędzie kreatywne, jakie stanie się pomocą w generowaniu inspiracji dla artystów czy zautomatyzowaniu prac powtarzalnych – szkiców, wstępnych koncepcji. Szczególne zastosowanie znajdzie najpewniej w dziedzinie gier komputerowych i karcianych, ilustracji, animacji, concept arcie. Najpewniej znajdzie także swoje miejsce w przypadku osób prowadzących działania w Social Media, wśród grafików i marketingowców.
Jednocześnie sytuacja prawna Midjourney może wskazywać niejako kierunek, w którym będzie iść akceptacja społeczna w kwestii systemów uczących się oraz AI, jak i wygenerowanych przez nich utworów. Należy szczególną uwagę zwrócić na aktualizację prawa krajowego i międzynarodowego w tym zakresie. Warto obserwować temat i decyzje organów prawnych.
DALL-E 2
DALL-E 2 to system od OpenAI umożliwiający tworzenie obrazów na podstawie opisu tekstowego. Możemy tutaj zarówno tworzyć unikalne obrazy za pomocą łączenia i miksowania konceptów i stylów, jak i działać na istniejącym obrazie – rozszerzać o to, co na nim niewidoczne, dodawać i usuwać z niego wybrane elementy, utrzymując wiarygodny światło-cień i odbicia. Finalnie możemy w nim także tworzyć wariacje na temat istniejącego obrazu.
źródło: własny zrzut ekranu z narzędzia
Na pierwszy miesiąc otrzymuje się 50 “kredytów”, czyli możliwości tworzenia obrazów. Kolejne miesiące zapewniają 15 kredytów. Jest również możliwość ich dokupienia.
DALL-E 2 analizuje obrazy dostępne w sieci i ich opisy, porównując je z treścią wpisaną przez użytkownika. Zapytanie wprowadzamy w języku naturalnym, określając dodatkowo stylistykę (realizm, impresjonizm itd.). Na tej bazie otrzymujemy 4 propozycje grafik, które następnie możemy modyfikować.
Źródło: własny zrzut ekranu z narzędzia
Możemy poprosić system o wygenerowanie wariacji danego obrazu:
Źródło: własny zrzut ekranu z narzędzia
W tym momencie narzędzie nie jest doskonale. Trzeba naprawdę dobrze poznać sposób działania zapytań, aby uzyskać zbliżony efekt do oczekiwanego. Często także generuje błędy lub treści zupełnie odmienne od zapytania.
DALL-E 2 jest mniej intuicyjny, a generowane obrazy gorszej jakości niż w Midjourney. Mimo to warto wykorzystać 50 darmowych “kredytów” na zapoznanie się z jego możliwościami.
Nowość od Adobe: Adobe Firefly
Adobe Firefly dostępny jest obecnie w wersji Beta. Podobnie jak powyższe systemy, Firefly również opiera się o zapytania zadane w języku naturalnym.
Źródło: https://www.adobe.com/sensei/generative-ai/firefly.html
Narzędzie zapowiada się na solidnego konkurenta dwóch powyższych.
Ma między innymi umożliwiać:
- tworzenie grafik na bazie szkiców przesłanych do systemu
Źródło: https://www.adobe.com/sensei/generative-ai/firefly.html
- dostosowanie wygenerowanych propozycji do własnych potrzeb – co jest silną przewagą nad konkurentami
- zmianę nastroju zaimportowanego zdjęcia lub video, w tym nawet pogody
Źródło: https://www.adobe.com/sensei/generative-ai/firefly.html
- tworzenie plakatów, banerów i grafik pod social media
Źródło: https://www.adobe.com/sensei/generative-ai/firefly.html
- generowanie obrazów na bazie zaimporotwanego moodboardu (tablica inspiracji)
Źródło: https://www.adobe.com/sensei/generative-ai/firefly.html
- tworzenie efektów dla tekstów i liter, umożliwiając zmianę ich kolorów, efektów, zastosowanego fontu i wiele więcej
Źródło: https://www.adobe.com/sensei/generative-ai/firefly.html
Jak widać na materiałach promocyjnych, możliwe będzie zarówno modyfikowanie ręcznie wybranych elementów, jak i dostosowanie stylu, światła, kompozycji, przycięcia, pojedynczych elementów, Możliwa jest też zmiana nastroju obrazu, a nawet mimiki twarzy!
Źródło: https://www.adobe.com/sensei/generative-ai/firefly.html
Dodatkowo w planach Adobe jest rozwinięcie systemu w przyszłości tak, by mógł obsługiwać i tworzyć grafiki 3D.
Obecnie narzędzie dostępne jest w wersji Beta. By skorzystać z wersji Beta należy wysłać prośbę o otrzymanie dostępu. Warunkiem uczestnictwa jest posiadanie Adobe ID oraz ukończenie 18 r.ż. Zaproszenia będą stopniowo wysyłane do osób zgłaszających chęć uczestnictwa.
Po wyjściu z tej fazy twórcy będą mogli korzystać z Firefly na zasadach komercyjnych.
Co także jest mocnym wyróżnikiem, to to, że Firefly posiada systemy uczące się bazujące na zbiorze danych z Adobe Stock, a także na tworach działających na otwartej licencji, jak i tych, należących do domeny publicznej (twórczość, do jakiej prawa autorskie wygasły). Firma jest w trakcie opracowywania modelu wynagrodzeń dla twórców, których prace są wykorzystywane do nauki systemu.
Utwory stworzone na podstawie Firefly będą w przyszłości zawierały także tag Content Credentials, określający ich stworzenie za pomocą AI. Dodatkowo trwają prace nad tagiem “Do Not Train”, który pozwoli zrezygnować z uczestnictwa utworu w uczeniu generatywnych modeli szkoleniowych.
Lensa
Aplikacja służy do generowania grafik (awatarów) na bazie przesłanych przez użytkownika fotografii. Dostępna jest na Androida i iOS. W ostatnim czasie zyskała bardzo dużą popularność, a wytworzone obrazy zalały zdjęcia profilowe użytkowników Facebooka czy Instagrama.
Z aplikacji należy jednak korzystać rozważnie, bazuje bowiem na kopii Stable Diffusion tj. systemu rozpoznającego twarze. Pojawiają się też coraz częściej oskarżenia o seksualizację grafik, rasizm i łamanie praw autorskich artystów poprzez wykorzystywanie grafik z internetu do nauki algorytmów bez uprzedniej zgody i rekompensaty finansowej dla twórców oryginalnych prac.
Jest to płatna aplikacja rosyjskiej firmy Prisma Labs.
Stable Diffusion
Stable Diffusion jest podobny w swojej funkcjonalności do DALL-E oraz Midjourney. Tworzy grafiki w dobrej rozdzielczości. Komendę zadaje się w języku naturalnym, czekając kilka sekund na efekty.
SD pozbawiony jest także etycznych ograniczeń. Pozwala to m.in. wykorzystać wizerunek znanych osób w generowanych obrazach. Stworzone obrazy dostępne są w ramach Open Source na licencji CC0 1.0 Universal Public Domain Dedication.
Wciąż jednak powstałe grafiki są niedoskonałe – problemy z oczami czy dłońmi to standard w tych programach, system ma też wyzwanie z tworzeniem bardziej abstrakcyjnych zagadnień.
Źródło: własny zrzut ekranu z narzędzia SD
RemoveBG
RemoveBG to bardzo przydatne narzędzie do usuwania tła ze zdjęcia. Działa sprawnie, wymaga przesłania zdjęcia lub wklejenia URL grafiki.
Otrzymany obraz może być w dobrej i wysokiej jakości (za którą trzeba zapłacić), w formatach 596×418 px i 2048×1438 px. Posiada także połączenie z Canva. Tło usuwane jest poprawnie, w tym całkiem dobrze radzi sobie z tłem w pobliżu włosów, pozostawiając pojedyncze kosmyki i nie zamazując ich.
Przykładowy efekt możesz zobaczyć poniżej, na zdjęciu dwóch z naszych Specjalistów SEM:
Źródło: własny zrzut ekranu z narzędzia
Veed.io
Veed.io to przyjemne narzędzie do tworzenia filmów. Umożliwia wykorzystanie stockowych filmów różnej długości lub zaimportowanie własnego wideo.
Możemy dodać dźwięk, lektora, tekst, w różnych stylach i konfiguracji.
Mamy także możliwość wpłynąć na szybkość wideo i moment pojawiania się napisów. Edytor jest prosty w obsłudze, więc może być fajną pomocą – w tym do tworzenia wideo w Performance Max w Google Ads!
Źródło: lm wygenerowany na potrzeby artykułu za pomocą https://www.veed.io/
llElevenLabs
llElevenLabs jest ciekawym narzędziem służącym jako lektor do tekstu wprowadzonego przez użytkownika. Podczas testowania robi wrażenie. Nie obsługuje języka polskiego, tudzież, obsługuje mocno go kalecząc. Polecam przetestować treści angielskie.
Źródło: https://beta.elevenlabs.io/
vidyo.ai
Posiadasz długie wideo i dobrze byłoby je wykorzystać do wygenerowania krótszych slotów na social media? Wykorzystaj Vidyo. Narzędzie przeanalizuje Twoje wideo i skróci je do wersji korzystnej dla mediów społecznościowych. Znajdziesz go tutaj.
soundraw.io
Narzędzie do generowania muzyki w tle, którą możesz następnie wykorzystać w materiałach wideo. Narzędzie generuje kilka propozycji, które możesz dodatkowo zmodyfikować.
Beautiful.ai
Beautiful.ai pomaga tworzyć profesjonalne prezentacje, udostępnia także szablony do ich indywidualizacji.
System ML dostępny odpłatnie na bazie subskrypcji dla pojedynczego dostępu, zespołów i dla przedsiębiorstw.
Przykład wygenerowanego slajdu:
Źródło: własny zrzut ekranu z narzędzia
Generatory grafiki AI – podsumowanie
Jak widzisz, na rynku jest wiele narzędzi, które nawet w wersji darmowej wykorzystują AI do tworzenia grafik. Zautomatyzowanie działań czy próba tworzenia grafik na własny użytek jest wręcz zalecana. Pamiętaj natomiast o kwestiach prawnych, które poruszyłam we wpisie i tak jak z większością nowości technologicznym – lepiej korzystaj z nich z głową!
A jeśli potrzebujesz pomocy w pozyskaniu nowych klientów, sprawdź naszą usługę Google Ads!