Spis
treści
Sztuczna inteligencja (AI), zwłaszcza modele oparte na głębokim uczeniu (deep learning), odgrywają kluczową rolę w generowaniu obrazów, co jest często określane jako „sztuczna kreatywność”. Jedną z popularnych technik stosowanych do tworzenia obrazów przez AI są Generatywne Sieci Adwersaryjne (GANs). GANs składają się z dwóch sieci neuronowych: generatora, który produkuje obrazy, i dyskryminatora, który ocenia je. Generator stara się tworzyć obrazy, które będą jak najbardziej przekonujące i naturalne, podczas gdy dyskryminator ocenia, czy wygenerowany obraz jest prawdziwy, czy fałszywy.
Proces ten odbywa się iteracyjnie, gdzie generator uczy się stopniowo tworzyć coraz bardziej przekonujące obrazy, a dyskryminator staje się coraz lepszy w rozróżnianiu między obrazami generowanymi a rzeczywistymi. Obrazy generowane przez GANs mogą być niezwykle realistyczne i detaliczne, co znajduje zastosowanie w wielu dziedzinach, takich jak sztuka, grafika komputerowa czy rozrywka.
Inne techniki, takie jak autoenkodery wariacyjne (VAEs), również są stosowane do generowania obrazów, umożliwiając tworzenie nowych, unikatowych wizualizacji na podstawie wcześniej nauczonych reprezentacji danych. Wszystkie te technologie wykorzystują ogromne ilości danych i złożone algorytmy do „nauczenia się” i imitowania różnych stylów i form obrazów, co otwiera nowe horyzonty w dziedzinie sztucznej kreatywności i generowania obrazów.
W Internecie jest obecnie dostępnych zatrzęsienie narzędzi do generowania obrazów z wykorzystaniem sztucznej inteligencji. Ich zastosowanie w marketingu internetowym może być nieocenione. Narzędzie jednak narzędziu nie równe – wszystko zależy z jednej strony od zbioru danych treninegowych, a z drugiej od jakość treningu modelu stojącego za konkretnym narzędziem. Przetestowałam więc 10 najpopularniejszych narzędzi sztucznej inteligencji tworzących obrazy, aby znaleźć to najlepsze!
Midjourney
Midjourney to potężne narzędzie w wersji Beta służące do generowania grafik na podstawie krótkiej informacji podanej systemowi w języku naturalnym lub za pomocą kilku słów kluczowych. Aby móc z niego korzystać, musisz dołączyć do grupy na Discordzie. Na ich oficjalnej stronie możesz znaleźć instrukcję, jak korzystać z kanału. Na obecną chwilę (kwiecień 2023) Midjourney ma ponad 13 milionów użytkowników, w tym ponad milion aktywnych.
Jego darmowa wersja pozwala na generowanie odpowiedzi na 25 zapytań. Możliwe jest też wykupienie płatnej wersji pozwalającej na nielimitowane generowanie obrazów przez AI i pełen dostęp do społeczności, w tym do pisania na kanale prywatnym z czatem, co przyspiesza pracę i generowanie kreacji.
By wygenerować obraz należy wykorzystać funkcję “/imagine” łącznie z naszym zapytaniem. Bot wygeneruje odpowiedź w ciągu 60 sekund, która pokaże 4 przykłady obrazków w niskiej rozdzielczości. Następnie użytkownik może wybrać jedną z 4 propozycji i pracować nad zwiększaniem jej szczegółowości lub tworzyć jej zbliżone wariacje. Finalny utwór będzie wysokiej jakości i szczegółowości.
Tak wygląda generowanie obrazów przez sztuczną inteligencję w Midjorney w praktyce:
- wstępne zapytanie z wykorzystaniem funkcji /imagine:
- wybranie opcji zwiększenia szczegółowości i jakości 3. propozycji:
- wygenerowanie wariacji tej propozycji:
- uzyskanie finalnej wersji:
Jak widać, narzędzie jest potężne, a jednocześnie bardzo proste.
Ma jednak swoje ograniczenia – tak jak generuje wysokiej jakości i szczegółowości obrazy, tak ma wyzwanie z tym, z czym mają wyzwanie artyści. na których pracach bazuje: proporcjami, oczami, dłońmi itp.
Inny obszar generujący wyzwania to design, m.in. tworzenie logo i logotypów. Jak widać na poniższym screenie, system musi się jeszcze nauczyć większego “rozumienia” zapytania:
Midjourney to jedno z najpotężniejszych i najprostszych narzędzi kreatywnych dostępnych obecnie na rynku.
Warto także wspomnieć, że… wywołało ono “burzę“ prawną. W świecie kreatywnym to o nim mówiło się, zanim ChatGPT zawładnął uwagą publiczną za sprawą pisania tekstów przez AI. Dlaczego? Midjourney to narzędzie tworzące obrazy opierając się o ML, które uczyło się na gigantycznej bazie prac artystów i twórców znanych z kart historii sztuki, jak i współczesnych. I właśnie dlatego wywołał niemałe zamieszanie w świecie kreatywnym.
Jego działanie było szeroko bojkotowane (co np. można było zobaczyć na Artstation – screen poniżej) i skończyło się zbiorowym pozwem artystów.
Czego dotyczy bojkot i pozew? Praw autorskich. Artyści i rzemieślnicy domagają się wprowadzania regulacji prawnych nt. możliwości wykorzystania ich prac do nauki algorytmów AI/ML za ich zgodą i otrzymywania honorarium z tego wynikającego.
Ze względu na negatywny odbiór tworzonych prac portale kreatywne typu ArtStation wprowadziły możliwość dodania tagów uniemożliwiających korzystanie przez AI z prac znajdujących się na portalu. Wspomniany portal dodał także konieczność oznaczania prac wprowadzanych przez użytkowników, które były wygenerowane za pomocą AI.
Midjourney to świetne narzędzie kreatywne, jakie stanie się pomocą w generowaniu inspiracji dla artystów czy zautomatyzowaniu prac powtarzalnych – szkiców, wstępnych koncepcji. Szczególne zastosowanie znajdzie najpewniej w dziedzinie gier komputerowych i karcianych, ilustracji, animacji, concept arcie. Najpewniej znajdzie także swoje miejsce w przypadku osób prowadzących działania w Social Media, wśród grafików i marketingowców.
Jednocześnie sytuacja prawna Midjourney może wskazywać niejako kierunek, w którym będzie iść akceptacja społeczna w kwestii systemów uczących się oraz AI, jak i wygenerowanych przez nich utworów. Należy szczególną uwagę zwrócić na aktualizację prawa krajowego i międzynarodowego w tym zakresie. Warto obserwować temat i decyzje organów prawnych.
DALL-E 2
DALL-E 2 to system od OpenAI umożliwiający tworzenie obrazów na podstawie opisu tekstowego. Możemy tutaj zarówno tworzyć unikalne obrazy za pomocą łączenia i miksowania konceptów i stylów, jak i działać na istniejącym obrazie – rozszerzać o to, co na nim niewidoczne, dodawać i usuwać z niego wybrane elementy, utrzymując wiarygodny światło-cień i odbicia. Finalnie możemy w nim także tworzyć wariacje na temat istniejącego obrazu.
Na pierwszy miesiąc otrzymuje się 50 “kredytów”, czyli możliwości tworzenia obrazów. Kolejne miesiące zapewniają 15 kredytów. Jest również możliwość ich dokupienia.
DALL-E 2 analizuje obrazy dostępne w sieci i ich opisy, porównując je z treścią wpisaną przez użytkownika. Zapytanie wprowadzamy w języku naturalnym, określając dodatkowo stylistykę (realizm, impresjonizm itd.). Na tej bazie otrzymujemy 4 propozycje grafik, które następnie możemy modyfikować.
Możemy poprosić system o wygenerowanie wariacji danego obrazu:
W tym momencie narzędzie nie jest doskonale. Trzeba naprawdę dobrze poznać sposób działania zapytań, aby uzyskać zbliżony efekt do oczekiwanego. Często także generuje błędy lub treści zupełnie odmienne od zapytania.
DALL-E 2 jest mniej intuicyjny, a generowane obrazy gorszej jakości niż w Midjourney. Mimo to warto wykorzystać 50 darmowych “kredytów” na zapoznanie się z jego możliwościami.
Zwiększ widoczność Twojej strony z pomocą contentu!
Nowość od Adobe: Adobe Firefly
Adobe Firefly dostępny jest obecnie w wersji Beta. Podobnie jak powyższe systemy, Firefly również opiera się o zapytania zadane w języku naturalnym.
Narzędzie zapowiada się na solidnego konkurenta dwóch powyższych.
Ma między innymi umożliwiać:
- tworzenie grafik na bazie szkiców przesłanych do systemu
- dostosowanie wygenerowanych propozycji do własnych potrzeb – co jest silną przewagą nad konkurentami
- zmianę nastroju zaimportowanego zdjęcia lub video, w tym nawet pogody
- tworzenie plakatów, banerów i grafik pod social media
- generowanie obrazów na bazie zaimporotwanego moodboardu (tablica inspiracji)
- tworzenie efektów dla tekstów i liter, umożliwiając zmianę ich kolorów, efektów, zastosowanego fontu i wiele więcej
Jak widać na materiałach promocyjnych, możliwe będzie zarówno modyfikowanie ręcznie wybranych elementów, jak i dostosowanie stylu, światła, kompozycji, przycięcia, pojedynczych elementów, Możliwa jest też zmiana nastroju obrazu, a nawet mimiki twarzy!
Dodatkowo w planach Adobe jest rozwinięcie systemu w przyszłości tak, by mógł obsługiwać i tworzyć grafiki 3D.
Obecnie narzędzie dostępne jest w wersji Beta. By skorzystać z wersji Beta należy wysłać prośbę o otrzymanie dostępu. Warunkiem uczestnictwa jest posiadanie Adobe ID oraz ukończenie 18 r.ż. Zaproszenia będą stopniowo wysyłane do osób zgłaszających chęć uczestnictwa.
Po wyjściu z tej fazy twórcy będą mogli korzystać z Firefly na zasadach komercyjnych.
Co także jest mocnym wyróżnikiem, to to, że Firefly posiada systemy uczące się bazujące na zbiorze danych z Adobe Stock, a także na tworach działających na otwartej licencji, jak i tych, należących do domeny publicznej (twórczość, do jakiej prawa autorskie wygasły). Firma jest w trakcie opracowywania modelu wynagrodzeń dla twórców, których prace są wykorzystywane do nauki systemu.
Utwory stworzone na podstawie Firefly będą w przyszłości zawierały także tag Content Credentials, określający ich stworzenie za pomocą AI. Dodatkowo trwają prace nad tagiem “Do Not Train”, który pozwoli zrezygnować z uczestnictwa utworu w uczeniu generatywnych modeli szkoleniowych.
Lensa
Aplikacja służy do generowania grafik (awatarów) na bazie przesłanych przez użytkownika fotografii. Dostępna jest na Androida i iOS. W ostatnim czasie zyskała bardzo dużą popularność, a wytworzone obrazy zalały zdjęcia profilowe użytkowników Facebooka czy Instagrama.
Z aplikacji należy jednak korzystać rozważnie, bazuje bowiem na kopii Stable Diffusion tj. systemu rozpoznającego twarze. Pojawiają się też coraz częściej oskarżenia o seksualizację grafik, rasizm i łamanie praw autorskich artystów poprzez wykorzystywanie grafik z internetu do nauki algorytmów bez uprzedniej zgody i rekompensaty finansowej dla twórców oryginalnych prac.
Jest to płatna aplikacja rosyjskiej firmy Prisma Labs.
Stable Diffusion
Stable Diffusion jest podobny w swojej funkcjonalności do DALL-E oraz Midjourney. Tworzy grafiki w dobrej rozdzielczości. Komendę zadaje się w języku naturalnym, czekając kilka sekund na efekty.
SD pozbawiony jest także etycznych ograniczeń. Pozwala to m.in. wykorzystać wizerunek znanych osób w generowanych obrazach. Stworzone obrazy dostępne są w ramach Open Source na licencji CC0 1.0 Universal Public Domain Dedication.
Wciąż jednak powstałe grafiki są niedoskonałe – problemy z oczami czy dłońmi to standard w tych programach, system ma też wyzwanie z tworzeniem bardziej abstrakcyjnych zagadnień.
RemoveBG
RemoveBG to bardzo przydatne narzędzie do usuwania tła ze zdjęcia. Działa sprawnie, wymaga przesłania zdjęcia lub wklejenia URL grafiki.
Otrzymany obraz może być w dobrej i wysokiej jakości (za którą trzeba zapłacić), w formatach 596×418 px i 2048×1438 px. Posiada także połączenie z Canva. Tło usuwane jest poprawnie, w tym całkiem dobrze radzi sobie z tłem w pobliżu włosów, pozostawiając pojedyncze kosmyki i nie zamazując ich.
Przykładowy efekt możesz zobaczyć poniżej, na zdjęciu dwóch z naszych Specjalistów SEM:
Veed.io
Veed.io to przyjemne narzędzie do tworzenia filmów. Umożliwia wykorzystanie stockowych filmów różnej długości lub zaimportowanie własnego wideo.
Możemy dodać dźwięk, lektora, tekst, w różnych stylach i konfiguracji.
Mamy także możliwość wpłynąć na szybkość wideo i moment pojawiania się napisów. Edytor jest prosty w obsłudze, więc może być fajną pomocą – w tym do tworzenia wideo w Performance Max w Google Ads!
llElevenLabs
llElevenLabs jest ciekawym narzędziem służącym jako lektor do tekstu wprowadzonego przez użytkownika. Podczas testowania robi wrażenie. Nie obsługuje języka polskiego, tudzież, obsługuje mocno go kalecząc. Polecam przetestować treści angielskie.
vidyo.ai
Posiadasz długie wideo i dobrze byłoby je wykorzystać do wygenerowania krótszych slotów na social media? Wykorzystaj Vidyo. Narzędzie przeanalizuje Twoje wideo i skróci je do wersji korzystnej dla mediów społecznościowych. Znajdziesz go tutaj.
Chcesz zgłębić temat AI w pracy marketerów i marketerek? Dowiedzieć się, komu Chat GPT może odebrać pracę? Zapraszamy do wysłuchania rozmowy dwóch Specjalistów: Wojciecha i Mateusza.
soundraw.io
Narzędzie do generowania muzyki w tle, którą możesz następnie wykorzystać w materiałach wideo. Narzędzie generuje kilka propozycji, które możesz dodatkowo zmodyfikować.
Beautiful.ai
Beautiful.ai pomaga tworzyć profesjonalne prezentacje, udostępnia także szablony do ich indywidualizacji.
System ML dostępny odpłatnie na bazie subskrypcji dla pojedynczego dostępu, zespołów i dla przedsiębiorstw.
Przykład wygenerowanego slajdu:
Generatory grafiki AI – podsumowanie
Jak widzisz, na rynku jest wiele narzędzi, które nawet w wersji darmowej wykorzystują AI do tworzenia grafik. Zautomatyzowanie działań czy próba tworzenia grafik na własny użytek jest wręcz zalecana. Pamiętaj natomiast o kwestiach prawnych, które poruszyłam we wpisie i tak jak z większością nowości technologicznym – lepiej korzystaj z nich z głową!
A jeśli potrzebujesz pomocy w pozyskaniu nowych klientów, sprawdź naszą usługę Google Ads!