Jak wykorzystać Darmowy generator obrazów AI w Canvie?

Canva wprowadziła darmowy generator obrazów AI, który na podstawie opisów tworzy grafiki. Generator działa dzięki aplikacji Zamień tekst w obraz Canva, obsługiwanej przez Stable Diffusion, czyli jeden z systemów, który opisałam we wpisie. Canva oferuje generowanie obrazów w różnym stylu i pozwala je modyfikować. Instrukcja obsługi generatora AI w Canvie: Źródło: https://www.canva.com/pl_pl/funkcje/generator-obrazow-ai/ Jak generator obrazów w Canvie radzi sobie w praktyce? Oto wynik zapytania, które wylosowała mi Canva, nie wybierałam w tym przypadku preferowanego stylu. Obrazy są realistyczne i w dobrej jakości. Źródło: własny zrzut ekranu z narzędzia Jako inny przykład wpisałam już swój tekst: huśtawka zawieszona na drzewie z huśtającą się dziewczynką i dobrałam styl akwareli. Canva całkiem dobrze poradziła sobie z tym zadaniem. Źródło: własny zrzut ekranu z narzędzia Niestety, jak pozostałe narzędzia, Canva nie radzi sobie z tworzeniem loga. Jest to natomiast bardzo wygodne narzędzie, ponieważ wszystkie potrzebne funkcje graficzne znajdują się w jednym narzędziu. Dodatkowo, głośno ostatnio zrobiło się o funkcji, która pozwala wymienić wybraną część zdjęcia na inną, wygenerowaną za pomocą AI. Jak widać, Efekt nazywa się: Magiczna edycja. Jak działa ta funkcja? @genflow_ Canva just got a MAJOR AI update Watch to find out how you can use this new AI tool to make your Instagram photos perfect every single time #genflow #canva #canvatips #canvatutorial #instagramtips #instagramhack #photoedit #photoediting ♬ Roxanne – Instrumental – Califa Azul Tak Canva działa z prostymi zamianami. Jak radzi sobie z trudniejszymi przypadkami? Już niestety nie tak dobrze. Podrzuciłam Canvie obrazek z jej zasobów i poprosiłam o zamianę elementu w środku kubka. Wpisałam: gotowa herbata z cytryną. Wyszło tak: Źródło: własny zrzut ekranu z narzędzia Źródło: własny zrzut ekranu z narzędzia Jak widać, mimo sprecyzowania, że herbata ma być już gotowa, narzędzie dosyć dosłownie zrozumiało moją prośbę.

Sztuczna inteligencja generuje obrazy - jak to wykorzystać?

Spis
treści

Pokaż więcej

Sztuczna inteligencja (AI), zwłaszcza modele oparte na głębokim uczeniu (deep learning), odgrywają kluczową rolę w generowaniu obrazów, co jest często określane jako „sztuczna kreatywność”. Jedną z popularnych technik stosowanych do tworzenia obrazów przez AI są Generatywne Sieci Adwersaryjne (GANs). GANs składają się z dwóch sieci neuronowych: generatora, który produkuje obrazy, i dyskryminatora, który ocenia je. Generator stara się tworzyć obrazy, które będą jak najbardziej przekonujące i naturalne, podczas gdy dyskryminator ocenia, czy wygenerowany obraz jest prawdziwy, czy fałszywy.

Proces ten odbywa się iteracyjnie, gdzie generator uczy się stopniowo tworzyć coraz bardziej przekonujące obrazy, a dyskryminator staje się coraz lepszy w rozróżnianiu między obrazami generowanymi a rzeczywistymi. Obrazy generowane przez GANs mogą być niezwykle realistyczne i detaliczne, co znajduje zastosowanie w wielu dziedzinach, takich jak sztuka, grafika komputerowa czy rozrywka.

Inne techniki, takie jak autoenkodery wariacyjne (VAEs), również są stosowane do generowania obrazów, umożliwiając tworzenie nowych, unikatowych wizualizacji na podstawie wcześniej nauczonych reprezentacji danych. Wszystkie te technologie wykorzystują ogromne ilości danych i złożone algorytmy do “nauczenia się” i imitowania różnych stylów i form obrazów, co otwiera nowe horyzonty w dziedzinie sztucznej kreatywności i generowania obrazów.

W Internecie jest obecnie dostępnych zatrzęsienie narzędzi do generowania obrazów z wykorzystaniem sztucznej inteligencji. Ich zastosowanie w marketingu internetowym może być nieocenione. Narzędzie jednak narzędziu nie równe – wszystko zależy z jednej strony od zbioru danych treninegowych, a z drugiej od jakość treningu modelu stojącego za konkretnym narzędziem. Przetestowałam więc 10 najpopularniejszych narzędzi sztucznej inteligencji tworzących obrazy, aby znaleźć to najlepsze!

Midjourney

Midjourney to potężne narzędzie w wersji Beta służące do generowania grafik na podstawie krótkiej informacji podanej systemowi w języku naturalnym lub za pomocą kilku słów kluczowych. Aby móc z niego korzystać, musisz dołączyć do grupy na Discordzie. Na ich oficjalnej stronie możesz znaleźć instrukcję, jak korzystać z kanału. Na obecną chwilę (kwiecień 2023) Midjourney ma ponad 13 milionów użytkowników, w tym ponad milion aktywnych.

Jego darmowa wersja pozwala na generowanie odpowiedzi na 25 zapytań. Możliwe jest też wykupienie płatnej wersji pozwalającej na nielimitowane generowanie obrazów przez AI i pełen dostęp do społeczności, w tym do pisania na kanale prywatnym z czatem, co przyspiesza pracę i generowanie kreacji.

By wygenerować obraz należy wykorzystać funkcję “/imagine” łącznie z naszym zapytaniem. Bot wygeneruje odpowiedź w ciągu 60 sekund, która pokaże 4 przykłady obrazków w niskiej rozdzielczości. Następnie użytkownik może wybrać jedną z 4 propozycji i pracować nad zwiększaniem jej szczegółowości lub tworzyć jej zbliżone wariacje. Finalny utwór będzie wysokiej jakości i szczegółowości.

Tak wygląda generowanie obrazów przez sztuczną inteligencję w Midjorney w praktyce:

wstępne zapytanie z wykorzystaniem funkcji /imagine:

Źródło: własny zrzut ekranu z narzędzia

wybranie opcji zwiększenia szczegółowości i jakości 3. propozycji:

Źródło: własny zrzut ekranu z narzędzia

wygenerowanie wariacji tej propozycji:

Źróło: własny zrzut ekranu z narzędzia

uzyskanie finalnej wersji:

Źródło: własny zrzut ekranu z narzędzia

Jak widać, narzędzie jest potężne, a jednocześnie bardzo proste.

Ma jednak swoje ograniczenia – tak jak generuje wysokiej jakości i szczegółowości obrazy, tak ma wyzwanie z tym, z czym mają wyzwanie artyści. na których pracach bazuje: proporcjami, oczami, dłońmi itp.

Inny obszar generujący wyzwania to design, m.in. tworzenie logo i logotypów. Jak widać na poniższym screenie, system musi się jeszcze nauczyć większego “rozumienia” zapytania:

Źródło: własny zrzut ekranu z narzędzia

Midjourney to jedno z najpotężniejszych i najprostszych narzędzi kreatywnych dostępnych obecnie na rynku.

Warto także wspomnieć, że… wywołało ono “burzę“ prawną. W świecie kreatywnym to o nim mówiło się, zanim ChatGPT zawładnął uwagą publiczną za sprawą pisania tekstów przez AI. Dlaczego? Midjourney to narzędzie tworzące obrazy opierając się o ML, które uczyło się na gigantycznej bazie prac artystów i twórców znanych z kart historii sztuki, jak i współczesnych. I właśnie dlatego wywołał niemałe zamieszanie w świecie kreatywnym.

Jego działanie było szeroko bojkotowane (co np. można było zobaczyć na Artstation – screen poniżej) i skończyło się zbiorowym pozwem artystów.

Źródło: ArtStation

Czego dotyczy bojkot i pozew? Praw autorskich. Artyści i rzemieślnicy domagają się wprowadzania regulacji prawnych nt. możliwości wykorzystania ich prac do nauki algorytmów AI/ML za ich zgodą i otrzymywania honorarium z tego wynikającego.

Ze względu na negatywny odbiór tworzonych prac portale kreatywne typu ArtStation wprowadziły możliwość dodania tagów uniemożliwiających korzystanie przez AI z prac znajdujących się na portalu. Wspomniany portal dodał także konieczność oznaczania prac wprowadzanych przez użytkowników, które były wygenerowane za pomocą AI.

Midjourney to świetne narzędzie kreatywne, jakie stanie się pomocą w generowaniu inspiracji dla artystów czy zautomatyzowaniu prac powtarzalnych - szkiców, wstępnych koncepcji. Szczególne zastosowanie znajdzie najpewniej w dziedzinie gier komputerowych i karcianych, ilustracji, animacji, concept arcie. Najpewniej znajdzie także swoje miejsce w przypadku osób prowadzących działania w Social Media, wśród grafików i marketingowców. Jednocześnie sytuacja prawna Midjourney może wskazywać niejako kierunek, w którym będzie iść akceptacja społeczna w kwestii systemów uczących się oraz AI, jak i wygenerowanych przez nich utworów. Należy szczególną uwagę zwrócić na aktualizację prawa krajowego i międzynarodowego w tym zakresie. Warto obserwować temat i decyzje organów prawnych.

Agnieszka Glińska SEM Specialist

DALL-E 2

DALL-E 2 to system od OpenAI umożliwiający tworzenie obrazów na podstawie opisu tekstowego. Możemy tutaj zarówno tworzyć unikalne obrazy za pomocą łączenia i miksowania konceptów i stylów, jak i działać na istniejącym obrazie – rozszerzać o to, co na nim niewidoczne, dodawać i usuwać z niego wybrane elementy, utrzymując wiarygodny światło-cień i odbicia. Finalnie możemy w nim także tworzyć wariacje na temat istniejącego obrazu.

źródło: własny zrzut ekranu z narzędzia

Na pierwszy miesiąc otrzymuje się 50 “kredytów”, czyli możliwości tworzenia obrazów. Kolejne miesiące zapewniają 15 kredytów. Jest również możliwość ich dokupienia.

DALL-E 2 analizuje obrazy dostępne w sieci i ich opisy, porównując je z treścią wpisaną przez użytkownika. Zapytanie wprowadzamy w języku naturalnym, określając dodatkowo stylistykę (realizm, impresjonizm itd.). Na tej bazie otrzymujemy 4 propozycje grafik, które następnie możemy modyfikować.

Źródło: własny zrzut ekranu z narzędzia

Możemy poprosić system o wygenerowanie wariacji danego obrazu:

Źródło: własny zrzut ekranu z narzędzia

W tym momencie narzędzie nie jest doskonale. Trzeba naprawdę dobrze poznać sposób działania zapytań, aby uzyskać zbliżony efekt do oczekiwanego. Często także generuje błędy lub treści zupełnie odmienne od zapytania. DALL-E 2 jest mniej intuicyjny, a generowane obrazy gorszej jakości niż w Midjourney. Mimo to warto wykorzystać 50 darmowych “kredytów” na zapoznanie się z jego możliwościami.

Agnieszka Glińska SEM Specialist

Zwiększ widoczność Twojej strony z pomocą contentu!

Poznaj pakiety contentowe!

Nowość od Adobe: Adobe Firefly

Adobe Firefly dostępny jest obecnie w wersji Beta. Podobnie jak powyższe systemy, Firefly również opiera się o zapytania zadane w języku naturalnym.

Źródło: https://www.adobe.com/sensei/generative-ai/firefly.html

Narzędzie zapowiada się na solidnego konkurenta dwóch powyższych.

Ma między innymi umożliwiać:

tworzenie grafik na bazie szkiców przesłanych do systemu

tworzenie grafik na bazie szkiców w Adobe

Źródło: https://www.adobe.com/sensei/generative-ai/firefly.html

dostosowanie wygenerowanych propozycji do własnych potrzeb – co jest silną przewagą nad konkurentami
zmianę nastroju zaimportowanego zdjęcia lub video, w tym nawet pogody

zmiana nastroju zaimportowanego zdjęcia lub video w Adobe

Źródło: https://www.adobe.com/sensei/generative-ai/firefly.html

tworzenie plakatów, banerów i grafik pod social media

tworzenie plakatów, banerów i grafik pod social media przez Adobe

Źródło: https://www.adobe.com/sensei/generative-ai/firefly.html

generowanie obrazów na bazie zaimporotwanego moodboardu (tablica inspiracji)

generowanie obrazów na bazie zaimporotwanego moodboardu przez Adobe

Źródło: https://www.adobe.com/sensei/generative-ai/firefly.html

tworzenie efektów dla tekstów i liter, umożliwiając zmianę ich kolorów, efektów, zastosowanego fontu i wiele więcej

tworzenie efektów dla tekstów i liter w Adobe

Źródło: https://www.adobe.com/sensei/generative-ai/firefly.html

Jak widać na materiałach promocyjnych, możliwe będzie zarówno modyfikowanie ręcznie wybranych elementów, jak i dostosowanie stylu, światła, kompozycji, przycięcia, pojedynczych elementów, Możliwa jest też zmiana nastroju obrazu, a nawet mimiki twarzy!

Źródło: https://www.adobe.com/sensei/generative-ai/firefly.html

Dodatkowo w planach Adobe jest rozwinięcie systemu w przyszłości tak, by mógł obsługiwać i tworzyć grafiki 3D.

Obecnie narzędzie dostępne jest w wersji Beta. By skorzystać z wersji Beta należy wysłać prośbę o otrzymanie dostępu. Warunkiem uczestnictwa jest posiadanie Adobe ID oraz ukończenie 18 r.ż. Zaproszenia będą stopniowo wysyłane do osób zgłaszających chęć uczestnictwa.

Po wyjściu z tej fazy twórcy będą mogli korzystać z Firefly na zasadach komercyjnych.

Co także jest mocnym wyróżnikiem, to to, że Firefly posiada systemy uczące się bazujące na zbiorze danych z Adobe Stock, a także na tworach działających na otwartej licencji, jak i tych, należących do domeny publicznej (twórczość, do jakiej prawa autorskie wygasły). Firma jest w trakcie opracowywania modelu wynagrodzeń dla twórców, których prace są wykorzystywane do nauki systemu.

Utwory stworzone na podstawie Firefly będą w przyszłości zawierały także tag Content Credentials, określający ich stworzenie za pomocą AI. Dodatkowo trwają prace nad tagiem “Do Not Train”, który pozwoli zrezygnować z uczestnictwa utworu w uczeniu generatywnych modeli szkoleniowych.

Lensa

Aplikacja służy do generowania grafik (awatarów) na bazie przesłanych przez użytkownika fotografii. Dostępna jest na Androida i iOS. W ostatnim czasie zyskała bardzo dużą popularność, a wytworzone obrazy zalały zdjęcia profilowe użytkowników Facebooka czy Instagrama.

Z aplikacji należy jednak korzystać rozważnie, bazuje bowiem na kopii Stable Diffusion tj. systemu rozpoznającego twarze. Pojawiają się też coraz częściej oskarżenia o seksualizację grafik, rasizm i łamanie praw autorskich artystów poprzez wykorzystywanie grafik z internetu do nauki algorytmów bez uprzedniej zgody i rekompensaty finansowej dla twórców oryginalnych prac.

Jest to płatna aplikacja rosyjskiej firmy Prisma Labs.

Stable Diffusion

Stable Diffusion jest podobny w swojej funkcjonalności do DALL-E oraz Midjourney. Tworzy grafiki w dobrej rozdzielczości. Komendę zadaje się w języku naturalnym, czekając kilka sekund na efekty.

SD pozbawiony jest także etycznych ograniczeń. Pozwala to m.in. wykorzystać wizerunek znanych osób w generowanych obrazach. Stworzone obrazy dostępne są w ramach Open Source na licencji CC0 1.0 Universal Public Domain Dedication.

Wciąż jednak powstałe grafiki są niedoskonałe – problemy z oczami czy dłońmi to standard w tych programach, system ma też wyzwanie z tworzeniem bardziej abstrakcyjnych zagadnień.

Źródło: własny zrzut ekranu z narzędzia SD

RemoveBG

RemoveBG to bardzo przydatne narzędzie do usuwania tła ze zdjęcia. Działa sprawnie, wymaga przesłania zdjęcia lub wklejenia URL grafiki.

Otrzymany obraz może być w dobrej i wysokiej jakości (za którą trzeba zapłacić), w formatach 596×418 px i 2048×1438 px. Posiada także połączenie z Canva. Tło usuwane jest poprawnie, w tym całkiem dobrze radzi sobie z tłem w pobliżu włosów, pozostawiając pojedyncze kosmyki i nie zamazując ich.

Przykładowy efekt możesz zobaczyć poniżej, na zdjęciu dwóch z naszych Specjalistów SEM:

Źródło: własny zrzut ekranu z narzędzia

Veed.io

Veed.io to przyjemne narzędzie do tworzenia filmów. Umożliwia wykorzystanie stockowych filmów różnej długości lub zaimportowanie własnego wideo.

Możemy dodać dźwięk, lektora, tekst, w różnych stylach i konfiguracji.

Mamy także możliwość wpłynąć na szybkość wideo i moment pojawiania się napisów. Edytor jest prosty w obsłudze, więc może być fajną pomocą – w tym do tworzenia wideo w Performance Max w Google Ads!

Źródło: lm wygenerowany na potrzeby artykułu za pomocą https://www.veed.io/

llElevenLabs

llElevenLabs jest ciekawym narzędziem służącym jako lektor do tekstu wprowadzonego przez użytkownika. Podczas testowania robi wrażenie. Nie obsługuje języka polskiego, tudzież, obsługuje mocno go kalecząc. Polecam przetestować treści angielskie.

Źródło: https://beta.elevenlabs.io/

vidyo.ai

Posiadasz długie wideo i dobrze byłoby je wykorzystać do wygenerowania krótszych slotów na social media? Wykorzystaj Vidyo. Narzędzie przeanalizuje Twoje wideo i skróci je do wersji korzystnej dla mediów społecznościowych. Znajdziesz go tutaj.

Chcesz zgłębić temat AI w pracy marketerów i marketerek? Dowiedzieć się, komu Chat GPT może odebrać pracę? Zapraszamy do wysłuchania rozmowy dwóch Specjalistów: Wojciecha i Mateusza.

soundraw.io

Narzędzie do generowania muzyki w tle, którą możesz następnie wykorzystać w materiałach wideo. Narzędzie generuje kilka propozycji, które możesz dodatkowo zmodyfikować.

Beautiful.ai

Beautiful.ai pomaga tworzyć profesjonalne prezentacje, udostępnia także szablony do ich indywidualizacji.

System ML dostępny odpłatnie na bazie subskrypcji dla pojedynczego dostępu, zespołów i dla przedsiębiorstw.

Przykład wygenerowanego slajdu:

Źródło: własny zrzut ekranu z narzędzia

Generatory grafiki AI – podsumowanie

Jak widzisz, na rynku jest wiele narzędzi, które nawet w wersji darmowej wykorzystują AI do tworzenia grafik. Zautomatyzowanie działań czy próba tworzenia grafik na własny użytek jest wręcz zalecana. Pamiętaj natomiast o kwestiach prawnych, które poruszyłam we wpisie i tak jak z większością nowości technologicznym – lepiej korzystaj z nich z głową!

A jeśli potrzebujesz pomocy w pozyskaniu nowych klientów, sprawdź naszą usługę Google Ads!

Sztuczna inteligencja generuje obrazy – jak to wykorzystać?

Spis
treści

Midjourney

DALL-E 2

Nowość od Adobe: Adobe Firefly

Lensa

Stable Diffusion

RemoveBG

Veed.io

llElevenLabs

vidyo.ai

soundraw.io

Beautiful.ai

Generatory grafiki AI – podsumowanie

Autor

Autor

Agnieszka Glińska

Autor

Autor

Agnieszka Glińska

FAQ