xAI Elona Muska prezentuje Grok 4 – model AI o rzekomo ponadludzkich zdolnościach, który ma deklasować konkurencję. Jednak jego premierę całkowicie przyćmiewa globalny skandal: podczas gdy firma chwali się wynikami lepszymi od doktorantów, poprzednia wersja chatbota generuje kontrowersyjne treści i obraża polityków, co prowadzi do dymisji CEO platformy X i międzynarodowej awantury. Czy technologiczna potęga wystarczy, by przykryć kryzys wizerunkowy? Analizujemy, czy Grok 4 to genialna przyszłość AI, czy niebezpieczny eksperyment, który wymknął się spod kontroli.
W świecie technologii timing jest wszystkim. Można mieć rewolucyjny produkt, przełomowe wyniki i miliardowe zaplecze, ale jeśli wprowadza się go na rynek w samym środku pożaru wizerunkowego, nawet najjaśniejsza gwiazda może przygasnąć. Właśnie w takiej sytuacji znalazła się firma xAI Elona Muska, która z wielką pompą zaprezentowała swój najnowszy model językowy – Grok 4. Problem w tym, że start odbył się w cieniu międzynarodowego skandalu, którego głównym bohaterem był… starszy brat nowego modelu.
W środku burzy wywołanej przez rasistowskie i antysemickie wypowiedzi chatbota Grok, xAI zorganizowało live stream, na którym Musk i jego zespół chwalili się nowym dzieckiem. To posunięcie, które wielu obserwatorów rynku określiło jako co najmniej odważne, a innych jako kompletnie oderwane od rzeczywistości. Czy Grok 4 jest tak genialny, by przykryć kontrowersje? A może to właśnie kontrowersje są częścią strategii Muska?
Czym jest Grok 4 i co (podobno) potrafi?
Zgodnie z deklaracjami właściciela xAI, Grok 4 prezentuje intelekt na poziomie uczonych z tytułem doktora. „W kwestiach akademickich Grok 4 przewyższa poziom doktorancki w każdej dziedzinie, bez wyjątków” – stwierdził Musk podczas prezentacji. Dodał, co prawda, że modelowi może „czasami brakować zdrowego rozsądku”, ale odkrycie nowych praw fizyki to rzekomo „tylko kwestia czasu”.
Te śmiałe tezy poparto wynikami w benchmarkach. W teście Humanity’s Last Exam, sprawdzającym zdolność AI do odpowiadania na tysiące pytań z różnych dziedzin nauki, Grok 4 miał osiągnąć wynik 25,4%, wyprzedzając Gemini 2.5 Pro od Google (21,6%). Jeszcze lepiej wypadła jego potężniejsza wersja, Grok 4 Heavy, która dzięki wykorzystaniu „narzędzi” (symulacji pracy w grupie, gdzie kilka instancji modelu porównuje swoje wyniki) uzyskała aż 44,4%.
Źródło: https://x.ai/
Nowy model pobił też konkurencję w teście ARC-AGI-2, osiągając wynik niemal dwukrotnie lepszy od drugiego w kolejności Claude Opus 4.
Źródło: https://x.ai/
Grok 4 nie jest już tylko modelem językowym – stał się systemem multimodalnym, podobnie, jak jego odpowiedniki od OpenAI czy Google. Potrafi analizować nie tylko tekst, ale również obrazy. Użytkownicy mogą przesyłać zdjęcia, wykresy, diagramy techniczne czy nawet zrzuty ekranu i zadawać na ich temat pytania. Przykłady zastosowań są niemal nieograniczone: od prośby o wyjaśnienie skomplikowanego schematu naukowego, przez diagnozę problemu na podstawie zdjęcia kodu błędu, aż po analizę danych przedstawionych na wykresie.
Unikalną cechą Groka, odziedziczoną po poprzednikach, jest jego integracja w czasie rzeczywistym z danymi z platformy X. W przeciwieństwie do modeli trenowanych na statycznych zbiorach danych, które „nie wiedzą”, co wydarzyło się wczoraj, Grok 4 ma dostęp do najświeższych informacji i globalnych dyskusji. To czyni go potężnym narzędziem do analizy bieżących wydarzeń, trendów rynkowych czy nastrojów społecznych. Niestety, jak pokazał ostatni skandal, jest to miecz obosieczny – model chłonie z X nie tylko fakty, ale też dezinformację i toksyczne treści.
SuperGrok Heavy – sztuczna inteligencja dla wybrańców
Równocześnie z nowym modelem, xAI zaprezentowało nową subskrypcję premium: SuperGrok Heavy. Koszt? „Jedyne” 300 dolarów miesięcznie. To obecnie najdroższa oferta na rynku konsumenckich chatbotów. W zamian subskrybenci otrzymają wcześniejszy dostęp do najmocniejszej wersji modelu oraz przyszłych nowości, a te zapowiadają się ambitnie: model do kodowania w sierpniu, agent multimodalny we wrześniu i generator wideo w październiku.
Coraz szersza dostępność modeli AI sprawia, że sposób wyszukiwania informacji się zmienia, a Twoi klienci coraz częściej sięgają po ChatGPT i napotykają AI Overviews w wyszukiwarce Google.
Premiera Groka 4 w ogniu krytyki. Zła strategia czy celowe działanie?
Decyzja o premierze Groka 4 w tak gorącym momencie budzi fundamentalne pytania o strategię xAI. Podczas prezentacji Musk i jego zespół konsekwentnie unikali tematu kontrowersji, skupiając się wyłącznie na benchmarkach i technologicznych możliwościach. Przypomnijmy: chatbot zaczął generować treści antysemickie, chwalić Adolfa Hitlera, a nawet nazywać samego siebie „MechaHitlerem”. Na celowniku znalazły się też konkretne osoby – w Polsce chatbot w wulgarny sposób obrażał m.in. Donalda Tuska czy Romana Giertycha. Jak twierdzą eksperci, nie był to wypadek przy pracy. System otrzymał instrukcje, by podważać narracje medialne i nie unikać kontrowersji.
Jakby tego było mało, w samym środku kryzysu ze stanowiska zrezygnowała CEO platformy X, Linda Yaccarino. Choć jej odejście nie zostało oficjalnie powiązane ze skandalem, trudno uznać ten zbieg okoliczności za przypadkowy. Jej misją było odbudowanie zaufania reklamodawców do platformy, a wyskoki Groka z pewnością tego zadania nie ułatwiły.
Czy to zwykła arogancja, czy może cynicznie skalkulowana gra? Niektórzy sugerują, że dla Muska każda forma rozgłosu jest dobra, a wizerunek „niepoprawnej” i „bezkompromisowej” AI może przyciągnąć specyficzną grupę odbiorców. Jednak dla świata biznesu i potencjalnych klientów korporacyjnych, dla których xAI udostępnia swoje API, taki wizerunek to gigantyczna czerwona flaga.
Grok 4 a przyszłość modeli od xAI. Między geniuszem a nieodpowiedzialnością
Mamy do czynienia z fascynującym, ale i niepokojącym dualizmem. Z jednej strony Grok 4 to niezaprzeczalny pokaz siły technologicznej, model, który na papierze deklasuje rywali. Z drugiej – to narzędzie obarczone ogromnym ryzykiem wizerunkowym i prawnym, którego twórcy zdają się bagatelizować lub wręcz świadomie podsycać jego kontrowersyjny charakter.
Ostatecznie o sukcesie lub porażce Groka nie zdecydują wyniki w testach, ale zaufanie. Czy deweloperzy zaryzykują budowanie aplikacji na bazie modelu, który w każdej chwili może stać się źródłem globalnego skandalu? Czy firmy będą gotowe zapłacić setki dolarów miesięcznie za asystenta, który może obrazić ich klientów lub partnerów biznesowych? Na te pytania xAI musi znaleźć przekonującą odpowiedź. My też z pewnością będziemy śledzić tę sprawę; jeśli zależy Ci, by być na bieżąco z nowinkami ze świata sztucznej inteligencji, zapisz się do newslettera Delante!
Absolwent marketingu ze specjalizacją e-commerce na Uniwersytecie Ekonomicznym w Krakowie, pochodzący z malowniczego Podkarpacia. Do Delante dołączył w 2022 roku. Miłośnik wysokiej jakości treści na stronie. Prywatnie prawie cały wolny czas przeznacza na produkcję muzyczną, którą zajmuje się od lat, testowanie nowych przepisów i długie spacery w naturze.
Absolwent marketingu ze specjalizacją e-commerce na Uniwersytecie Ekonomicznym w Krakowie, pochodzący z malowniczego Podkarpacia. Do Delante dołączył w 2022 roku. Miłośnik wysokiej jakości treści na stronie. Prywatnie prawie cały wolny czas przeznacza na produkcję muzyczną, którą zajmuje się od lat, testowanie nowych przepisów i długie spacery w naturze.