Szybka ewolucja modeli sztucznej inteligencji sprawiła, że niezależna ocena stała się kluczowa dla zrozumienia ich rzeczywistych możliwości i ograniczeń. Ostatnia analiza Grok 4 Basic firmy xAI, bardziej dostępnej wersji jej flagowej sztucznej inteligencji, przeprowadzona przez Decrypt, rzuciła światło na jej wydajność w różnych dziedzinach, ujawniając potężny silnik analityczny, ale także znaczące niedociągnięcia w zadaniach kreatywnych, a co najważniejsze, niepokojący stopień zgodności politycznej z publicznymi oświadczeniami jej twórcy.
- Grok 4 Basic to bardziej przystępna wersja sztucznej inteligencji xAI, wyceniona na 30 USD miesięcznie (w porównaniu do 300 USD za Grok 4 Heavy).
- Model wykazuje wyjątkowe zdolności w zakresie rozumowania logicznego, analizy prawnej i naukowych wyzwań.
- Zauważono znaczące niedociągnięcia w zadaniach kreatywnych (np. tworzenie narracji) i efektywności programowania.
- W odpowiedziach na wrażliwe tematy widoczna jest stronniczość, określona jako „filtr Elona”, odzwierciedlająca publiczne poglądy twórcy.
- Grok 4 Basic posiada zaawansowane funkcje syntezy mowy z ekspresywną intonacją i różnymi „osobowościami”.
- Wykazano ograniczenia w obsłudze dużych kontekstów: model nie przetworzył zapytania o długości 83 000 tokenów, mimo deklarowanej pojemności 126 000 tokenów.
Wyceniony na 30 USD miesięcznie, Grok 4 Basic ma na celu oferowanie zaawansowanych funkcji AI, stanowiąc przystępniejszą alternatywę dla Grok 4 Heavy kosztującego 300 USD miesięcznie. Chociaż testerzy chwalili jego zdolności logicznego rozumowania i syntezy głosu, zwrócili również uwagę na znaczące słabości w zakresie twórczości i efektywności programowania. Celem recenzji było ustalenie, czy Grok 4 Basic uzasadnia swój koszt subskrypcji dla szerokiego grona użytkowników.
Rozpakowanie „Filtra Elona”: Stronniczość w Odpowiedziach AI
Jednym z najbardziej uderzających odkryć było to, co Decrypt nazwał „filtrem Elona”. Po zapytaniu o wrażliwe tematy, takie jak konflikt w Gazie czy aborcja, Grok 4 Basic konsekwentnie odwoływał się do postów Elona Muska na X (dawniej Twitter) lub artykułów prasowych, które odzwierciedlały jego perspektywy, przyjmując podobne stanowisko. Ten zaobserwowany wzorzec rodzi pytania o deklarowane przez model dążenie do maksymalnej prawdy, sugerując, że jego poszukiwanie prawdy jest przede wszystkim filtrowane przez pryzmat mediów społecznościowych jego twórcy. Brak wyraźnych systemowych instrukcji kierujących tym zachowaniem pozostawia otwarte pytanie, czy jest to zamierzona funkcja, czy anomalia algorytmiczna.
Siła Analityczna kontra Słabość Kreatywna
Pomimo swoich ideologicznych skłonności, Grok 4 Basic wykazał wyjątkowe zdolności w wyzwaniach logicznych i prawnych. Na przykład, gdy przedstawiono mu klasyczną zagadkę: „Czy mężczyzna może poślubić siostrę swojej wdowy?”, AI szybko zidentyfikowała logiczną niemożliwość, powołując się na podstawę prawną, która uczyniłaby takie małżeństwo „ab initio” (nieważnym od samego początku). Jego wyniki w zadaniach z zakresu rozumowania naukowego również dorównywały ekspertowi na poziomie doktoranckim, dostarczając precyzyjnych i dobrze uzasadnionych wyjaśnień.
Z drugiej strony, model znacznie gorzej radził sobie z zadaniami kreatywnymi. Narracje generowane przez Grok 4 Basic zostały opisane jako sztampowe, z nudnymi dialogami i niedorozwiniętymi strukturami fabularnymi, pozbawione energii narracyjnej, mimo solidnych ram logicznych. W przypadku pisania kreatywnego Decrypt zalecił używanie Grok 4 do tworzenia zarysów fabuły i wykorzystywanie alternatywnych modeli, takich jak Claude 4 Opus, do faktycznego generowania tekstu. W programowaniu, pomimo zgłoszonych ulepszeń przez xAI, Grok 4 nie zdołał stworzyć kompletnej gry, a próby debugowania często wprowadzały nowe błędy – zadanie, które, jak doniesiono, poprzednia wersja, Grok 3, radziła sobie z większą biegłością. Te ustalenia podkreślają dychotomię w jego możliwościach: silny w analizie, ale słaby w zadaniach generatywnych wymagających subtelnej kreatywności.
Możliwości Głosowe i Ograniczenia Kontekstowe
Wyjątkową cechą Grok 4 Basic jest zaawansowana interakcja głosowa. Model może narracyjnie opowiadać kilkuminutowe historie z ekspresyjną intonacją, tempem i płynnością, wykorzystując wstępnie skonfigurowane „osobowości” – od terapeuty po „tryb seksowny” – co zwiększa wszechstronność bez skomplikowanych podpowiedzi. Brak ogólnych możliwości udostępniania ekranu ogranicza jednak jego użyteczność w zadaniach wizualnych, gdzie modele takie jak Gemini Live oferują obecnie lepszą wydajność.
Recenzja ujawniła również znaczące ograniczenie w zdolności Grok 4 do obsługi dużych kontekstów. Pomimo deklarowanej przez xAI pojemności 126 000 tokenów, model nie przetworzył zapytania o długości 83 000 tokenów, co budzi obawy dotyczące jego reklamowanych możliwości w zarządzaniu obszernymi danymi wejściowymi. xAI zabezpieczyła znaczne fundusze na swoje działania rozwojowe, w tym na rozbudowę centrum danych Colossus, co wskazuje na bieżące inwestycje w przyszłe możliwości modelu.
Podsumowanie: Specjalistyczne, lecz Niedoskonałe Narzędzie
Grok 4 Basic jawi się jako potężne narzędzie do przetwarzania analitycznego, wyróżniające się w logicznym i naukowym rozumowaniu oraz szczycące się imponującymi funkcjami głosowymi. Jednakże jego znaczące niedociągnięcia w zadaniach kreatywnych, programowaniu, a zwłaszcza wyraźne stronniczość polityczna, czynią go rozwiązaniem AI specjalistycznym, a nie uniwersalnym. Dla użytkowników priorytetyzujących bezstronne odpowiedzi lub wymagających zaawansowanych funkcji kreatywnych i kodowania, bardziej odpowiednie może okazać się poszukiwanie alternatywnych modeli, pomimo analitycznych mocnych stron i konkurencyjnej ceny Grok 4 Basic.
newsblog.pl
Maciej – redaktor, pasjonat technologii i samozwańczy pogromca błędów w systemie Windows. Zna Linuxa lepiej niż własną lodówkę, a kawa to jego główne źródło zasilania. Pisze, testuje, naprawia – i czasem nawet wyłącza i włącza ponownie. W wolnych chwilach udaje, że odpoczywa, ale i tak kończy z laptopem na kolanach.