Google Gemini AI już tu jest, ale czy jest lepsze niż ChatGPT?

Spis treści:

Model sztucznej inteligencji Google Gemini ma trzy warianty: Ultra, Pro i Nano, skupione na różnych zadaniach i poziomach złożoności.
Gemini Ultra wykazuje obiecujące wyniki w kluczowych testach porównawczych sztucznej inteligencji, ale od grudnia 2023 r. nie jest dostępny do użytku publicznego. Google twierdzi, że powinno być dostępne w styczniu 2024 r.
Gemini Pro jest dostępny i choć radzi sobie całkiem nieźle, obecnie nie zdetronizuje GPT-4.

Google konsekwentnie obiecuje, że jego model Gemini AI będzie lepszy niż GPT-4 OpenAI, model obsługujący ChatGPT Plus. Teraz, gdy Google Gemini zostało uruchomione, możemy w końcu poddać go testowi i zobaczyć, jak Gemini wypada na tle GPT-4.

Kiedy Google uruchomiło Bard w marcu 2023 r., było wiele powodów do ekscytacji. Wreszcie monopol OpenAI na ChatGPT zostałby przełamany i otrzymalibyśmy godną konkurencję.

Jednak Bard nigdy nie był tytanem sztucznej inteligencji, na który liczyli ludzie, a GPT-4 pozostaje dominującą platformą generatywnych botów chatowych AI. Teraz Google Gemini już tu jest — ale czy długo oczekiwany model sztucznej inteligencji jest lepszy od ChatGPT?

Jaki jest model AI Gemini firmy Google?

Gemini to najpotężniejszy generatywny model sztucznej inteligencji firmy Google, potrafiący rozumieć i obsługiwać różne formaty danych, w tym tekst, dźwięk, obraz i wideo. Jest to próba Google stworzenia ujednoliconego modelu sztucznej inteligencji, czerpiącego możliwości z najbardziej wydajnych technologii sztucznej inteligencji. Gemini będą dostępne w trzech wariantach:

Gemini Ultra: Największy i najbardziej wydajny wariant zaprojektowany do obsługi bardzo złożonych zadań.

Gemini Pro: Najlepszy model pod względem skalowania i zapewniania wysokiej wydajności w szerokim zakresie zadań, ale mniej wydajny niż Ultra.

Gemini Nano: Najbardziej wydajny model przeznaczony do wdrażania zadań na urządzeniu. Na przykład programiści mogą używać Gemini Nano do tworzenia aplikacji mobilnych lub zintegrowanych systemów, wprowadzając potężną sztuczną inteligencję do przestrzeni mobilnej.

Na swoim oficjalnym blogu pt. Słowo kluczoweGoogle twierdzi, że Gemini Ultra przewyższa najnowocześniejsze rozwiązania w kilku testach porównawczych. Google twierdzi, że Gemini Ultra pokonuje wiodącą w branży GPT-4 w kilku kluczowych testach porównawczych.

Dzięki bezprecedensowemu wynikowi 90,0% w rygorystycznym teście MMLU Google twierdzi, że Gemini Ultra to pierwszy model, który przekroczył poziom ludzki w tym wieloaspektowym teście obejmującym 57 uczestników.

Google

Gemini Ultra potrafi także zrozumieć, wyjaśnić i wygenerować wysokiej jakości kod w niektórych z najpopularniejszych języków programowania na świecie, w tym Go, JavaScript, Python, Java i C++. Na papierze to wszystko są świetne wyniki. Ale to wszystko są punkty odniesienia, a te nie zawsze opowiadają całą historię. Jak dobrze Bliźnięta radzą sobie w zadaniach w świecie rzeczywistym?

Jak korzystać z AI Google Gemini

Z trzech wariantów modelu Gemini AI możesz zacząć korzystać z Gemini Pro już teraz. Gemini Pro jest obecnie dostępny w chatbocie Google Bard. Aby używać Gemini Pro z Bardem, przejdź do bard.google.com i zaloguj się na swoje konto Google.

Google twierdzi, że Gemini Ultra pojawi się w styczniu 2024 r., więc na razie musieliśmy zadowolić się testowaniem Gemini Pro przeciwko ChatGPT.

Porównanie Gemini z GPT-3.5 i GPT-4

Kiedy wprowadzany jest na rynek nowy model sztucznej inteligencji, jest on testowany w porównaniu z modelami AI GPT OpenAI, które są powszechnie akceptowane jako najnowocześniejszy model, z którym należy się równać innym modelom. Tak więc, używając Bard i ChatGPT, przetestowaliśmy zdolności Gemini w matematyce, kreatywnym pisaniu, generowaniu kodu i dokładnym przetwarzaniu danych wejściowych obrazu.

Zaczynając od najłatwiejszego pytania matematycznego, jakie mogliśmy wymyślić, poprosiliśmy oba chatboty o rozwiązanie: -1 x -1 x -1.

Bard poszedł pierwszy. Powtórzyliśmy pytanie dwukrotnie i wszyscy wracaliśmy z błędnymi odpowiedziami. Odpowiedź uzyskaliśmy za trzecim podejściem, ale to się nie liczy.

Próbowaliśmy ChatGPT działającego na GPT-3.5. Pierwsza próba zakończyła się sukcesem.

Aby przetestować możliwości interpretacji obrazów Bliźniąt, zleciliśmy mu zinterpretowanie kilku popularnych memów. Odmówił, twierdząc, że nie może interpretować obrazów przedstawiających ludzi. ChatGPT, obsługujący GPT-4V, chciał i potrafił to zrobić bezbłędnie.

Próbowaliśmy innej próby zinterpretowania obrazu, testując jego zdolność rozwiązywania problemów i kodowania. Daliśmy Bardowi z uruchomionym Gemini Pro zrzut ekranu i poprosiliśmy go o zinterpretowanie i napisanie kodu HTML i CSS w celu replikacji zrzutu ekranu.

Oto zrzut ekranu źródłowego.

Poniżej znajduje się próba interpretacji i replikacji zrzutu ekranu przez Gemini Pro przy użyciu HTML i CSS.

A oto próba odtworzenia zrzutu ekranu wykonana przez GPT-4. Wynik nie jest zaskakujący, biorąc pod uwagę, że GPT-4 w przeszłości był mocny w kodowaniu. Wcześniej zademonstrowaliśmy użycie GPT-4 do zbudowania aplikacji internetowej od podstaw.

Poprosiliśmy Gemini Pro o stworzenie wiersza o Tesli (markie samochodów elektrycznych). Wykazało niewielką poprawę w porównaniu z poprzednimi testami, które przeprowadziliśmy w przeszłości. Oto wynik:

W tym momencie pomyśleliśmy, że bardziej odpowiednie będzie porównanie wyników z GPT-3.5, a nie z doładowanym GPT-4. Poprosiliśmy więc ChatGPT z systemem GPT-3.5 o stworzenie podobnego wiersza.

Może to być osobisty wybór, ale podejście Gemini Pro wydaje się lepsze. Ale pozwolimy ci być sędzią.

Czy Gemini jest lepszy niż ChatGPT?

Zanim Google uruchomiło Bard, myśleliśmy, że będzie to konkurs ChatGPT, na który czekaliśmy – tak nie było. Teraz Gemini jest tutaj i jak dotąd Gemini Pro nie wydaje się modelem, który dałby ChatGPT nokautujący cios.

Google twierdzi, że Gemini Ultra będzie znacznie lepszy. Mamy szczerą nadzieję, że tak jest i że spełnia lub przewyższa wymagania zawarte w ogłoszeniu Gemini Ultra. Jednak dopóki nie zobaczymy i nie przetestujemy najlepszej wersji narzędzia Google do generowania sztucznej inteligencji, nie będziemy wiedzieć, czy może ona wyprzedzić konkurencję w zakresie modeli sztucznej inteligencji. W obecnej sytuacji GPT-4 pozostaje niekwestionowanym mistrzem modelu AI.