ChatGPT-4 vs ChatGPT-3.5 Default vs. ChatGPT-3.5 Starsza wersja: przetestowane różnice

Oczekuje się, że ChatGPT 4.0 wywoła duże fale we wszechświecie chatbotów. Ale czy rzeczywiście przewyższa swojego poprzednika? Sprawdźmy.

ChatGPT był tylko wierzchołkiem nadchodzącej góry lodowej automatyzacji, a Google, Microsoft i wiele innych firm stawiających na sztuczną inteligencję poszło w ich ślady.

Na początek znaleźliśmy kilka chatbotów, takich jak ChatGPT, z których wiele nie należy do wielkich technologii.

Ale nazwij to siłą marketingu; ChatGPT jest nadal panującym królem wszystkich takich botów AI. Może robić wiele rzeczy, w tym matematykę, poezję i posty na blogach, a ludzie używają tego nawet do składania pozwów.

DoNotPay pracuje nad wykorzystaniem GPT-4 do generowania „pozwów jednym kliknięciem” w celu pozwania robocallerów za 1500 USD. Wyobraź sobie, że odbierasz połączenie, klikasz przycisk, następuje transkrypcja rozmowy i generowany jest pozew na 1000 słów. GPT-3.5 nie był wystarczająco dobry, ale GPT-4 radzi sobie z tym zadaniem wyjątkowo dobrze: pic.twitter.com/gplf79kaqG

— Joshua Browder (@jbrowder1) 14 marca 2023 r

Ma dziesiątki profesjonalistów martwiących się, że ich umiejętności staną się bezużyteczne w najbliższej przyszłości.

Jednak przeczytałem post Linkedin, który powiedział:

AI cię nie zastąpi, ale osoba korzystająca z AI może.

Tak więc, trzymając kciuki, zapoznajmy się z najnowszą aktualizacją ChatGPT i zobaczmy, czym różni się ona od poprzednich wersji.

ChatGPT: starsze, domyślne i aktualizacja

Tak więc dla płatnych użytkowników dostępne są trzy wersje: Legacy (3.5), Default (3.5) i najnowsza aktualizacja ChatGPT (4).

Chociaż zagłębimy się trochę w ich możliwości, oto, co OpenAI ma do powiedzenia na temat różnic:

Źródło: OpenAI

Tak więc, podczas gdy darmowi użytkownicy mają do zabawy tylko Legacy 3.5, subskrypcja premium oferuje wszystkie trzy, aby spróbować zadowolić się tym, co użytkownicy uważają za najlepsze.

Podsumowując poprzedni obraz, płatne plany dotyczą uzyskiwania dokładniejszych wyników przy przyzwoitej prędkości. Jednak różnice są widoczne tylko wtedy, gdy podpowiedzi są skomplikowane i wymagają kreatywności.

ParametrChatGPT 4ChatGPT 3,5Bar Wynik egzaminuNajwyższe 10%Najniższe 10%AI2 Reasoning Challenge (ARC)96,3%85,2%Python Coding Score67%48,1%Interpretacja wizualnaTakNieKontekstPonad 25 tys. słówMniejŹródło: OpenAI

Poza tym ChatGPT 4 może akceptować dane wizualne.

Cóż, dość tych podręcznikowych definicji. Ubrudźmy sobie ręce i oceńmy tych kandydatów na prawdziwym polu bitwy.

Dalsze sekcje są pełne obrazów, które mogą wydawać się niewyraźne. W takim przypadku kliknij prawym przyciskiem myszy dowolny obraz i wybierz opcję Otwórz w nowej karcie, aby wyświetlić go poprawnie.

Matematyka

Będąc absolwentem inżynierii, nie mogę powstrzymać się od rzucenia im kilku podstawowych problemów. Zacznijmy od prostych równań algebraicznych.

I etap

Wielu z nas widziało te równania ax2+bx+c=0, które musimy rozwiązać dla X. Tutaj podałem prosty monit: Rozwiąż dla x: x2 + x – 6 = 0

Podczas gdy wszystkie dały te same pierwiastki (X= -3,2), Legacy i Update były bardziej podobne w użyciu wzoru bezpośrednio (jak zrobi to każdy uczeń), aby znaleźć wynik.

Jednak w Default 3.5 wyjaśniono dwie metody, w tym faktoryzację, które zwykle stosuje każdy wykwalifikowany uczeń, gdy ma do czynienia z takimi przyziemnymi równaniami.

II etap

Następnie każę mu rozwiązać nieco skomplikowane równanie sześcienne: x^3 -12x^2 + 48x – 64 = 0.

To naprawdę udowodniło, dlaczego ChatGPT 4 jest „aktualizacją”.

Oto odpowiedzi:

Cały ten szum i ChatGPT Legacy and Default nie mogły rozwiązać ogólnego równania sześciennego. Jednak Legacy poradził sobie trochę lepiej i poprawnie znalazł dwa korzenie, podczas gdy Default nie powiodło się ze wszystkimi.

Aktualizacja była wyraźnym zwycięzcą drugiego etapu i doskonale rozwiązała równanie, znajdując wszystkie trzy pierwiastki z ładnym wyjaśnieniem.

Logiczne rozumowanie

Możemy bezpiecznie założyć, że większość podstawowych problemów matematycznych ma rozwiązania słownikowe. Jeśli znasz twierdzenie lub wzór, wprowadź wartości i uzyskaj wyniki.

A ChatGPT, będąc sztuczną inteligencją, może szybko pracować z takimi zapytaniami. Jednak logiczne rozumowanie to inny obszar, z dużymi szansami na upadek AI.

I etap

Dałem im klasykę:

A jest starszy od B.
C jest starszy od A.
B jest starszy od C.
Czy trzecie zdanie jest prawdziwe czy fałszywe, jeśli pierwsze dwa zdania są prawdziwe?

Wszystkie wersje ChatGPT miały rację, stwierdzając, że trzecie stwierdzenie było fałszywe.

Następnie użyłem nazw zamiast alfabetu, a wyniki mogą cię zaskoczyć:

Tak więc Domyślna wersja 3.5 kontynuowała swoją słabą wydajność i pomyliła się z tą skromną odmianą. Mimo to Legacy i aktualizacja działały optymalnie.

II etap

Mogliście już zauważyć, że celem tego Etapu I i Etapu II jest znalezienie punktu różnicy, w którym złożoność danego monitu odróżnia Aktualizację od pozostałych dwóch.

Tutaj monit był prostą logiczną zagadką:

Pewnego ranka po wschodzie słońca Rohit stał twarzą do słupa. Cień słupa padł dokładnie po jego prawej stronie. W którą stronę był zwrócony?
A. Północ
B. Zachód
C. Południe
D. Wschód

Ten zmusił Legacy do udzielenia niedokładnej odpowiedzi, podczas gdy Default odpowiedział niejasnymi wyjaśnieniami prowadzącymi do błędnego wniosku.

Tylko Aktualizacja zabłysnęła poprawną odpowiedzią, z łatwymi do zrozumienia stwierdzeniami.

Listy

Składanie pozwów może być trudne, ale czasami nie dochodzi do tego, jeśli potrafisz sporządzić uderzające pierwsze zawiadomienie.

Tutaj poszedłem z tym monitem: Napisz list do Tima Cooka, aby przekazał mi jabłko za brak odpowiedzi na jeden z moich tweetów.

Zabawne, tak! Ale zobaczmy, co sztuczna inteligencja może z tego zrobić.

Legacy 3.5 od razu przyjął monit jak robo-niewolnik i wypuścił list, który może uczynić mnie doskonałym przedmiotem kpin, jeśli kiedykolwiek dotrze do zamierzonego celu.

Domyślny też nie był dobry. Jednak to po prostu mnie zamknęło, tak jak zrzędliwy starzec zrobiłby to pięciolatkowi.

Chociaż przedstawione argumenty były precyzyjne, zakończyło to zabawę z niewielką nauką.

Chociaż była to dość prosta zachęta, wymagała przemyślenia i kreatywności. I właśnie tam starszy brat, Aktualizacja, przedstawił swoją sprawę:

Po pierwsze, zostało to zredagowane niemal idealnie. Po drugie, oszczędziło mi to szukania w Google adresu siedziby Apple (chociaż takie wpisy należy weryfikować).

Po trzecie, został ładnie napisany, z oficjalnym tonem i humorystycznym akcentem. Poza tym intencja była jasna w samym temacie.

Mimo to list oddawał uczucia niezadowolonego fana Apple.

To sprawia, że ​​ChatGPT 4 (znany również jako Aktualizacja) o wiele mil wyprzedza swoich starych kuzynów. Jest przerażająco inteligentny i ma pewne oznaki zdrowego rozsądku, co czyni go czymś więcej niż nudnym, nudnym chatbotem.

Poezja

Pomyślałem, że wraz z uruchomieniem ChatGPT poezja może być jego słabym punktem.

W końcu człowiek potrzebuje emocji, kreatywności i wiele wysiłku, aby stworzyć coś, co naprawdę rezonuje z czytelnikami.

Mówiąc prościej, poezja jest sztuką w najlepszym wydaniu i potajemnie życzyłem, aby sztuczna inteligencja zawiodła. Ale to było zanim mój współpracownik mocno uderzył nas wszystkich na kanale Slack newsblog.pl stworzeniem ChatGPT, które było przed tą aktualizacją 4.0.

I etap

Oto wskazówka, którą dałem naszym kandydatom: „wyraź poetycko, dlaczego lub dlaczego nie podawanie burgerów wraz z ich aktualnym menu może przynieść korzyści sieci pizzerii dominos. Nie przekraczaj 100 słów”.

Można dostrzec różnicę?

Wersja Default była bardzo krótka, miała tylko 32 słowa i nie mogła wykorzystać dostępnej przepustowości do pokazania swojej kreatywności.

Dziedzictwo, choć użyło maksimum słów spośród trzech, dochodzi do wniosku, że próba serwowania pizzy obok nie jest ryzykowna i zaowocuje pewnym sukcesem w obie strony, co nie jest do końca prawdą.

Poezja Aktualizacji liczyła zaledwie 53 słowa, marnując prawie połowę przydzielonej liczby słów. Mimo to było jasne, co do nagród i potencjalnych pułapek, i nie mogło dojść do żadnego rezultatu, co, jak sądzę, jest bardziej humanitarne niż reszta.

II etap

Następnie poprosiłem ich wszystkich, aby „wyjaśnili poezję pięciolatkowi”.

Co ciekawe, Legacy nie mogło wziąć kontekstu z rozmowy i dosłownie wyjaśniło „Poezję”. Default wziął kontekst i podsumował go w akapicie, który wciąż jest przyzwoity.

Kontynuując ten trend, ChatGPT 4 uprościł swoją kreatywność, zachowując przy tym poetycki smak.

ChatGPT Premium kontra ChatGPT Free

Wolny, będąc wolnym, brakuje szybkości i dokładności i nie dorównuje ChatGPT 4, ale nie jest też całkowicie bezużyteczny.

Aby porównać to na równym gruncie, rzuciłem na to te same monity, z którymi testowaliśmy Legacy, Default i Update.

🔵 Matematyka: rozwiązała równania kwadratowe, ale podała błędne odpowiedzi dla sześciennych. (jak Legacy i Default)

🔵 Logiczne rozumowanie: przeszedł pierwszy etap z alfabetami i imionami, ale nie powiódł się na drugim (jak Dziedzictwo).

🔵 Listy: nie napisał listu i uznał wezwanie za nieetyczne i niewłaściwe. (jak domyślny)

🔵 Poezja: Wygenerowano poezję w ponad 30 słowach i przyzwoicie ją wyjaśniono. (podobnie jak w przypadku domyślnego).

Możemy więc stwierdzić, że darmowa wersja też nie jest zła. Właściwie jest na równi z Default 3.5, aw niektórych aspektach nawet lepszy.

Przeczytaj także: Potężne podpowiedzi, które poprawią Twoje wrażenia z ChatGPT

Droga naprzód

Plotki o tym, że sztuczna inteligencja zastąpi pracę w przyszłości, nie są całkowicie błędne.

Najpierw automatyzacja zrobiła to w przemyśle wytwórczym, a teraz rozwija skrzydła wszędzie indziej.

Osobiście jest o wiele szybszy ode mnie w rozwiązywaniu równań sześciennych, tworzeniu poezji czy pisaniu listów. Jednak fakt, że rzadko mówi NIE monitowi i prawie nie uczy się na swoich błędach, pozostaje w tyle za nami, ludźmi.

Powtarzam, AI nas nie zastąpi, ale ktoś korzystający z AI może.

Nasz zespół ds. marketingu w newsblog.pl wykorzystuje ChatGPT w interesujący sposób. Na przykład niedawno osiągnęliśmy kamień milowy 100 milionów wyświetleń, a nasz dyrektor generalny pomyślał, aby oddać go widzom w formie gratisów.

I myślę, że marketingowcy potrzebowali tytułu, aby przyciągnąć uwagę czytelnika. Dali więc jeden monit i poprosili ChatGPT o zasugerowanie kilku odmian, takich jak ta:

Poza tym używamy go do streszczania treści, sprawdzania gramatyki, sugerowania tytułów nowych artykułów i tak dalej.

Podsumowując, istnieje wiele sposobów czerpania korzyści i wyprzedzania stereotypów, które postrzegają sztuczną inteligencję jako bezużyteczny śmieć.

Jedyną rzeczą do zapamiętania jest to, że musi być ktoś (człowiek), aby oceniać pracę AI, ponieważ może ona być (rażąco) niedokładna i wprowadzająca w błąd.

Aktualizacja to naprawdę coś!

Podczas mojego krótkiego spotkania ChatGPT 4 wydał mi się bardziej kreatywny, wyrozumiały i realistyczny. Mimo to jest to maszyna i może pewnie udzielać błędnych odpowiedzi.

Ale to, co jest oszałamiające, to poziom ulepszeń, jakie OpenAI zrobiło w tym projekcie w ciągu zaledwie kilku miesięcy.

I nie mogę się doczekać, aby zobaczyć, jaką magią może nas zadziwić następna aktualizacja!

PS: Nie tylko okno czatu; wykorzystaj jego moc dzięki tym najlepszym rozszerzeniom ChatGPT Chrome. Czy kiedykolwiek myślałeś o integracji ChatGPT z Siri?