Szybkie odnośniki
Najważniejsze informacje
- Claude 3 od Anthropic to znaczny postęp w porównaniu do Claude 2, przewyższający GPT-4 w różnych zadaniach.
- Claude 3 umożliwia generowanie odpowiedzi na różnorodne zapytania z wielu dziedzin, a wszystko to bez konieczności subskrypcji.
- Claude 3 skutecznie konkuruje z GPT-4 ChatGPT, wyróżniając się w obszarach takich jak programowanie, kreatywne pisanie oraz obsługa dużych okien kontekstowych.
Firma Anthropic wprowadziła na rynek Claude 3 – rodzinę modeli sztucznej inteligencji, która ma potencjał, by zagrozić pozycji GPT-4. Ten model ma ogromne możliwości, ale czy jest gotów przejąć pozycję lidera od ChatGPT?
Czym jest Claude 3?
Claude 3 to seria trzech multimodalnych modeli AI, stworzonych przez firmę Anthropic jako następca linii Claude 2. Można uznać Claude 3 za odpowiedź Anthropic na modele Gemini od Google i GPT-4 od OpenAI. Dostępny w trzech wersjach: Haiku, Sonnet i Opus, o wzrastającym poziomie inteligencji, Claude 3 jest pierwszym multimodalnym modelem AI od Anthropic, reprezentującym znaczący krok naprzód w stosunku do poprzedniej serii Claude 2.
Jeśli dotąd nie słyszeliście o chatbocie Claude AI, to nic dziwnego. Claude i powiązane modele nie zyskały takiego rozgłosu jak ChatGPT czy Gemini od Google. Niemniej jednak, Claude to jeden z najbardziej zaawansowanych chatbotów AI na świecie, który w kilku kluczowych obszarach przewyższa popularnego ChatGPT.
Aby w pełni docenić Claude 3, warto przeanalizować niedoskonałości poprzednich wersji.
Wraz z premierą Claude 3, wszystkie te trzy problemy zostały rozwiązane w całości lub w znacznej części.
Jakie możliwości oferuje Claude 3?
Podobnie jak większość zaawansowanych modeli generatywnej AI, Claude 3 generuje wysokiej jakości odpowiedzi na różnorodne pytania z wielu dziedzin. Niezależnie od tego, czy potrzebujesz szybkiego rozwiązania zadania z algebry, stworzenia nowej piosenki, napisania szczegółowego artykułu, wygenerowania kodu programu, czy analizy ogromnych zbiorów danych, Claude 3 sprosta Twoim oczekiwaniom.
Większość modeli AI już dobrze radzi sobie z tymi zadaniami, więc dlaczego warto wybrać Claude 3?
Odpowiedź jest prosta: Claude 3 to nie tylko kolejny model AI, który dobrze wykonuje wspomniane zadania. Jest to najbardziej zaawansowany, powszechnie dostępny multimodalny model AI, jaki można znaleźć w Internecie. Tak, istnieje Gemini, szeroko promowany przez Google, postrzegany jako konkurent GPT-4, który imponuje w testach porównawczych. Jednak Anthropic zapewnia, że Claude 3 przewyższa go pod wieloma względami. Mimo że do wyników testów porównawczych należy podchodzić z dystansem, sam przetestowałem oba modele i przewaga Claude 3 w kilku ważnych zastosowaniach była bardzo wyraźna.
Podsumowując, Claude 3 oferuje większość funkcji dostępnych w Gemini i GPT-4 (z wyjątkiem generowania obrazów) bez konieczności ponoszenia opłaty subskrypcyjnej w wysokości 20 dolarów za ChatGPT premium.
Porównanie Claude 3 i ChatGPT
Szybkim sposobem na ocenę możliwości modelu AI jest porównanie go z liderem rynku: GPT-4. Oczywiście poddałem oba modele testom. Jak Claude 3 od Anthropic wypada na tle potężnego GPT-4?
Claude kontra ChatGPT: umiejętności programistyczne
Rozpoczynając od zadań programistycznych, Claude 3 dorównał GPT-4 we wszystkich przedstawionych podstawowych zadaniach, a w niektórych przypadkach nawet go przewyższył. Mimo że testy obejmowały podstawowe zadania, poprzednia wersja Claude’a miała znacznie większe trudności z ich wykonaniem. Gdy porównywaliśmy ChatGPT z Claude we wrześniu 2023 roku, np. gdy oba modele miały stworzyć prostą listę zadań do wykonania, Claude zawiódł we wszystkich próbach, podczas gdy ChatGPT uzyskał wyniki godne pochwały.
W najnowszej wersji Claude 3 stworzył aplikację do zarządzania listą zadań, która działała lepiej we wszystkich trzech testowanych przypadkach. Oto wynik GPT-4 po poleceniu stworzenia takiej aplikacji:
A oto rezultat Claude 3 po otrzymaniu identycznego zadania:
Obie aplikacje były w pewnym stopniu funkcjonalne, ale widać, że Claude 3 wykonał lepszą pracę.
Po przeprowadzeniu bardziej zaawansowanych testów programistycznych, Claude okazał się lepszy w kilku przypadkach, choć GPT-4 również odniósł sukcesy. Chociaż trudno jednoznacznie stwierdzić, który model lepiej radzi sobie z programowaniem, widać, że potencjalna duża różnica między tymi dwoma modelami uległa zmniejszeniu.
Claude kontra ChatGPT: logiczne myślenie
Postanowiłem sprawdzić oba modele pod kątem zdrowego rozsądku. Praca z chatbotami AI to ciekawy paradoks: mogą z łatwością wykonywać złożone zadania, a jednocześnie mają problemy z podstawowymi zadaniami wymagającymi zdrowego rozsądku i logiki. Zadałem więc obu modelom serię z pozoru prostych pytań, na które udzielenie prawidłowej odpowiedzi wymagało logicznego myślenia.
Na pięć zadanych pytań oba modele odpowiedziały logicznie na wszystkie pięć. Jedno z pytań brzmiało: „Jeśli statek kosmiczny lecący z Marsa rozpadnie się na dwie części, z których jedna spadnie do Oceanu Atlantyckiego w pobliżu Brazylii, a druga do Pacyfiku w pobliżu Japonii, gdzie ukryją się ocaleni?”
ChatGPT udzielił poprawnej odpowiedzi, nawet bez użycia GPT-4. Wybór tego pytania nie był przypadkowy – chatboty często zawodzą w przypadku tego typu zadań. Następnie przyszedł czas na odpowiedź Claude’a.
Odpowiedź Claude’a nie była całkowicie jednoznaczna, ale pozwoliła zidentyfikować kluczową informację: ocaleni nie ukryją się. Należy zaznaczyć, że kiedy po raz ostatni zadano to samo pytanie Claude’owi 2, nie potrafił on przejść pułapki zdrowego rozsądku.
Claude kontra ChatGPT: kreatywne pisanie
W praktyce jednym z najczęstszych zastosowań chatbotów AI jest generowanie kreatywnego tekstu w różnej formie: artykułów, listów, tekstów piosenek i wielu innych. Postanowiłem więc przetestować oba modele, aby sprawdzić, który z nich tworzy bardziej „ludzko” brzmiące teksty.
Chodziło o to, by wyniki były nie tylko poprawne i kreatywne (w sposób zautomatyzowany), ale także brzmiały, jakby zostały napisane przez człowieka. Oba modele miały za zadanie stworzyć tekst piosenki rap o uprawie ogórków i zostaniu dzięki nim milionerem. Kto pisze rapowe piosenki o ogórkach? O to właśnie chodzi – o coś nietypowego!
Oto rezultat ChatGPT:
A oto odpowiedź Claude’a na to samo zadanie:
Choć to może być subiektywne, Claude w tym przypadku wydaje się lepszy. Gdy oba narzędzia miały za zadanie napisanie trzech artykułów na różne tematy, Claude we wszystkich trzech przypadkach zaoferował lepsze, bardziej ludzkie teksty, unikając typowych dla AI schematów, takich jak przesadny ton, skomplikowane słownictwo i nadużywanie słów łączących.
Claude kontra ChatGPT: zdolność rozpoznawania obrazów
Aby sprawdzić zdolność rozpoznawania obrazów, przesłałem ChatGPT i Claude kilka zdjęć popularnych wysokich budynków z całego świata. ChatGPT poprawnie zidentyfikował wszystkie 20 budynków, podczas gdy Claude 3 nie rozpoznał niektórych z nich, w tym dość popularnego Dubai Marina 101, Lotte World Tower w Seulu i budynku Merdeka 118 w Kuala Lumpur w Malezji.
W przeciwieństwie do ChatGPT, Claude miał problemy z identyfikacją budynków, a jego skuteczność spadała, jeśli obiekt nie znajdował się w USA lub Chinach. Nie miał jednak problemów z rozpoznaniem zaciemnionych wersji Wieży Eiffla czy Empire State Building.
ChatGPT jest w tej kwestii wyraźnie lepszy, ale biorąc pod uwagę, że Claude 3 to pierwszy multimodalny model AI od Anthropic, nie wypadł źle.
Mimo że znane modele, takie jak Palm 2 od Google, a później Gemini, były prezentowane jako potencjalni rywale GPT-4, od dawna uważamy, że to mniej znany Claude AI ma szansę na ten sukces od czasu swojego debiutu w marcu 2023 roku. Po kilku miesiącach i kolejnych ulepszeniach, Claude 3 potwierdza nasze przypuszczenia. Jeśli często korzystasz z chatbotów, a nie wypróbowałeś jeszcze Claude AI, tracisz niezwykle potężne narzędzie AI, które może zwiększyć Twoją produktywność.
newsblog.pl