Co to jest interpreter kodu ChatGPT? Dlaczego jest to takie ważne?

ChatGPT szturmem podbił świat, olśniewając ludzi swoimi ludzkimi zdolnościami konwersacyjnymi. Ale nawet tak potężny, jak to jest, ma ograniczenia. Chociaż ChatGPT może oferować rozwiązania złożonych problemów, nie może ich aktywnie wdrażać. Code Interpreter to próba OpenAI przekształcenia ChatGPT ze zwykłego generatora pomysłów w agenta AI, który może wdrażać pomysły w celu rozwiązania problemu.

Konsekwencje tych nowych możliwości są głębokie. Oto, co powinieneś wiedzieć o funkcji interpretera kodu ChatGPT i dlaczego jest ona tak ważna.

Co to jest interpreter kodu ChatGPT?

Code Interpreter, w swej istocie, jest piaskownicą środowisko programistyczne Pythona w ChatGPT, w którym możesz wykonywać szeroki zakres zadań, wykonując kod Pythona. Niestety, ponieważ jest kojarzony z kodowaniem lub programowaniem, jest często pomijany lub źle rozumiany przez wielu użytkowników. Chociaż nosi nazwę „Interpretator kodu” i wykorzystuje język programowania Python do wykonywania zadań, nie jest to funkcja przeznaczona wyłącznie dla osób z umiejętnościami programowania. Jasne, niektóre umiejętności programistyczne mogą pomóc ci lepiej wykorzystać tę funkcję, ale nie potrzebujesz żadnego doświadczenia w programowaniu, aby z niej korzystać.

Aby lepiej zrozumieć, co robi funkcja interpretera kodu, lepiej spojrzeć na to z perspektywy operacyjnej.

Zanim funkcja Code Interpreter lub jakakolwiek inna wtyczka ChatGPT została dodana do ChatGPT, jakikolwiek problem, który chciałeś rozwiązać za pomocą ChatGPT, musiał być taki, którego rozwiązanie można było przedstawić za pomocą tekstu. Czy potrzebujesz ChatGPT, aby wyjaśnić znaczenie generatywnej sztucznej inteligencji? Cóż, to jest coś, co można rozwiązać przez generowanie tekstu. Co powiesz na użycie ChatGPT do przetłumaczenia tekstu na inny język? Można to również rozwiązać przez generowanie tekstu. W przypadku tych problemów rozwiązanie można podać w postaci tekstu.

Ale co, jeśli chcesz rozwiązać problem, taki jak generowanie złożonego wykresu, edytowanie obrazu lub pobieranie wartości koloru z obrazu? Są to problemy, których rozwiązań nie można przedstawić w postaci tekstu — wymagają one określonych rozwiązań. Bez wtyczek, takich jak Code Interpreter, najlepsze, co ChatGPT może dla Ciebie zrobić, to opisać, jak byś to zrobił. Jednak interpreter kodu jest jak ukryte narzędzie, które pobiera opis ChatGPT, w jaki sposób można rozwiązać problem i zaimplementować go za pomocą kodu Pythona. Ale jak to działa?

Jak działa interpreter kodu ChatGPT?

Code Interpreter łączy moc dużego modelu językowego z mocą programowania w Pythonie, dzięki czemu ChatGPT może być czymś więcej niż tylko generatorem tekstu. Te dwa składniki są niezbędne do zrozumienia, jak działa funkcja interpretera kodu. Powiedzmy, że chcesz, aby ChatGPT podzielił obraz na dwie równe części i odwrócił kolory na jednej z części przed dodaniem ich razem w celu utworzenia nowego obrazu. Jak ChatGPT miałby to osiągnąć?

Oto jak to prawdopodobnie by się rozegrało. Wykorzystując swój model językowy GPT, ChatGPT będzie miał pomysł, jak rozwiązać ten problem, w tym konkretnym przypadku, z programowaniem w Pythonie. Więc to, co robi ChatGPT, polega na napisaniu skryptu w Pythonie, który będzie mógł podzielić obraz na dwie równe części i odwrócić kolory jednej z części przed dodaniem ich razem w celu utworzenia nowej — wiesz, tak jak użytkownik wymagany.

Teraz, ponieważ interpreter kodu jest środowiskiem programistycznym w języku Python zdolnym do uruchamiania kodu w języku Python, ChatGPT przekazuje wygenerowany przez siebie skrypt w języku Python do interpretera kodu. Po wykonaniu skryptu Python zwraca obraz wynikowy do ChatGPT. Problem rozwiązany. To tak, jakby programista napisał ci program, który rozwiązuje każdy opisany przez ciebie problem w czasie rzeczywistym.

Dlaczego interpreter kodu jest tak ważny?

Chociaż ogłoszenie o wydaniu funkcji Code Interpreter nie wywołało tak dużego szumu, jak przystało na jej potencjalny wpływ, może to być najważniejsza funkcja ekosystemu ChatGPT na dłuższą metę, oprócz samego modelu bazowego. To takie ważne.

Chociaż jego obecne możliwości nie odzwierciedlają jego prawdziwego potencjału, funkcja Code Interpreter, a przynajmniej jej model operacyjny, prawdopodobnie będzie przyszłością chatbota ChatGPT AI. Jak to?

Obecne iteracje dużych modeli językowych, w tym modeli GPT-3.5 i GPT-4, które napędzają ChatGPT, są zasadniczo ograniczone. Jak powiedzieliśmy wcześniej, potrafią opisać, jak rozwiązać problem, ale ich zdolność do wprowadzenia sugerowanych przez nich kroków w życie jest poważnie ograniczona. Właśnie dlatego chatboty AI oparte na LLM nie przekształciły się jeszcze w prawdziwych asystentów AI.

Aby uzyskać wyraźniejszy obraz, weźmy za przykład Asystenta Google. Możesz poprosić Asystenta Google o wykonanie połączenia, wysłanie SMS-a, a może nawet umówienie wizyty u dentysty. W przeciwieństwie do obecnych modeli chatbotów, Asystent Google nie tylko powie Ci, jak coś zrobić; faktycznie może coś zrobić.

Asystent Google może nie być idealnym przykładem, ale jest mikrokosmosem tego, jak obecne iteracje chatbota ChatGPT mogą ewoluować dzięki funkcji interpretera kodu. Możesz powiedzieć ChatGPT, aby wyodrębnił obrazy wszystkich kotów z pliku wideo i wysłał je na Twój adres e-mail. A może przeszukaj Twittera i pobierz wszystkie tweety, które o Tobie wspominają. Lub prawie wszystko, co możesz wymyślić, co można zrobić programowo, a ChatGPT uruchomi interpreter kodu i napisze program, który wykona to zadanie, wykona je i zwróci wyniki w ciągu kilku sekund. Ta zdolność ChatGPT do generowania rzeczywistych wyników za pomocą Code Interpreter sprawia, że ​​ta funkcja jest tak ważna.

Chociaż nie można dokładnie przewidzieć trajektorii rozwoju technologii, łatwo wyobrazić sobie inne firmy zajmujące się sztuczną inteligencją, takie jak Google, przyjmujące podobne modele interpreterów dla swoich chatbotów AI. Podobne interpretery kodu zaimplementowane w innych głównych chatbotach AI mogą być katalizatorem, który sprawi, że chatboty AI staną się bardziej praktycznym i wszechobecnym narzędziem.

Model dla chatbotów AI

Code Interpreter ChatGPT wprowadza nowy paradygmat dla chatbotów AI. Dodając możliwość aktywnego interpretowania instrukcji, pisania kodu i wykonywania programów, OpenAI dało ChatGPT możliwość generowania rzeczywistych wyników poprzez samą konwersację. Jest to praktyczny model, który inne chatboty AI mogą przyjąć, aby wyjść poza dostarczanie informacji i stać się asystentami AI zdolnymi do podejmowania działań.

Bez wątpienia model interpretera kodu jest kluczową zmianą, która sprawi, że ChatGPT i inne chatboty AI, które przyjmą podobny model, będą znacznie bardziej wydajne i użyteczne.