Czy test Turinga jest przestarzały? 5 alternatywnych testów Turinga

Ponad 70 lat temu, kiedy konceptualizowano sztuczną inteligencję, Alan Turing opublikował artykuł opisujący, jak ją zidentyfikować. Był później znany jako test Turinga i był używany od dziesięcioleci do rozróżniania człowieka od sztucznej inteligencji.

Jednak wraz z wprowadzeniem zaawansowanych chatbotów AI, takich jak ChatGPT i Google Bard, coraz trudniej jest stwierdzić, czy rozmawiasz z sztuczną inteligencją. Nasuwa się pytanie; czy test Turinga jest przestarzały? A jeśli tak, to jakie są alternatywy?

Spis treści:

Czy test Turinga jest przestarzały?

Źródło obrazu: Jezus Sanz/Shutterstock

Aby ustalić, czy test Turinga jest nieaktualny, musisz najpierw zrozumieć, jak on działa. Aby sztuczna inteligencja przeszła test Turinga, musi przekonać przesłuchującego człowieka, że jest człowiekiem. Jest jednak pewien haczyk — sztuczna inteligencja jest oceniana wraz z człowiekiem i musi odpowiadać za pomocą tekstu.

Pomyśl o tym w ten sposób; jeśli jesteś przesłuchującym i zadajesz pytania dwóm uczestnikom online za pomocą tekstu, ale jeden z nich jest modelem AI — czy rozróżniłbyś ich po pięciu minutach? Należy pamiętać, że celem testu Turinga nie jest zidentyfikowanie modelu sztucznej inteligencji na podstawie poprawnych odpowiedzi, ale ocena, czy sztuczna inteligencja może myśleć lub zachowywać się jak człowiek.

Problem z podejściem testowym Turinga polegającym na identyfikowaniu tylko reakcji podobnych do ludzkich polega na tym, że nie bierze się pod uwagę innych czynników. Na przykład inteligencja modelu AI lub wiedza przesłuchującego. Poza tym test Turinga ogranicza się tylko do tekstu i coraz trudniej jest zidentyfikować sztuczną inteligencję, która generuje ludzki głos lub filmy deepfake naśladujące ludzkie zachowanie.

Jednak obecne modele sztucznej inteligencji, takie jak ChatGPT-4 i Google Bard, nie rozwinęły się jeszcze do punktu, w którym mogą konsekwentnie przejść test Turinga. W rzeczywistości, jeśli znasz sztuczną inteligencję, możesz rozpoznać tekst generowany przez sztuczną inteligencję.

5 najlepszych alternatyw testu Turinga

Możliwe, że przyszłe modele AI, takie jak ChatGPT-5, mogłyby przejść test Turinga. Jeśli tak się stanie, potrzebowalibyśmy różnych testów połączonych z testem Turinga, aby określić, czy rozmawiamy z sztuczną inteligencją, czy z człowiekiem. Oto najlepsze alternatywy testu Turinga:

1. Test Marcusa

Gary Marcus, znany kognitywista i badacz sztucznej inteligencji, zaproponował alternatywę dla testu Turinga, która została opublikowana w czasopiśmie Nowojorczyk zidentyfikować zdolności poznawcze sztucznej inteligencji. Test jest prosty — oceniasz model sztucznej inteligencji na podstawie jego zdolności do oglądania i rozumienia filmów z YouTube i programów telewizyjnych bez napisów i tekstu. Aby sztuczna inteligencja zdała test Marcusa, powinna rozumieć sarkazm, humor, ironię i fabułę podczas oglądania filmów i wyjaśniać to jak człowiek.

W tej chwili GPT-4 może opisywać obrazy, ale jak dotąd nie ma obecnie modelu AI, który byłby w stanie zrozumieć filmy jak człowiek. Pojazdy samojezdne są blisko, ale nie są całkowicie autonomiczne i wymagają czujników, ponieważ nie są w stanie zrozumieć wszystkiego w otaczającym ich środowisku.

2. Wizualny test Turinga

Zgodnie z artykułem naukowym opublikowanym na PNAS, wizualny test Turinga może być użyty do określenia, czy rozmawiasz z człowiekiem, czy z sztuczną inteligencją za pomocą kwestionariuszy obrazkowych. Działa jak test Turinga, ale zamiast odpowiadać na pytania za pomocą tekstów, uczestnikom pokazywane są obrazy i oczekuje się, że odpowiedzą na proste pytania, myśląc jak człowiek. Jednak wizualny test Turinga różni się od CAPTCHA, ponieważ wszystkie odpowiedzi są poprawne – ale aby przejść test, sztuczna inteligencja musi przetwarzać obrazy podobnie jak człowiek.

Poza tym, jeśli sztucznej inteligencji i człowiekowi pokazano wiele obrazów obok siebie i poproszono o zidentyfikowanie realistycznych obrazów, człowiek miałby zdolność poznawczą, aby przejść test. Dzieje się tak, ponieważ modele AI mają trudności z rozróżnieniem zdjęć, które nie wyglądają tak, jakby zostały zrobione w prawdziwym świecie. W rzeczywistości jest to powód, dla którego można identyfikować obrazy generowane przez sztuczną inteligencję za pomocą anomalii, które nie mają sensu.

3. Test Lovelace 2.0

Teoria, że komputer nie może tworzyć oryginalnych pomysłów wykraczających poza to, do czego został zaprogramowany, została po raz pierwszy sformułowana przez Adę Lovelace przed testem Turinga. Jednak Alan Turing sprzeciwił się tej teorii, argumentując, że sztuczna inteligencja wciąż może zaskakiwać ludzi. Dopiero w 2001 roku opracowano wytyczne do testu Lovelace, aby odróżnić sztuczną inteligencję od człowieka – i zgodnie z kurzweilbrary zasady zostały później zmienione w 2014 roku.

Aby sztuczna inteligencja zdała test Lovelace’a, musi wykazać, że potrafi generować oryginalne pomysły, które wykraczają poza jej wyszkolenie. Obecne modele sztucznej inteligencji, takie jak GPT-4, nie mają możliwości wymyślania nowych wynalazków wykraczających poza naszą obecną wiedzę. Jednak sztuczna inteligencja ogólna może osiągnąć tę zdolność i przejść test Lovelace’a.

4. Odwrotny test Turinga

Co powiesz na test Turinga, ale wykonany w odwrotnej kolejności? Zamiast próbować dowiedzieć się, czy rozmawiasz z człowiekiem, celem odwrotny test Turinga polega na oszukaniu sztucznej inteligencji, aby uwierzyła, że jesteś sztuczną inteligencją. Potrzebujesz jednak innego modelu AI, aby odpowiedzieć na te same pytania za pomocą tekstu.

Na przykład, jeśli przesłuchującym jest ChatGPT-4, możesz zarejestrować Google Bard i innego człowieka jako uczestników. Jeśli model sztucznej inteligencji może poprawnie zidentyfikować człowieka na podstawie odpowiedzi, test zdał pomyślnie.

Wadą odwrotnego testu Turinga jest to, że jest niewiarygodny, zwłaszcza biorąc pod uwagę, że czasami sztuczna inteligencja nie może rozróżnić treści generowanych przez sztuczną inteligencję i treści napisanych przez ludzi.

5. Ramy klasyfikacji sztucznej inteligencji

Zgodnie z ramami klasyfikacji AI opracowanymi przez Chris Saad, test Turinga to tylko jedna metoda oceny, która pozwala wiedzieć, czy rozmawiasz z sztuczną inteligencją. Mówiąc bardziej zwięźle, ramy klasyfikacji sztucznej inteligencji opierają się na teorii wielorakiej inteligencji, która wymaga, aby ludzka inteligencja spełniała co najmniej osiem różnych kryteriów, do których należą: rytm muzyczny, inteligencja logiczno-matematyczna, identyfikacja wizualna, inteligencja emocjonalna, inteligencja autorefleksyjna , zdolność myślenia egzystencjalnego i ruch ciała.

Ponieważ sztuczna inteligencja jest oceniana na podstawie ośmiu różnych parametrów, jest mało prawdopodobne, aby przeszła na człowieka, nawet jeśli działa lepiej niż średnia w niektórych testach porównawczych. Na przykład ChatGPT może rozwiązywać problemy matematyczne, opisywać obrazy i rozmawiać w języku naturalnym, takim jak człowiek, ale nie poradziłby sobie z innymi kategoriami zdefiniowanymi w ramach klasyfikacji AI.

Test Turinga nie jest rozstrzygający

Test Turinga miał być bardziej eksperymentem myślowym niż rozstrzygającym testem różnicującym ludzi i sztuczną inteligencję. Kiedy został pierwotnie zaproponowany, był kluczowym punktem odniesienia do pomiaru inteligencji maszyn.

Jednak wraz z niedawnym rozwojem modeli sztucznej inteligencji z interaktywnymi możliwościami mowy, wzroku i słuchu test Turinga jest niewystarczający, ponieważ ogranicza się do rozmowy tekstowej. Najskuteczniejszym rozwiązaniem byłoby wprowadzenie alternatywnych testów Turinga, które jeszcze bardziej odróżnią modele sztucznej inteligencji od ludzkich.