Kompletny przewodnik do wykrywania plagiatu chatbota AI

Chatboty AI, takie jak ChatGPT, nie ograniczają się tylko do odpowiadania na Twoje pytania. Mogą pisać podobne do ludzi e-maile, listy motywacyjne, eseje, poezję, posty na blogach i wiele więcej.

Pisanie AI jest jak kameleon – może wtapiać się w każdy inny rodzaj pisania tak dobrze, że trudno byłoby odróżnić.

Niestety sprawia to, że nam, ludziom, niezwykle trudno jest wykryć, kiedy sztuczna inteligencja napisała coś zamiast osoby. Jasne, wszyscy moglibyśmy skorzystać z rady Sherlocka Holmesa i „wyeliminować niemożliwe”, ale kto ma na to czas?

Co jeśli powiem ci, że powyższy akapit jest napisany przez sztuczną inteligencję? Tak, poprosiłem YouWrite o napisanie krótkiego wstępu do tego posta i tak właśnie wyszło. Całkiem przekonujące prawda? W tym problem, zbyt przekonujące jest to, że każdy może przedstawić to jako własną pracę, aby z tego skorzystać.

Sztuczna inteligencja nie tylko przeformułowuje treść; uczą się tematu i przedstawiają go w języku naturalnym za pomocą RLHF. Oznacza to, że generowane treści nie będą odczytywane jak roboty, ani nie będą porównywane z danymi dostępnymi online w celu wykrycia plagiatu.

Łapanie treści generowanych przez sztuczną inteligencję nie jest łatwe i nie zamierzam dawać ci fałszywej nadziei, że możesz je złapać ze 100% dokładnością. Jednak przy odrobinie pracy detektywistycznej i pomocy narzędzi do wykrywania pisania AI można złapać większość prac AI.

Poniżej znajdziesz ręczne sposoby wykrywania plagiatu AI, a także niektóre narzędzia automatyczne.

Ręcznie wykryj plagiat AI 🕵️

ChatGPT nie jest nawet dużym problemem, jeśli chodzi o plagiat AI. Istnieje wiele alternatywnych narzędzi opartych na tej samej technologii GPT-3 i stworzonych do pisania. Są one bardzo zaawansowane i stworzone specjalnie do tworzenia treści przypominających ludzi, które są trudne do złapania.

Narzędzia do automatycznego wykrywania są nieco trafione lub chybione w zależności od typu treści, długości i złożoności. Tak więc przynajmniej obecnie najlepszym sposobem jest ręczne łączenie kropek, aby dowiedzieć się, czy zapis jest generowany przez sztuczną inteligencję, czy nie.

Poniżej wymieniłem kilka typowych wskazówek, których możesz szukać, aby złapać treści generowane przez sztuczną inteligencję.

# 1. Nieaktualne informacje

ChatGPT i inne AI oparte na GPT-3 straciły wiedzę pod koniec 2021 roku. Mimo że niektóre boty AI mają wbudowaną wyszukiwarkę do wyszukiwania najnowszych informacji, nadal polegają na starych danych do pisania długich treści, takich jak eseje lub wpisy na blogu.

Jeśli zauważysz, że artykuł ciągle mówi o nieaktualnych danych, szczególnie przed 2021 rokiem, może to być generowane przez sztuczną inteligencję.

Na poniższym zrzucie ekranu poprosiłem YouWrite, aby opowiedział mi o ostatnich Mistrzostwach Świata FIFA i oto, co wymyślił.

Mówi o mundialu 2018, a nie o ostatnim z 2022. Mimo że narzędzie zostało zaktualizowane, aby mówić o ostatnich wydarzeniach, takich jak Mistrzostwa Świata 2022, do pisania długich postów nadal wykorzystuje nieaktualne dane, na których jest zbudowane.

#2. Używa tej samej struktury zdań dla opisów

Pisząc opisy wielu produktów/aplikacji, sztuczna inteligencja zwykle używa tej samej struktury zdania, którą edytuje, aby pasowała do opisu produktu. Opisy zwykle zaczynają się od tego samego słowa, np. The, It, A lub nazwy produktu. Opisy mają również dedykowany fokus, który powtarza.

Na przykład poniżej poprosiłem ChatGPT, aby powiedział mi o „stronach internetowych z ofertami pracy”. Możesz zobaczyć, że wszystkie opisy zaczynają się na literę „A” i są ściśle określone.

Zadałem również YouChat to samo pytanie, a on zrobił to samo i powtórzył nazwę każdej witryny na początku, a same opisy wyglądają jak przeredagowana wersja każdej z nich.

Jeśli opis, który analizujesz, zawiera opis czegoś podobnego w naturze, jest to świetny sposób na złapanie pisania AI.

#3. Używa krótkich zdań

W przypadku większości opisów sztuczna inteligencja użyje jednolinijkowych zdań z co najwyżej pojedynczym przecinkiem. Być może starają się zminimalizować ryzyko błędu, ale unikają pisania długich zdań, które mogłyby wymagać użycia dwukropków, średników lub grubych linii poziomych.

Wiem, że nie jest to najlepsza wskazówka, aby złapać pisanie AI, ale warto to rozważyć, aby jeszcze bardziej udowodnić swoje podejrzenia.

#4. Może podać błędne informacje

W przypadku złożonych pytań, które zwykle obejmują jakieś instrukcje, sztuczna inteligencja może nie zrozumieć intencji i podać nieprawidłowe informacje. Nie mówię tutaj o nieaktualnych informacjach, po prostu z przekonaniem podają błędne informacje, gdy nie rozumieją tematu.

Na przykład poprosiłem YouWrite, aby powiedział mi „jak zrootować telefon z Androidem bez komputera”. Nadal pokazywał mi metody, które wymagają użycia komputera w pewnym momencie instrukcji.

#5. Nie dodaje osobistej opinii

Mówiąc o czymś, AI po prostu mówi o znanych faktach. W przeciwieństwie do ludzi, nie będzie mówić o swoich osobistych doświadczeniach z nim. Chociaż sztuczną inteligencję można poinstruować, aby stworzyła praktyczny zapis, domyślnie unikają tego.

Jeśli zauważysz, że opis mówi tylko o dobrze znanych faktach, jest duża szansa, że ​​​​jest napisany przez sztuczną inteligencję. Na przykład, mówiąc o aplikacji, będzie mówić o jej funkcjach, a nie o tym, jak płynna jest nawigacja lub jak właściwie korzystać z aplikacji.

#6. Krótkie wyjaśnienia

Ponieważ sztuczna inteligencja jest ograniczona dostępną obecnie wiedzą, mają tendencję do pisania krótkich wyjaśnień i opisów. Z mojego doświadczenia wynika, że ​​jeśli rozmawiają na określony temat — na przykład rootowanie Androida — wyjaśniają maksymalnie w 2-3 akapitach. W przypadku aplikacji lub produktów opis zwykle nie przekracza 1 akapitu.

Ludzie mogą szczegółowo o czymś pisać, w tym o funkcjach, ograniczeniach, osobistych doświadczeniach, cenach itp. Z drugiej strony sztuczna inteligencja zwykle koncentruje się na głównych funkcjach lub najważniejszych wydarzeniach, więc opis też jest krótki. Jeśli instruktor poprosi o więcej szczegółów, szansa na błędne informacje znacznie wzrasta.

#7. Sprawdź historię pisarza

Jako nauczyciel lub webmaster, jeśli masz dostęp do wcześniejszych prac lub zadań pisarza, dobrym pomysłem może być porównanie ich z artykułem, co do którego masz wątpliwości. Jest wysoce nieprawdopodobne, aby pisarz miał podobny styl pisania do sztucznej inteligencji. Mimo że sztuczna inteligencja może zmieniać ton pisania, wybierane przez nią style są raczej ogólne i nie może skopiować Twojego tonu.

Biorąc przykład z akapitu wygenerowanego przez sztuczną inteligencję we wstępie tego posta. Każdy, kto przeczytał moje poprzednie posty, z łatwością zauważy, że mój styl pisania jest zupełnie inny.

Możesz po prostu przeczytać 2-3 wcześniejsze prace pisarza i zobaczyć, czy pasuje to do stylu pisania podejrzanego zapisu.

Narzędzia do wykrywania plagiatu AI

Dostępnych jest wiele narzędzi, które mogą wykrywać treści napisane przez sztuczną inteligencję. Jednak ich dokładność różni się od siebie i może zawieść w zależności od rodzaju treści i długości.

Testowałem te narzędzia przy użyciu różnych rodzajów treści generowanych przez ChatGPT, GPT-3 Playground, WriteSonic, Rytr i YouWrite. Udało im się wykryć wszystkie rodzaje treści generowanych przez ChatGPT i GPT-3 Playground.

Chociaż mieli mieszane wyniki dla dedykowanych narzędzi do pisania, co ciekawe, wszystkie nie wykryły YouWrite. Zgaduję, że dzieje się tak dlatego, że YouWrite popełnia ludzkie błędy, aby uniknąć wykrycia.

Polecam korzystanie z tych narzędzi wraz z ręcznym sprawdzaniem zawartości. Najpierw przeanalizuj treść za pomocą jednego z tych narzędzi, a następnie ręcznie sprawdź, czy nie ma żadnych wskazówek, które pozwolą potwierdzić podejrzenia.

Poniżej wymieniam te, które dawały najlepsze rezultaty i są najłatwiejsze w użyciu:

Uwaga: do demonstracji użyję wygenerowanego tekstu z WriteSonic na temat „Korzyści z mango”.

# 1. Zawartość na dużą skalę

W przypadku większości testów, które przeprowadziłem, wykrywacz treści AI firmy Content At Scale był najdokładniejszy. Pozwala skanować do 2500 znaków na skan i dokonuje procentowej prognozy pokazującej rzeczywistą lub fałszywą gęstość treści.

Można bezpiecznie założyć, że treść, która jest w ponad 60% fałszywa, została napisana przez sztuczną inteligencję, a przynajmniej większość z nich. Na poniższym zrzucie ekranu widać, że 96% treści to fałszywki, które w pełni wygenerowałem za pomocą sztucznej inteligencji.

#2. GPTZero

Jeśli chcesz zobaczyć dokładnie, jakie treści są generowane przez sztuczną inteligencję, dobrym rozwiązaniem jest GPTZero. GPTZero nie ocenia treści. Zamiast tego podkreśla dokładnie treść, która prawdopodobnie jest generowana przez sztuczną inteligencję.

Chociaż pokazuje wyniki zakłopotania i rozerwania, aby zorientować się w losowości tekstu, co ważniejsze, obsługuje 5000 znaków na skan i może również przesyłać pliki. Skanowanie dużej zawartości znacznie pomaga w poprawie dokładności.

#3. Detektor wyjścia GPT-2

Twórcy ChatGPT oferują również bota do wykrywania własnej pracy. Ponieważ GPT-2 i GPT-3 różnią się tylko całkowitymi danymi używanymi do szkolenia, ten detektor GPT-2 działa dobrze również w przypadku sztucznej inteligencji opartej na GPT-3.

Nie ma ograniczeń co do ilości skanowanych treści, więc idealnie nadaje się do wykrywania bardzo długich treści generowanych przez sztuczną inteligencję. Stwierdziłem również, że jego dokładność jest dobra, szczególnie w przypadku treści generowanych przez ChatGPT. Jest to jednak trochę przegrane w przewidywaniach, więc bierz pod uwagę jego wyniki tylko wtedy, gdy pokazuje ponad 50% treści jako fałszywe.

#4. Wykrywacz treści AI pisarza

Wyniki narzędzia Writer AI Content Detector są wątpliwe przy wykrywaniu treści z narzędzi AI do pisania, ale sprawdza się świetnie w przypadku treści generowanych przez ChatGPT. Możesz zeskanować 1500 znaków na skan, a nawet dodać adres URL treści, jeśli jest już opublikowana.

W moim testowym tekście generowanym przez sztuczną inteligencję stwierdzono, że 94% treści jest tworzonych przez ludzi, co jest całkiem nie tak w porównaniu z innymi narzędziami. Niemniej jednak nadal warto używać go do wykrywania treści ChatGPT, zwłaszcza jeśli została już opublikowana.

#5. Szkic i cel

Proste, ale potężne narzędzie do wykrywania pisma AI. Z mojego doświadczenia wynika, że ​​Draft & Goal oferował podobne wyniki do Content At Scale, ale nie ma limitu liczby słów, dzięki czemu można skanować długie zapisy. Jednak czas skanowania wydłuża się w zależności od tego, ile treści skanujesz.

W moim przykładowym tekście jest napisane, że 94% tekstu jest generowane przez sztuczną inteligencję.

Moje przemyślenia 💭

Osobiście uważam, że pomoc AI to naprawdę świetny sposób na usunięcie blokady pisarza, zebranie wszystkich informacji w jednym miejscu i znalezienie inspiracji. Jednak nigdy nie powinno zastępować ludzkiego pisma, ponieważ sztuczna inteligencja ogranicza się do wiedzy już znanej.

Możesz także zapoznać się z najlepszymi narzędziami do sprawdzania plagiatu, aby zapobiec kopiowaniu.