Komplet guide til at opdage AI Chatbot Plagiat

AI Chatbots som ChatGPT er ikke begrænset til blot at besvare dine spørgsmål. De kan skrive menneskelignende e-mails, følgebreve, essays, poesi, blogindlæg og meget mere.

AI-skrivning er som en kamæleon – den kan blande sig med enhver anden type skrift så godt, at du ville blive presset hårdt for at se forskel.

Det gør det desværre utroligt svært for os mennesker at opdage, når en AI har skrevet noget i stedet for en person. Selvfølgelig kunne vi alle tage Sherlock Holmes’ råd og “eliminere det umulige”, men hvem har tid til det?

Hvad hvis jeg fortæller dig, at ovenstående afsnit er skrevet af en AI? Ja, jeg bad YouWrite om at skrive en hurtig introduktion til dette indlæg, hvilket er, hvad det kom frem til. Ret overbevisende ikke? Det er problemet, det er for overbevisende, at enhver kan præsentere det som deres eget arbejde til at drage fordel af det.

AI’er omformulerer ikke kun indholdet; de lærer emnet og præsenterer det i et naturligt sprog ved hjælp af RLHF. Det betyder, at det genererede indhold hverken vil føles robotagtigt at læse, og det kan heller ikke sammenlignes med data, der er tilgængelige online for at fange plagiat.

Det er ikke let at fange AI-genereret indhold, og jeg vil ikke give dig falsk håb om, at du kan fange det med 100 % nøjagtighed. Men med en lille smule detektivarbejde og lidt hjælp fra AI-skrivedetektionsværktøjer kan du fange de fleste værker af AI.

Nedenfor finder du manuelle måder at opdage AI-plagiat på og nogle automatiske værktøjer også.

Opdag AI-plagiat manuelt 🕵️

ChatGPT er ikke engang et stort problem, når det kommer til AI-plagiat. Der er mange alternative værktøjer, der er baseret på den samme GPT-3 teknologi og er bygget til at skrive. Disse er meget avancerede og specielt lavet til at skabe menneskelignende indhold, der er svært at fange.

Automatiske registreringsværktøjer er en smule hit eller miss afhængigt af indholdstype, længde og kompleksitet. Så i det mindste i øjeblikket er det den bedste måde at forbinde prikkerne manuelt for at finde ud af, om opskrivningen er AI-genereret eller ej.

Nedenfor har jeg listet nogle almindelige spor, som du kan kigge efter for at fange AI-genereret indhold.

  10 værktøjer til administration af sociale medier til at administrere flere konti

#1. Forældet information

ChatGPT og anden GPT-3-baseret AI fik skåret deres viden i slutningen af ​​2021. Selvom nogle AI-bots har en indbygget søgemaskine til at lede efter de seneste oplysninger, er de stadig afhængige af gamle data til at skrive indhold i lang form som f.eks. essays eller blogindlæg.

Hvis du bemærker, at opskriften konstant taler om forældede data, specifikt før 2021, så kan det være AI-genereret.

I nedenstående skærmbillede bad jeg YouWrite om at fortælle mig om det seneste FIFA World Cup, og det er det, det kom frem til.

Den taler om VM 2018 i stedet for den seneste 2022. Selvom værktøjet er opdateret til at tale om nylige begivenheder som VM i 2022, bruger det stadig de forældede data, det er bygget på, til at skrive lange indlæg.

#2. Bruger den samme sætningsstruktur til beskrivelser

Mens du skriver beskrivelser af flere produkter/apps, bruger AI normalt den samme sætningsstruktur, som den redigerer, så den passer til beskrivelsen af ​​et produkt. Beskrivelserne starter normalt med det samme ord, f.eks. The, It, A eller produktets navn. Beskrivelserne har også et dedikeret fokus, som det gentager.

Nedenfor bad jeg for eksempel ChatGPT om at fortælle mig om “websteder for dataindtastningsjob”. Du kan se, at alle beskrivelser starter med “A” og har et strengt fokus.

Jeg stillede også YouChat det samme spørgsmål, og det gjorde det samme og gentog navnet på hver hjemmeside i starten, og selve beskrivelserne ligner en omformuleret version af hver.

Hvis den opskrivning, du analyserer, har en beskrivelse af noget lignende, er det en fantastisk måde at fange AI-skrivning.

#3. Bruger korte sætninger

Til de fleste opskrivninger vil AI bruge one-liner-sætninger med højst et enkelt komma. Måske forsøger de at minimere risikoen for fejl, men de undgår at skrive lange sætninger, der kan kræve brug af kolon, semikolon eller tunge vandrette streger.

Jeg ved, at dette ikke er den bedste ledetråd til at fange AI-skrivning, men det er værd at overveje for yderligere at bevise din mistanke.

#4. Kan give forkerte oplysninger

For komplekse spørgsmål, der normalt involverer en form for instruktion, kan AI’en undlade at forstå hensigten og give forkerte oplysninger. Jeg taler ikke om forældede oplysninger her, de fortæller dig bare med tillid de forkerte oplysninger, når de ikke forstår emnet.

For eksempel bad jeg YouWrite om at fortælle mig “hvordan man rooter en Android-telefon uden en pc”. Det viste mig stadig metoder, der involverer brugen af ​​en pc på et tidspunkt i undervisningen.

#5. Tilføjer ikke en personlig mening

Når man taler om noget, taler AI bare om kendte fakta. I modsætning til mennesker vil den ikke tale om sin personlige oplevelse med den. Selvom AI’er kan instrueres i at oprette en praktisk opskrivning, har de en tendens til at undgå at gøre det som standard.

  Hvad er DHCP (Dynamic Host Configuration Protocol)?

Hvis du bemærker, at opskriften kun taler om velkendte fakta, er det en god chance for, at det er skrevet af en AI. For eksempel, mens den taler om en app, vil den tale om dens funktioner i stedet for, hvor glat navigationen er, eller hvordan man rent faktisk bruger appen.

#6. Korte forklaringer

Da AI’er er begrænset af den viden, der er tilgængelig i øjeblikket, har de en tendens til at skrive korte forklaringer og beskrivelser. Efter min erfaring, hvis de taler om et bestemt emne – såsom Android rooting – holder de forklaringen inden for 2-3 afsnit max. Og for ting som apps eller produkter overstiger beskrivelsen normalt ikke 1 afsnit.

Mennesker kan skrive dybtgående om noget, herunder funktioner, begrænsninger, personlig erfaring, priser osv. På den anden side fokuserer AI normalt på de vigtigste funktioner eller højdepunkter, så opskriften er også kort. Hvis instruktøren beder om flere detaljer, øges chancen for forkert information markant.

#7. Tjek forfatterens historie

Hvis du som underviser eller webmaster har adgang til skribentens tidligere arbejde eller opgaver, kan det være en god idé at sammenligne det med den opskrivning, du er mistænksom over for. Det er højst usandsynligt, at forfatteren har en skrivestil, der ligner en AI. Selvom AI kan ændre skrivetoner, men stilarter, den vælger, er ret generiske, og den kan ikke kopiere din tone.

Tager eksemplet med det AI-genererede afsnit i introen til dette indlæg. Enhver, der har læst mine tidligere indlæg, kan nemt se, at min skrivestil er helt anderledes i forhold til den.

Du kan bare læse 2-3 tidligere værker af forfatteren og se, om det passer til skrivestilen i den mistænkelige opskrivning.

Værktøjer til at opdage AI plagiat

Der er en masse værktøjer tilgængelige, der kan registrere AI-skrevet indhold. Deres nøjagtighed er dog forskellig fra hinanden og kan fejle afhængigt af indholdstypen og længden.

Jeg testede disse værktøjer ved hjælp af forskellige typer indhold genereret af ChatGPT, GPT-3 Playground, WriteSonic, Rytr og YouWrite. Det lykkedes dem at opdage alle typer indhold genereret af ChatGPT og GPT-3 Playground.

Selvom de havde blandede resultater for dedikerede skriveværktøjer, interessant nok, formåede de alle ikke at opdage YouWrite, jeg gætter på, at det er fordi YouWrite laver menneskelignende fejl med det formål at undgå opdagelse.

Jeg vil anbefale dig at bruge disse værktøjer sammen med at kontrollere indholdet manuelt. Først skal du analysere indholdet med et af disse værktøjer og derefter manuelt kontrollere for eventuelle spor for at bekræfte mistanken yderligere.

  Sådan nulstiller du adgangskoden i Minecraft

Nedenfor lister jeg dem, der gav de bedste resultater og er de nemmeste at bruge:

Bemærk: Til demonstration vil jeg bruge genereret tekst fra WriteSonic om “Benefits of Mangoes”.

#1. Indhold i skala

Jeg fandt, at AI-indholdsdetektoren fra Content At Scale var den mest nøjagtige til de fleste af de test, jeg kørte. Den lader dig scanne op til 2500 tegn pr. scanning og laver en procentvis forudsigelse, der viser ægte eller falsk indholdstæthed.

Indhold, der er over 60 % falsk, er sikkert at antage, er skrevet af AI-indhold, i det mindste det meste. I nedenstående skærmbillede kan du se, at 96% indhold er falsk, hvilket jeg fuldt ud genererede med AI.

#2. GPTZero

Hvis du vil se præcist hvilket indhold der er genereret af AI, så er GPTZero en god mulighed. GPTZero scorer ikke indhold. I stedet fremhæver det det nøjagtige indhold, der sandsynligvis er genereret af AI.

Selvom det viser forvirring og burstiness-score for at få en idé om tilfældighed i teksten, endnu vigtigere, understøtter det 5000 tegn pr. scanning og kan også uploade filer. Scanning af stort indhold hjælper i høj grad med at forbedre nøjagtigheden.

#3. GPT-2 udgangsdetektor

Skaberne af ChatGPT tilbyder også en bot til at opdage deres eget arbejde. Da GPT-2 og GPT-3 kun er forskellige i de samlede data, der bruges til træning, fungerer denne GPT-2-detektor også fint til GPT-3-baserede AI’er.

Der er ingen grænse for, hvor meget indhold den kan scanne, så den er perfekt til at detektere meget langt AI-genereret indhold. Jeg fandt også dens nøjagtighed fin, især for ChatGPT-genereret indhold. Det er dog lidt tabt i forudsigelser, så overvej kun dets resultater, når det viser over 50 % af indholdet som falsk.

#4. Writer AI-indholdsdetektor

Writer AI Content Detector-resultater er tvivlsomme, når indhold fra AI-skriveværktøjer detekteres, men det fungerer godt til ChatGPT-genereret indhold. Du kan scanne 1500 tegn pr. scanning og endda tilføje URL’en til indholdet, hvis det allerede er udgivet.

For min test-AI-genererede tekst sagde det, at 94% af indholdet er menneskeskabt, hvilket er ret dårligt sammenlignet med andre værktøjer. Ikke desto mindre er det stadig værd at bruge til at opdage ChatGPT-indhold, især hvis det allerede er udgivet.

#5. Udkast og mål

Et simpelt, men kraftfuldt AI-skriveregistreringsværktøj. Efter min erfaring tilbød Draft & Goal lignende resultater som Content At Scale, men det har ikke en grænse for ordantal, så du kan scanne lange opskrivninger. Dens scanningstid stiger dog baseret på, hvor meget indhold du scanner.

For min eksempeltekst står der, at 94% af teksten er AI-genereret.

Mine tanker 💭

Jeg synes personligt, at AI-hjælp faktisk er en fantastisk måde at fjerne writer’s block, få alle oplysningerne ét sted og finde inspiration. Det bør dog aldrig erstatte menneskelig skrift, da AI er begrænset til den viden, der allerede er kendt.

Du kan også udforske nogle af de bedste plagiatkontrolværktøjer for at forhindre kopiering.