Turnitin bouwt tool om AI-geschreven teksten te ontmaskeren

- David Van Waeyenberghe - 5 min

Het bedrijf, vooral gekend om zijn antiplagiaatsoftware, werkt aan een toepassing om teksten gemaakt door taalrobots zoals ChatGPT te ontmaskeren.

Grote taalmodellen hebben sinds de release van GPT-3 in 2020 aan populariteit gewonnen. Al nam het succes pas begin december een ware vlucht nadat OpenAI de taalrobot ChatGPT op de wereld los liet. De polarisatie sindsdien kan haast niet groter zijn. Enerzijds slaan sommige scholen en universiteiten de toepassing in de ban. Anderzijds omarmen onderwijsinstellingen en leerkrachten de toepassing. Turnitin werkt naar eigen zeggen aan een oplossing om AI-gegenereerde teksten te ontdekken.

Academisch beleid

De discussies zijn volop aan de gang over hoe taalmodellen en chatrobots kunnen worden ingezet. Of hoe ze helemaal verboden moeten worden. De onderwijswereld weet, net als de zakelijke, niet goed welk beleid moet worden gevoerd. En dat is helemaal niet vreemd want er is geen wettelijk kader. En er zijn ook geen afdoende manieren om machinaal geschreven teksten te onderscheiden van zuiver schrijfwerk van een vlijtige student.

Turnitin gaat er prat op om aan de oplossing te werken, zo schrijft The Register. Het Amerikaanse bedrijf ontwikkelt en verkoopt software die berekent hoe vergelijkbaar een bepaalde tekst of essay is ten opzichte van de inhoud van een databank vol papers, webpagina’s en boeken. De software speurt met andere woorden naar elke vorm van plagiaat en wordt gebruikt door 15.000 instellingen in 140 landen.

lees ook

AI-taalmodellen: bedreiging of verrijking voor het onderwijs?

Geheime ontwikkeling

Turnitin heeft meer dan 20 jaar ervaring en beschikt dus over een enorme databank aan schrijfmateriaal. Dat maakt van het bedrijf een ideale speler om een academische AI-tekstdetector te ontwikkelen. Sinds de release van GPT-3 werkt Turnitin in alle stilte aan het product. De haast om met een tool op de proppen te komen, is de jongste maanden uiteraard groter geworden. Voor de krachtigere opvolger ChatGPT vraagt om gepaste maatregelen.

“Snelheid is belangrijk. De detectie in het begin zal vrij simpel zijn. Maar de toepassing wordt slimmer en dus zullen releases volgen om nog betere workflows voor docenten te maken”, zegt Annie Chechitelli, Chief Product Officer van Turnitin. “Het plan is om het prototype gratis te maken voor onze bestaande klanten. Tegelijk zullen we gegevens en gebruikersfeedback verzamelen. We willen de onderwijswereld helpen. In een latere fase zullen we bekijken hoe we het product zullen commercialiseren.”

Patronen herkennen

Teksten geschreven voor ChatGPT en andere taalmodellen kunnen best overtuigend zijn. Zo behaalde de chatrobot een onderscheiding aan een Amerikaanse universiteit. Toch zijn er veel tekenen die het werk van een algoritme verklappen. Meestal zijn de schrijfsels flauw en niet origineel. De taalmodellen herhalen bestaande ideeën en standpunten, maar hebben geen duidelijke stem. Mensen kunnen soms AI-gegenereerde tekst herkennen, maar dat kan een machine ook en voor veel accurater en sneller.

“Er zijn duidelijke patronen in AI-geschreven teksten. Voor ons mensen voelen die soms menselijk aan, toch schrijven machines fundamenteel anders. Het is het kiezen van het meest waarschijnlijke woord op de meest waarschijnlijke plaats. En dat is een heel andere manier om taal te construeren”, aldus Eric Wang, VP van Turnitin AI. “De detector is gebaseerd op dezelfde architectuur als GTP-3. We bestrijden in veel opzichten vuur met vuur. We hebben er een detectorcomponent in plaats van genererende component aan toegevoegd. Dit zal een wezenlijk verschil maken in hoe we werken en creëren.”