Plagiaat voorkomen met detectie-software

- Jeroen Langendam

Het overschrijven van huiswerk is van alle tijden en gebeurt op alle niveaus, van eerste klas tot universiteit. Dankzij AI wordt het steeds makkelijker om overeenkomsten in ingeleverde teksten te herkennen.

Als leerkracht kom je regelmatig zinnen tegen die je bekend voorkomen. Natuurlijk is het bij sommige opdrachten en vragen onvermijdelijk dat leerlingen of studenten antwoorden geven die erg op elkaar lijken. Vroeger had de leerkracht weinig manieren om te herkennen dat een leerling valsgespeeld had, anders dan zijn eigen scherpzinnigheid. Een veelgehoorde anekdote in docentenkamers is het verhaal (in verschillende variaties) van de klas waarin een grote groep leerlingen een exact identiek antwoord op een proefwerkvraag gaven, inclusief dezelfde (onlogische) spelfout.

Niet altijd vals spel

Wanneer teksten met elkaar overeen komen, betekent dat niet per sé dat een leerling plagiaat heeft gepleegd. Vooral bij de lagere niveau’s van Bloom ligt het voor de hand dat het antwoord erg lijkt op hetgeen in het boek staat. Daar is weinig op tegen, tenzij het ingeleverde werk wel heel erg veel overeenkomsten vertoont met dat van een andere leerling. Ernstiger wordt het wanneer eindopdrachten (of zelfs scripties) hele stukken tekst bevatten die overeenkomen met teksten die door anderen zijn geleverd.

Een voorbeeld uit mijn eigen ervaring als docent betrof een student die een stagerapport inleverde van 50 pagina’s, waarvan 10 pagina’s met theorie gekopieerd bleken van een aantal websites.

Waarom is plagiaat een probleem?

Een van de belangrijkste redenen dat plagiaat verboden is, is het belang van academische integriteit. Niet alleen is het oneerlijk om andermans werk als eigen werk te presenteren, het ondermijnt ook het eigen leerrendement. Door de verplichting origineel werk in te leveren worden leerlingen gedwongen om zelfstandig en kritisch na te denken en hun schrijfvaardigheid aan te scherpen.

Plagiaat steeds beter te herkennen

Wanneer een tekst wordt ingeleverd die afkomstig is van anderen, zonder dat een goede bronvermelding is gegeven, kan sprake zijn van plagiaat. Het plagiëren van teksten is verboden en levert bij de meeste onderwijsinstellingen automatisch de laagst mogelijke score op.

Dankzij verschillende softwarepakketten wordt het steeds makkelijker om plagiaat op te sporen. Niet alleen voor de docent, maar ook voor de leerling of student die deze software kan gebruiken om te controleren of niet (onbewust) sprake is van een te grote overeenkomst tussen het eigen werk en eerder ingeleverde of gepubliceerde teksten.

Een voorbeeld van slimme software om te controleren op overeenkomsten is plagiarismcheck.org. Inmiddels zijn er door PlagiarismCheck.org ruim 3,8 miljoen teksten gecontroleerd op plagiaat. Aangezien de site vermeldt bijna 80.000 gebruikers te hebben lijkt het erop dat vooral docenten deze service hebben ontdekt en dit massaal gebruiken om controles op plagiaat uit te voeren.

Hoe werkt de controle op plagiaat bij Plagiarismcheck.org

Plagiarismcheck.org is verkrijgbaar voor het secundair onderwijs en voor het hoger onderwijs. Dankzij de scheiding tussen de niveaus wordt alleen gecontroleerd op documenten die van hetzelfde niveau zijn. Hierdoor is de plagiaatcontrole sneller dan wanneer al het huiswerk dat ooit is ingeleverd, op alle niveau’s, gecheckt moet worden.

Plagiarismcheck.org werkt met een fijnmazig net, waar maar weinig (tot niets) doorheen kan glippen. Bij de controle op plagiaat wordt namelijk niet alleen gekeken naar exacte matches, maar ook op gelijkende teksten. Dus wanneer een student een bestaande tekst heeft aangepast door alleen de woordvolgorde aan te passen wordt dit ook opgepikt. Ook het vervangen van woorden door substituten komt aan het licht. Zelfs de veelgebruikte truc om de lijdende vorm te vervangen door een actievere schrijfstijl (of andersom) wordt door Plagiarismcheck.org herkend.

Door de artificiële intelligentie van deze check is de plagiaatcontrole van Plagiarismcheck een van de meest grondige die er maar gedaan kunnen worden. Op de Nederlandse site Scriptieoverzicht.nl worden verschillende trucs besproken die dankzij intelligente anti-plagiaatsoftware niet langer meer werken.

De meest creatieve methodes zijn het vervangen van alle spaties door een witte (dus onzichtbare) letter of het vervangen van de normale e door de cyrillische e. De derde methode die ze noemen werd toegepast door de student uit het eerder genoemde praktijkvoorbeeld: hij plaatste gewoon zijn hele tekst tussen aanhalingstekens.

Scriptieoverzicht.nl concludeert dat het zinvoller is om je tijd te besteden aan het schrijven van een eigen tekst, dan aan het zoeken van manieren om de plagiaatchecker te slim af te zijn.

Andere software

Plagiarismcheck.org is niet de enige partij die helpt plagiaat te detecteren. Veelgebruikte alternatieven zijn Ephorus en Turnitin. Deze twee aanbieders hebben recent besloten hun krachten te bundelen, waardoor hun software efficiënter en gebruiksvriendelijke wordt.

Alle plagiaat-detectie tools werken op een min of meer gelijke wijze, waarbij vooral de omvang van de database van belang is. Hoe meer teksten in de database zijn opgeslagen, hoe groter de kans dat plagiaat wordt herkent.

Plagiaat ontdekken zonder moeite

Het moeilijkste aan software om plagiaat te herkennen is misschien nog wel het inleveren. Vaak is daarvoor een speciale link en code nodig, die eerst moet worden aangemaakt.

De controle zelf verloopt geheel automatisch, waarna de docent een duidelijke rapportage ontvangt met daarin de geconstateerde overeenkomsten. De uitkomsten moeten wel worden geïnterpreteerd, maar voor de meeste leraren is het werken met plagiaatcheckers redelijk intuïtief.

Het eerste waar de meeste leerkrachten naar kijken is het percentage van de tekst dat matcht met andere teksten. Wanneer dit minder is dan 10% wordt meestal uitgegaan van toeval, bij hogere waardes is het noodzakelijk om te onderzoeken waar de overeenkomsten te vinden zijn.

Vooral in de lagere jaren blijkt dan dat de matches veroorzaakt worden doordat de leerlingen alle vragen in de ingeleverde opdracht kopiëren.

Soms blijkt echter dat de leerling inderdaad andermans werk heeft gekopieerd. Deze vallen, dankzij de software, door de mand.