AI-detektorer kan sällan avslöja AI-text. Och ett öppet förhållningssätt till AI i klassrummet med nya examinationsformer kan vara en bättre väg framåt. Då får skolan snarare ta tag i den stora frågan: vilket lärande ska den examinera.
Lästid: 8-10 minuter
När jag pratar med personal inom vuxenutbildningen om AI kommer ofta ett ämne upp: fusk. En del säger ”Fusk, fusk, fusk! AI har inte i skolan att göra. Vi måste avslöja elevernas AI-texter”.
Men, det här är fel väg att gå, menar jag. Oavsett vilken teknik du använder så kan du ändå inte med 100 procents säkerhet avslöja AI-text (syntetisk text). Viktigare är att skolan fokuserar på att
- hitta sätt att mäta lärandet
- rusta eleverna för framtiden
- lära dem analysera och skriva
- lära dem använda tekniken.
Skolan bör ställa sig två grundläggande frågor innan den köper en AI-detektor:
- Vad är det egentligen de vill förhindra?
- Vilket lärande vill de examinera och hur når de dit?
I den här texten ska jag förklara varför skolan inte bör haka upp sig på att detektera syntetisk AI-text.
Från att avslöja AI-text till förändrad examination
Den skola som funderar på att köpa in verktyg för att känna igen syntetisk text (AI-text) ska kanske tänka om. Först måste de fundera över vad det är som de vill stävja eller förhindra.
Verktyg som ska avslöja syntetisk text (jag kallar dem här ”detektorer”), avslöjar viss text men inte all. Detektorn gör en klassificering av text. Svaret från verktyget är i stil med: ”texten är med 40 procent säkerhet skriven av AI/människa”.
Men vad betyder det egentligen att skapa text med AI?
AI kan användas för att
- skriva hela texten
- skriva om delar av texten
- skriva om text så att den påminner om skribentens tidigare texter
- få stödord för texten som ska skrivas
- få förslag på delämnen att ta upp i texten
- få förslag på ändringar i texten
- skriva ett stycke som är svårt
- få förslag på hur texten kan bli bättre
- korrigera grammatik
- korrigera stavning.
Vad tycker skolan är okej? När får eleven använda AI?
Om allt i listan ovan är fel så bör både hemuppgifter och vanliga verktyg som Microsoft Word förbjudas. Någon annan hemma har alltid kunnat stötta eleven genom att ”skriva hela texten” eller ”skriva om delar av texten”. Och program som Word korrigerar stavning och viss grammatik. Det finns dessutom många andra digitala verktyg som kan ge eleven liknande stöd.
Gränsdragningen mellan vad som traditionellt varit okej och vad som är AI-stöd är inte självklart.
Frågan är också: är det viktigare att stävja fusk eller se till att examinera rätt saker? Målet med att eleven skriver texten är ju att se vilket lärande hen har fått. Finns det sätt att använda AI i skolan för att få hjälp med text och samtidigt även kontrollera elevens lärande? Vad ska examineras och hur? Kanske är det examinationsformen (skrivuppgifter hemma) som du ska ifrågasätta? Eller ska du ändra sättet som du följer elevens jobb med skrivuppgiften?
Felmarginaler skapar nya problem
Detektorerna har väldigt stora felmarginaler och gör därför lärarens uppdrag svårare. Lika ofta som detektorernas resultat pekar ut oskyldiga elever som fuskare så kan AI-användare slippa igenom. Som jag visat ovan är också gränsen mellan traditionellt stöd och AI otydlig.
Att förlita sig blint på AI-detektorer blir därför vanskligt. Det är lätt att misstänka att en textdel är AI-skriven. Men är hela texten det och vilket övrigt stöd har eleven haft? Är det okej om en del text är syntetisk om eleven också får förklara vad det handlar om? Här blir återigen valen av VAD du vill förhindra och examinera viktiga.
Läs i ”International Journal for Educational Integrity” en studie som visar att både människor och AI är dåliga på att avslöja AI-text.
Från detektor- till lärandefokus
Prata med elever och fråga dem hur de lurar detektorerna! (Det ger väldigt intressanta insikter i människans psyke) Då får du veta att en del använder samma verktyg som skolan. Varför? För att ta reda på hur deras text klassificeras. Och för att ”överlista systemet”.
Om elevens text klassas som syntetisk av detektorn så vet hen att texten inte duger. Därför hittar eleverna metoder för att göra så att texten passerar testet. När texten slutligen klassas som ”mänsklig” av detektorn, så lämnar de in den.
En studien visar att tillförlitligheten i ett verktyg ändrades från 74 procent till 42, bara med små förändringar i texten (länk till MIT Technology Review).
AI kan härma människor ganska bra. Pröva själv så att du ser resultatet.
Övning: Skriv i valfri AI-tjänst: ”Kan du skriva en text om Gustav Vasas kröning som ser ut att vara skriven av en 14-årig elev”. Pröva sedan att köra texten genom er detektor. Om du blir avslöjad, pröva att ändra några ord för att se vad som händer. Gick din text igenom testet och/eller minskade sannolikheten för att den är syntetisk, enligt detektorn?
Räkna också med att eleven har bett AI:n analysera ord och uttryck som de själva har skrivit i tidigare texter. Med dem i minnet kan AI:n förändra en ny text så att den påminner om elevens tidigare texter. Det kan därför vara svårt att jämföra texter för att avslöja bruket av AI.
Min poäng är att elever är påhittiga. Och ibland förstår de inte uppgiften eller syftet med lärandemålet. Då hittar de ofta sätt att glida förbi med minsta (AI-)ansträngning.
Det här visar varför detektorer aldrig kommer att lösa det verkliga problemet. Jaga inte elever som använder fel verktyg. Sätt istället AI-gränser och tydliggör lärandemål och uppgift.
Detektorer för gårdagens AI
Ett verktyg som just nu klassificerar texter korrekt behöver inte göra det i morgon. Tänk på AI-verktyget som skapar text som en tjuv och tänk på detektorn som polisen som jagar. Allteftersom polisen kommer på tjuvens metoder så utvecklar tjuven nya. På samma sätt är det med AI-verktygen. De blir bättre och bättre. Detektorn som ska avslöja den syntetiska texten ligger alltid steget efter.
Er detektor fungerar därför bra mot en viss AI men inte mot de som kommer i framtiden. Skolan måste hålla detektorn uppdaterad. Men den kan ändå bara detektera syntetiska texter från gårdagens AI. Förändringar sker hela tiden.
En teknisk AI-lösning, så som en detektor, kommer aldrig att fungera långsiktigt. Istället för att jaga utvecklingen, bör skolan istället fundera på en långsiktig lösning.
Misstänksamhet blir en del av skolvardagen
Detektorer skapar en miljö där misstänksamhet, snarare än lärande, är normen. Du vet inte om eleven har använt AI eller till vilken grad hen har gjort det. Och vad av det som AI gör, finns också i andra verktyg (till exempel Word)? Vad ska du förbjuda och varför? Och vad kan (i värsta fall) felaktiga fuskanklagelser leda till?
Istället för att använda detektorer har skolan några möjliga val, från det AI-skeptiska till det teknikentusiastiska:
- Vi förbjuder AI helt och tar bort alla hemuppgifter.
- Vi förbjuder AI och låter elever göra skrivuppgifter stegvis.
- Vi tillåter AI, sätter ramar för elevernas arbete och förändrar examinationssätt.
- Vi tillåter AI helt och har kvar hemuppgifter som vanligt.
Under 2025 kommer jag att blogga för EPALE om vuxnas lärande. Där hittar du snart ett blogginlägg om tekniker för att examinera uppsatser/hemuppgifter i AI-tider.
Jag går inte här in på hur hem- eller skrivuppgifter ska ändras. Jag berättar inte heller exakt vad det betyder att skriva syntetisk text. Men många elever idag använder AI för att skriva. Därför kan det vara bra att fundera på att ändra hur du examinerar hemuppgifter. Fundera också på vad du vill att de ska använda AI för, om något.
Jag hoppas att jag med den här texten har lyckats visa att detektorer inte är lösningen. Skolan behöver fokusera på vad eleverna ska lära sig och hur de bäst kan mäta lärandet, oavsett teknisk utveckling.
Kontakta mig gärna om du vill att jag ska blogga om vuxnas lärande, teknik inom lärandet, kommunikationsteknik eller mjukvara. På förstasidan hittar du exempel på andra tjänster som jag vanligtvis utför för organisationer och företag.
Hur använde jag AI för att skapa artikeln
Jag bad AI:n (Claude) att utifrån min målgrupp och utifrån ämnet föreslå vilka delämnen jag borde ta upp i artikeln.
Jag använde tre delämnen av sju. De andra fyra handlade om annat än kärnämnet för den här artikeln. Jag kom dessutom sedan på delämnen som Claude missat.
Jag bad Claude skriva en ingress till mig. Förslaget blev inte bra, men gav mig en hint om problem i resonemanget. Jag gjorde vissa ändringar i texten och skrev sedan min ingress för hand.
Jag ber också alltid om hjälp med rubriker. 🙂 De är min svaghet. Utifrån förslag som jag får har jag sedan valt den som jag tycker passar bäst.
Slutligen bad jag Claude att ge kritik på artikeln utifrån mitt centrala tema. Utifrån kritiken ändrade jag vissa delar av texten.