Het testeffect: houdt het stand na meerdere oefenrondes?

Feedback geven of bedenkingen formuleren? Lees misschien eerst deze disclaimer of Over deze blog.

Steun Te Gek!? een organisatie die psychische aandoeningen minder onzichtbaar helpt maken #WarmsteWeek

Vooraf

Het retrieval practice- of testeffect houdt in dat - zeker op langere termijn - informatie actief ophalen uit je geheugen na een eerste leerfase onthouden en begrip ten goede komt, vergeleken met opnieuw bestuderen. Ik schreef onlangs nog posts over de samenhang motivatie-retrieval, en een vergelijking tussen retrieval en andere elaborerende strategieën. Vandaag is de vergelijking 'klassieker': actief ophalen uit het geheugen van woordparen in de moedertaal-Swahili, versus opnieuw bestuderen. Wat is nieuw in de studie van Huang en collega's (2025)? Ze bekeken wat het effect van aantal studierondes (drie of vier) op het testeffect was.

🎤Beluister als Notebook LM gegenereerde podcast (duurt wel 15min).

De studie

In een eerste leerfase bestudeerden 108 Chinese studenten (21j gemiddeld) 60 woordparen. Vervolgens werden ze onderverdeeld in twee condities: opnieuw bestuderen van de woordparen op een scherm, of retrieval practice toepassen door gebruik van een digitale flashcard-app.*

Door Notebook LM gegenereerde infographic van het artikel van Huang et al. (2025). Op het eerste zicht lijkt me alles correct weergegeven, waarbij opvalt dat het testeffect toeneemt na ronde 4.

Vervolgens werd (na 30 minuten) een eindtoets afgenomen onder de vorm van cued-recall: dit betekent dat het Swahili-woord getoond werd (= de cue) en de deelnemers moesten het antwoord ingeven/opschrijven. De voornaamste bevindingen.

zowel voor de woorden die 3x geoefend werden, als de woorden die 4x geoefend werden, was er sprake van een testeffect;
het testeffect was groter na 4 oefenrondes (8 versus 14 procentpunten);
het maakte niet uit of de eindtoets op papier (opschrijven van antwoord) of op computer (ingeven van antwoord) gemaakt werd. Waarom is dit van belang? Zo kan het effect beter verklaard worden door retrieval practice, en niet doordat de toetsvorm, bijvoorbeeld digitaal, beter 'geleek' op de oefenfase, bijvoorbeeld digitale flashcards.

De onderzoekers beschrijven een cumulatief of dynamisch effect van retrieval practice; alsof de (geheugen)spier na herhaalde (cognitieve) inspanning niet gradueel maar enigszins exponentieel toeneemt. Vraag is natuurlijk, waar ligt de bovengrens? Zeker als je bedenkt dat een mogelijke verklaring voor het testeffect de retrieval effort hypothesis is; het is de inspanning die eigen is aan retrieval practice, die zorgt voor een positief effect - op langere termijn - vergeleken met het eerder 'passievere' herlezen. Je zou verwachten dat deze cognitieve inspanning na 4, 5 ... rondes vermindert, en dus ook het testeffect. De onderzoekers verklaren deze enigszins onverwachte vaststelling door het feit dat er correctieve feedback gegeven werd, die dan weer compenseerde door de verminderde cognitieve inspanning.

In ieder geval lijkt het erop dat in de context van een realistisch en praktisch haalbare toename in oefenrondes, het testeffect standhoudt, of zelfs toeneemt. Wellicht gaat dit zeker zo zijn als er ook nog sprake zou zijn van een zekere spreiding van deze oefenmomenten (ook de retrieval effort zal dan weer toenemen). Zeker iets om in het achterhoofd te houden in de ondersteuning/info die we onze lerenden willen geven op het vlak van leren zelf.

Een eigen bedenking

Opvallend is dat het testeffect zo uitgesproken is, terwijl de eindtoets al plaatsvond na 30 minuten. In testeffect-termen is dit eerder kort na de leerfases. Denk aan het toonaangevend onderzoek van Roediger* en Karpicke (2006), waarbij na 5 minuten herlezen nog in het voordeel was, maar na een week duidelijk sprake was van een testeffect. Hoewel de onderzoekers niet wijzen op deze relatief korte periode, is dit toch opvallend. Zonder in een Clark vs Kozma discussie te willen verzanden, misschien is hier sprake van ... 🥁tromgeroffel🥁 ... een 'It's the technology, stupid'-effect op korte (en lange?) termijn? En dan zijn - zoals aangegeven in onderstaand * - nog niet alle opties van een dergelijke app benut.

* De app gebruikte geen adaptieve spacing (bijv. woorden die incorrect waren sneller opnieuw aanbieden, correcte pas later). Wel kregen de deelnemers in de flashcard-app na hun retrieval-poging correctieve feedback. In de herstudie-conditie zagen de deelnemers te allen tijde natuurlijk het Swahili- en correcte Chinese woord te zien. De onderzoekers pasten nog andere technieken toe, zoals counterbalancing, om bepaalde beïnvloedende factoren uit te sluiten.

** Als je hem opzoekt leer je dat zijn volledige naam Henry L. Roediger III is. Indrukwekkend. Ik wil dat ook. Dus wie me nog aanspreekt, vanaf nu is het Wouter M. Jules I

Bronnen

Huang, S., Cao, H.-W., Wang, J., & Liu, S. (2025). The moderating role of learning rounds: Effects on retrieval practice and context dependence in digital flashcard foreign language vocabulary learning. Behavioral Sciences, 15(11), 1540. https://doi.org/10.3390/bs15111540

Effectief en efficiënt in de klaspraktijk: de literatuur als hulpmiddel

Zoeken in deze blog