Interleaving: de moeilijkste der wenselijke moeilijkheden?

Feedback geven of bedenkingen formuleren? Lees misschien eerst deze disclaimer of Over deze blog.

Steun Te Gek!? een organisatie die psychische aandoeningen minder onzichtbaar helpt maken #WarmsteWeek


Ikzelf tijdens een Randomized Controlled Trial over interleaving. Alles voor onderzoek.

Vooraf

In mijn blog over zelfeffectiviteit en retrieval practice had ik het reeds over wenselijke moeilijkheden (desirable difficulties); een groep leerstrategieën die het presteren van het moment bemoeilijken, om het leren op langere termijn te bevorderen. Het concept hebben we te danken aan Robert Bjork (1994) en wordt helder toegelicht door hemzelf en zijn partner Elisabeth in een stuk met de veelzeggende titel 'Making Things Hard on Yourself, But in a Good Way'.
De aanleiding voor deze blogpost is een artikel van Klimovich en Richter (2025) over het gebruik van gevarieerd oefenen - een mogelijk wenselijke moeilijkheid - bij leerlingen van het derde leerjaar (groep 5). Interleaving of gevarieerd oefenen, bestaat erin dat je verschillende oefeningen of oefentypes gaat afwisselen in plaats van deze geblokt in te oefenen. Denk bijvoorbeeld aan de vier hoofdbewerkingen van rekenen. In plaats van tien sommen te maken, en vervolgens tien vermenigvuldigingen, ga je deze afwisselend aanbieden aan je lerenden (na een initiële leerfase). De idee is dat door de bewerkingen gevarieerd aan te bieden, lerenden steeds moeten nadenken welke oplossingsstrategie ze moeten gebruiken, waardoor ze harder gaan nadenken. Daarnaast gaan ze beter inzicht krijgen in de verschillen én gelijkenissen tussen de  bewerkingsvormen. Als je de bewerkingen geblokt aanbiedt, gaan ze deze als het ware op automatische piloot afwerken. Het is niet geheel verrassend dat lerenden gevarieerd oefenen als lastiger gaan ervaren (de prestatie van het moment wordt bemoeilijkt), en daardoor de strategie als minder effectief - dan in werkelijkheid - gaan beschouwen, zoals onderstaande grafiek toont.



Grafiek uit een onderzoek van Kornell en Bjork (2008). Er is een erg groot verschil zichtbaar tussen hoe studenten verwachten dat ze gaan presteren na gevarieerd te hebben geoefend (links), en hoe ze daadwerkelijk op een eindtoets presteerden. Lees meer over dit onderzoek in Wijze Lessen (p. 155)

Maar wanneer zijn lerenden klaar om gevarieerd te oefenen? En in welke mate moet ik als docent de oefenvormen door elkaar mixen? Zeker als dit niet gepaard gaat met de nodige uitleg over 'hoe de leerstrategie aanvoelt' op korte en lange termijn, kan de toepassing ervan eerder een onwenselijke moeilijkheid worden voor lerenden.

Onderstaand duiken we even dieper in de materie, met hopelijk een aantal praktische tips tot gevolg. Dit doen we door eerst het artikel van Klimovich en Richter te bespreken. Vervolgens staan we stil bij een mogelijke opbouw van gevarieerd oefenen, en ten slotte belichten we (schaars) onderzoek waaruit zou moeten blijken dat AI docenten/lerenden kan ondersteunen in het toepassen van interleaving.

Nog even dit: Interleaving kan positief zijn voor het leren in geval van onderwerpen die enige raakvlakken met elkaar hebben, zoals de bewerkingen in het eerdere voorbeeld, of het bestuderen van schilderijen van verschillende schilders (zie Kornell & Bjork, 2008). Variëren tussen bijvoorbeeld Nederlands en - met enige zin voor overdrijving - lichamelijke opvoeding is weinig zinvol. Er is immers weinig te contrasteren of te vergelijken tussen dt-regels en een koprol. Of je moest willen uitleggen waarom hij nooit 'roldt'.

Het artikel

In het onderzoek van Klimovich en Richter kregen 108 Duitstalige lerenden (8-9j oud) spellingslessen. Bijvoorbeeld wel of niet een hoofdletter, dubbele of enkele medeklinker, i of ie ... Vervolgens oefenden ze deze regels geblokt of gevarieerd. In het onderzoek ging men ook na of er naast een interleaving-effect voor geoefende woorden, ook een effect was voor niet geoefende woorden (wel over dezelfde spelingsregels): met andere woorden of er sprake was van nabije transfer (near-transfer) van het geleerde.

Op langere termijn wordt het effect van interleaving zichtbaar.


Om het effect te meten werd zowel een onmiddellijke test afgenomen, als een test na 8 weken
  • ook op de onmiddellijke test was er sprake van een interleaving-effect, maar alleen voor de geoefende woorden, niet voor nabije transfer;
  • op de test na 8 weken was er zowel voor de geoefende woorden als voor niet-geoefende woorden sprake van een positief effect van gevarieerd oefenen.
Andere vaststellingen met betrekking tot gevarieerd oefenen bleven in de lijn der verwachtingen: kinderen presteerden slechter tijdens gevarieerd oefenen, ze vonden het lastiger, en dachten dat ze de regels minder goed onder de knie kregen door interleaving toe te passen.
Een nadere analyse van deze gemiddelde uitkomst leerde eveneens dat het alleen de kinderen met meer voorkennis waren (werd gemeten voor het eigenlijke experiment) die op lange termijn baat hadden bij gevarieerd oefenen (zowel voor geoefende als nieuwe woorden). Kinderen die die voorkennis niet hadden, werden wellicht cognitief overbelast door de toepassing van gevarieerd oefenen; ze hadden als het ware geen cognitieve ruimte beschikbaar om te gaan vergelijken en contrasteren, omdat ze zich niet konden beroepen op minimale aanwezigheid van bestaande cognitieve schema's aangaande de spellingregels.
Misschien kan een opbouw in interleaving een oplossing zijn?

Hybride interleaving

Een studie van Pan en collega's (2019) is een mooi voorbeeld van wat er bedoeld wordt met opbouwen van gevarieerd oefenen. Zij lieten lerenden (18+) Spaanse werkwoorden vervoegen en kwamen erachter dat willekeurige interleaving-schema's (a-c-c-a-b-b-c-a-b) niet zorgden voor een interleaving-effect. Geblokt oefenen werkte even goed. Als ze echter eerst systematisch gingen variëren in oefeningen (a-b-c-a-b-c-a-b-c) was er wél sprake van een positief effect van gevarieerd oefenen.
Let wel, het ging effectief over de combinatie van eerst systematische, en vervolgens willekeurige variatie. Alleen één van beide had geen positief effect.

Begin er maar aan als  docent, om zoiets te realiseren. Niet evident. Misschien kan AI toch eens iets goed doen?

AI to the rescue?

Een gevoel van 'Winter is coming' bekruipt me soms als ik de berichten lees over hoe LLM's bijvoorbeeld zich weigeren af te sluiten ondanks dat commando, en in de plaats daarvan stilaan onze hersenen gaan afsluiten. Maar misschien kan AI een hulpmiddel zijn in begeleide toepassing van interleaving? Tijdens het schrijven van ons boek 'Wijze lessen. Digitale didactiek' heb ik mijn schouder uit de kom gezocht naar geschikte voorbeelden van EdTech ter ondersteuning van gevarieerd oefenen. Experimenteel onderzoek waarbij rechtstreeks de effecten van interleaving-begeleiding door een docent enerzijds en (een docent én) AI anderzijds worden vergeleken blijven erg schaars (of onbestaande?). Het onderzoek dat ik erover vind, houdt niet alle variabelen in de verschillende condities gelijk, maar wijst wel richting 'waarschijnlijke mogelijkheden'.


Ceci n'est pas une seductive detail

De idee is dan ook niet geheel onlogisch: als docent is het haast onmogelijk om constante, directe en op maat gevarieerde oefeningen aan te bieden. Of, wanneer lerenden nog worstelen met interleaving, meteen verlengde instructie aan te bieden. Alleen al het monitoren van de voortgang is onbegonnen werk, laat staan telkens de juiste interleaving-modus aan te bieden (zie onder andere Baillifard et al., 2024; Zhu et al., 2025). Al blijken de voordelen van dergelijke 'adaptieve' interleaving niet onomstotelijk, zoals in een recent onderzoek van Nemeth en collega's (2025). 'Gewone interleaving' deed het daar even goed als 'interleaving op maat', vergeleken met geblokt oefenen (al geven de onderzoekers aan dat de te leren categorieën misschien te weinig complex waren, waardoor 'gewone' interleaving al volstond; uitgevoerd bij volwassenen).

Geen keihard experiment, maar wel wijzend op mogelijkheden is een realistisch (echte cursusperiode) onderzoek van Baillifard en collega's. Zij ontwierpen een AI-tutor die studenten begeleidde tijdens het studeren, waarbij meerdere leerstrategieën waaronder interleaving werden toegepast (naast onder andere jezelf testen als leren en spreiden van leermomenten). De studenten die ervoor kozen om de tutor te gebruiken tijdens een echte cursus, scoorden significant beter dan de medestudenten. In een andere cursus waarin géén AI-tutor gebruikt werden, scoorde deze groep niét significant beter dan de andere studenten (dus het lag niet alleen aan de motivatie van de groep studenten die de tutor gingen gebruiken; al spelen er in zo'n ecologisch valide opzet mogelijk nog andere factoren een rol).

Het enige echte experiment dat ik vond (waarin menselijke begeleiding met AI-begeleiding vergeleken werd), is dat van Yang en collega's (2025). Zij deden onderzoek naar de mogelijkheden van AI om spontane spreekvaardigheid Engels bij Chinese studenten te bevorderen. De afwisseling bestond hier echter niet uit variëren tussen verschillende spelling- of grammaticaregels, maar wel in variëren tussen oefenvormen: spreken en schrijven (interleaving of speaking and writing activities, met 2 AI-toepassingen waaronder ChatGPT). Deze afwisseling in oefenvorm kan ook beschouwd worden als interleaving.
In een controlegroep werd deze vorm van interleaving op dezelfde wijze en volgorde georganiseerd, maar geleid door een docent. De studenten in de experimentele groep, legden op een eindtoets significant betere spreekoefeningen af, dan de studenten in de controlegroep. Volgens de onderzoekers wellicht omdat de feedback meer op maat en direct plaatsvond. Daarnaast ervaarden de studenten minder stress in het 'spreken' met ChatGPT, en was hun gevoel van zelfeffectiviteit groter.

Misschien is mijn zoektocht naar bewijs in deze of gene richting ook niet helemaal aan de orde, en is de conclusie: het variëren in oefeningen/oefenvormen blijkt effectief, als docent kan je je hierin laten ondersteunen door technologie, al is het maar om een grote variatie aan oefeningen aan te maken.

Ik deed zelf net een kleine test met 'Gemini begeleid leren', en maakte een prompt waarin ik uitlegde wat ik wilde leren (dt-regel), dat ik klaar was om te oefenen, wat interleaving is, en dat Gemini moest inschatten of ik klaar was om over te gaan van geblokt, naar systematische en ten slotte naar willekeurige interleaving. En dat deed ie eigenlijk perfect, onderstaand een screenshot waarin Gemini aangeeft dat ik klaar ben voor willekeurige interleaving. Ik maakdte nauwelijks nog fouten.



Noot: door bovenstaand proces helemaal en blijvend uit te besteden aan AI, leren lerenden natuurlijk niet zelf gevarieerd oefenen toe te passen, wat wel eens het uiteindelijke en wenselijke doel kan zijn. Bedankt Jeltsen Peeters voor deze aanvulling, je kan de volledige aanvulling hier lezen.

Conclusie

Gevarieerd oefenen of interleaving kan, als wenselijke moeilijkheid, leiden tot betere leerprestaties en mogelijk zelfs nabije transfer op lange termijn, ook al wordt de leerstrategie als lastiger ervaren door lerenden. Voor een effectieve implementatie lijkt het aangewezen:
  • interleaving pas te introduceren nadat basiskennis wel degelijk aanwezig is;
  • een gefaseerde opbouw te hanteren (van geblokt naar systematische en vervolgens willekeurige variatie) om ervoor zorgen dat lerenden niet cognitief overbelast raken en ze leren de juiste oplossingsstrategieën te contrasteren door deze in eerste instantie nog enigszins te groeperen;
  • lerenden uit te leggen dat de ervaren moeilijkheid op korte termijn juist essentieel is voor succes op de lange termijn.
Keihard AI-bewijs, specifiek voor interleaving, is niet meteen voorhanden. Toch lijkt EdTech, en in het bijzonder adaptieve AI-tools, docenten te kunnen ondersteunen bij het realiseren van zo optimaal mogelijke interleaving, en geleidelijke overgang naar willekeurige variatie of desnoods verlengde instructie.

Bronnen

Baillifard, A., Gabella, M., Lavenex, P. B., & Martarelli, C. S. (2025). Effective learning with a personal AI tutor: A case study. Education and Information Technologies, 30(1), 297-312.

Bjork, R. A., & Bjork, E. L. (2011). Making things hard on yourself, but in a good way: Creating desirable difficulties to enhance learning. Psychology and the Real World: Essays Illustrating Fundamental Contributions to Society, 2(59-68), 56-64.

Klimovich, M., & Richter, T. (2025). Spelling acquisition in children through interleaved practice: The role of instructional guidance. Cognitive Research: Principles and Implications, 10(1), 68. https://doi.org/10.1186/s41235-025-00680-z

Nemeth, L., Osterberg, J., & Lipowsky, F. (2025). Tailoring interleaved practice: Does adaptive sequencing boost the interleaving effect? Learning and Individual Differences, 124, 102804. https://doi.org/10.1016/j.lindif.2025.102804

Pan, S. C., T. Lovelett, J., Phun, V., & Rickard, T. C. (2019). The synergistic benefits of systematic and random interleaving for second language grammar learning. Journal of Applied Research in Memory and Cognition, 8(4), 450-462. https://doi.org/10.1016/j.jarmac.2019.07.004

Yang, G., Wang, Y., Zhang, Y., Yang, M., Zeng, Q., & Song, Z. (2025). An empirical study of AI-supported interleaved training strategy to improve EFL students’ English impromptu speaking performance, learning engagement, technology acceptance and epistemic network structure. The Asia-Pacific Education Researcher, 34(4), 1519-1540. https://doi.org/10.1007/s40299-024-00962-y



Reacties